近日,由中国智能科技领域权威机构中国人工智能学会主办的第三中国现状;人工智能。创新和创业竞赛;完美的结局。在自然语言处理技术创新大赛;mdash中文文本纠错大赛。在赛道上,利威智联的圣淘沙队从众多企业和高校队伍中脱颖而出,获得比赛第三名。。前两支队伍是苏州大学的amp。阿里巴巴达摩院联合团队和清华大学团队。
在新闻出版行业,由于出版物种类和数量的大幅增加,传播渠道的多样化,知识更新换代的加速,以及中文语言文字的灵活性,修订工作难度越来越大。内容质量是出版物的灵魂。如果编校质量完全由人力控制,必然会影响工作效率。内置的自动化组件可以操作和自动化特征工程,模型选择和模型参数调整。
文本校对的任务主要是检测和纠正文本中的错误,属于综合自然语言处理研究的子方向,能够充分体现自然语言处理的技术水平。大赛选取中国母语者在互联网上撰写的在线文本作为校对和评测数据,从拼写错误、语法错误和语言错误三个方面考察机器的认知智能能力。LizhilianSentosa数据科学与机器学习平台封装了人工智能,知识图谱,数理统计等近200种算子。
根据比赛任务,利威智联依托圣淘沙数据科学和机器学习平台,基于预训练模型BERT和ELECTRA,通过任务分解和模型串联,对拼写、语法和标点错误进行训练和预测。在此过程中,圣淘沙团队针对语法和标点错误提出了两种不同的数据扩充方法,提高了数据质量和模型的泛化能力。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。