您的位置:首页 > 财经 >

微软翻译现在总共支持103种语言覆盖了72%的世界人口

2021-10-12 17:49  阅读量:7709   来源:IT之家   

微软Translator今天宣布,它支持12种新语言和方言有了这种支持,微软翻译现在总共支持103种语言,覆盖了72%的世界人口有了这个版本,微软翻译服务可以将文本和文档翻译成全球56.6亿人使用的本地语言

IT之家了解到,微软翻译新增的语言有:巴什基尔语,德维族语,格鲁吉亚语,吉尔吉斯语,马其顿语,蒙古语,蒙古语,鞑靼语,藏语,土库曼语,维吾尔语和乌兹别克语这些新语言被8460万人使用

微软技术研究员,Azure人工智能首席技术官黄表示,一百种语言对我们来说是一个很好的里程碑,它可以实现我们的抱负,让每个人无论说什么语言都可以交流。

微软翻译的演变。

20多年前,微软研究院首次开发了机器翻译系统2003年,一个机器翻译系统将整个微软知识库从英语翻译成西班牙语,法语,德语和日语,并将翻译后的内容发布在其网站上,成为当时互联网上面向公众的最大的原创机器翻译应用

在统计机器翻译模型的基础上,微软进一步开发了这些系统,并通过Windows Live Translator,Translator API和Microsoft Office应用程序的内置功能提供给公众。

微软表示,多年来,我们为世界上许多最常用的语言增加了翻译系统伴随着人工智能技术的发展,微软采用了神经机器翻译技术,将所有机器翻译系统迁移到基于Transformer技术的神经模型中,大大提高了翻译的流畅性和准确性

尽管NMT技术显著提高了整体翻译质量,但Transformer架构的出现为创建机器翻译模型铺平了新的道路,使其能够使用比以前更少的材料进行训练使用多语言Transformer架构,现在可以使用其他语言的材料添加培训数据通常,在相同或相关的语言家族中,模型是为具有少量数据的语言制作的,这些语言通常被称为低资源语言

即使有这些技术,也需要有一组目标语言的数字文件,以及另一种包含语言的翻译—通常称为并行文件。

微软翻译公司翻译的语言数量折线图从2007年的7种增加到2021年的100多种该系统从2007年到2016年一直使用统计机器翻译2016年采用神经机器翻译技术将有助于提高翻译质量,2019年采用Transformer架构将使微软团队能够用更少的数据为低资源语言构建模型

在添加新语言时,微软表示,最大的挑战之一是获得足够的双语数据,用于训练和制作机器翻译模型这些数据由高质量的人工翻译内容组成,包括要添加的语言和服务已经支持的语言之一对于许多语言来说,这种双语数据很难获得,尤其是对于数字资源不足或濒临灭绝的语言

微软表示,与语言社区的合作伙伴合作是幸运的,他们可以获得人工翻译的文本,并帮助收集资源不足的语言的数据这些社区伙伴,通常是与各自社区合作的志愿者,不厌其烦地通过咨询社区成员来收集双语句子然后,他们评估生成的机器翻译模型的质量

Azure认知服务翻译公开了微软产品中的NMT模式,并通过文本翻译和文档翻译API向翻译客户公开这些API将纯文本和复杂文件从一种语言翻译成另一种语言Azure认知服务翻译器API可用于公有云和安全的微软Azure政务云此外,Docker容器中提供了文本翻译API,允许客户在企业内处理内容以满足特定的法规要求

Azure认知服务翻译还包括自定义翻译服务,该服务使用户能够使用自己的翻译记忆库来构建自定义机器翻译模型,以翻译其业务和相关行业中使用的特定于领域的术语这些定制的机器翻译模型可以通过文本和文档翻译应用编程接口使用

为了翻译音频或语音内容,Azure认知服务翻译与Azure认知服务语音紧密集成,通过Azure语音SDK支持语音翻译和多设备对话。

Azure认知服务翻译器及其支持的产品被客户广泛采用这项服务无缝集成到许多微软产品中,并准备好供每个人使用和创建他们选择的语言内容一些微软产品集成包括用于翻译文本和文件的Microsoft 365,用于翻译整个网页的Microsoft Edge浏览器,用于翻译信息的SwiftKey,用于翻译用户提交的内容的LinkedIn,用于移动中多语言对话的Translator应用程序等等

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

md