神经机器翻译的演变:人工智能机器学习翻译语言的艺术

秒送号(miaosong.cn)自媒体平台11月3日文章,由人工智能驱动的新一批机器翻译工具已经每天翻译成千上万条消息。每天都在使用Google,Microsoft和Amazon专有的ML翻译解决方案。Facebook采取开源方法。什么是翻译软件,文档和自然语言内容的最佳方法?人工智能驱动的神经网络的自动化在哪里驱动?

神经机器翻译的演变
专业语言服务机构Tomedes的数字营销负责人William Mamane 一直对机器翻译持怀疑态度。“我们公司成立已有12年,拥有50,​​000多名商业客户。我们拥护“人工翻译”的价值,并且仍然会这样做。

但是,我们见证了机器翻译质量的稳步提高。目前,机器翻译还不能与优秀的母语语言学家相提并论,但是人工智能和机器翻译在翻译服务价值链中仍然占有一席之地。”

为了追溯这种演变,让我们回到应用于机器翻译的AI的起源。在基本级别上,MT使用算法将一种语言中的单词替换为另一种语言中的单词。事实证明不足以成功翻译。

对于源语言和目标语言,都必须了解整个短语。我们可以将MT理解为对源语言进行解码并在目标语言中记录其含义。

算法
应用统计信息为给定短语选择最佳翻译。
解决这一挑战的方法有很多种,其中一些方法是应用统计信息为给定短语选择最佳翻译。其他人则应用结构化规则来选择最可能的含义。但是在诸如小说或其他类型文学的复杂语言形式中,即使最好的机器翻译引擎听起来也不自然。

对于特定用途,机器在结构化语言方面做得更好。这些包括天气报告,财务报告,政府协议,法律文件,体育成绩。在这些情况下,语言和习语受到限制。有公式化的语言结构和格式。

从算法到系统
这里机器翻译已经在日常使用中。即使考虑到这一点,也没有消除人类成为编辑和校对者的需要。他们需要识别专有名称,解决歧义并破译成语。但是,与翻译相比,监督,编辑或审计的作用要求较低,且耗时较少。

在网上,自动翻译始于1990年代,当时是施乐公司的SYSTRAN和AltaVista的Babelfish。两者都使用统计方法和规则来翻译短文本。两者的受欢迎程度都是惊人的。1996年,AltaVista报告说BabelFish每天收到50万个请求。

甚至早在2012年,Google处理的翻译每天就可以填满一百万本书。那是过去五年发生翻译革命之前的事情。关于MT的早期历史的更多信息在这里。

神经机器翻译
神经机器翻译(NMT)使用人工产生的神经网络。这种深度学习技术在翻译时会查看完整的句子,而不仅仅是单个单词。神经网络需要统计方法所需的一部分内存。他们工作得更快。

深度学习或人工智能在翻译中的应用最早出现在1990年代的语音识别中。关于在机器翻译中使用神经网络的第一篇科学论文发表于2014年。紧随其后的是该领域的许多进步。

2015年,NMT系统首次出现在机器翻译竞赛Open MT中。从那时起,比赛几乎只使用NMT工具进行。

最新的NMT方法使用所谓的双向递归神经网络或RNN。这些网络结合了一个编码器,该编码器为第二个RNN制定了源语句,称为解码器。解码器预测应以目标语言显示的单词。Google在推动Google翻译的NMT中使用了这种方法。

Microsoft在Microsoft Translator和Skype Translator中使用RNN。两者都旨在实现长期的梦想,即哈佛大学自然语言处理小组的同声翻译,最近发布了开源神经机器翻译系统OpenNMT。Facebook正在与开源NMT进行广泛的实验,从用户语言中学习。

谷歌翻译
谷歌
Google翻译是Google开发的一种免费的多语言机器翻译服务,用于翻译文本。它提供了网站界面,适用于Android和iOS的移动应用程序。其API可帮助开发人员构建浏览器扩展和软件应用程序。Google翻译支持100多种生命和死亡语言。截至2017年5月,它每天为超过5亿人提供服务。截至2018年,它每天的翻译量超过1000亿个单词。

尽管Google Translate不如人工翻译可靠,但它越来越近了。在2018年的一项研究中,谷歌要求母语为每种语言的母语人士将谷歌翻译的翻译评分分为0级和6级:平均得分为5.43。性能因语言而异。例如,经过测试,当英语为目标语言且来源为欧洲时,Google Translate的效果最佳。

微软翻译
Microsoft Translator是跨多种消费者,开发人员和企业产品的多语言MT云服务。Translator Text API有一个免费层,每月允许200万个字符。它已经支付了费用,允许每月翻译数十亿个字符。

通过Microsoft语音服务进行的语音翻译是根据源音频流的持续时间进行计量的。截至2019年8月,该服务支持65种语言系统和11种语音翻译系统,这些系统在各种应用程序中均支持其实时对话功能。

Microsoft采用了一种新的实时翻译方法。对话的发起者获得传递给参与者的代码。该代码使每个人都可以使用其首选语言参与对话。

脸书翻译
截至2017年,Facebook每天使用神经网络执行约45亿次自动翻译。它为其20亿多的用户换成了基于短语的机器翻译。Facebook选择了卷积神经网络(CNN),而不是递归神经网络(RNN)。它希望本地化/翻译的文本将更类似于自然语言。

尽管RNN线性且有条理地处理信息,但CNN却将信息视为一个层次结构。层次结构允许识别非线性数据关系。该技术已被证明在超越人类视觉的机器视觉中很有价值。对于翻译,它可以更好地把握上下文。

Facebook Translator的显着优势是其多跳关注功能。注意模仿人的翻译方式。通常,我们不会一次分解一个句子然后进行翻译。相反,我们一次又一次返回到它,以检查并重新检查其含义。CNN模仿此过程。它反复考虑句子,并选择首先要翻译的内容。

第一个“概览”可能以动词开头。一秒钟可能会看到一个名词。蛇麻草翻译有助于根据上下文找出文本关系。效率也更高。Facebook的CNN评级比Google使用的RNN快9倍。

Facebook还有一个巨大的优势。例如,它研究用户的实时语言。它的CNN训练能反映实际语言使用情况的真实句子。这是Google的一大优势,后者从欧盟的协议中吸取了很多经验。当您在Facebook上发帖时,您正在培训社交网络如何更准确地进行翻译。

机器翻译的底线
翻译人员应该找一份新的工作吗?随着神经机器翻译的快速变化,人们可能会这么认为。但是,现实是不同的。Facebook,Microsoft和Google的翻译在产生近似含义方面做得很好。

NMT可以协助翻译,而熟练的语言学家则可以完成和完善翻译输出。总之,未来的翻译人员将更多地使用人工智能而不是反对人工智能。

免责声明:该自媒体文章由实名作者自行发布(文字、图片、视频等版权内容由作者自行担责),且仅为作者个人观点,不代表 秒送号Miaosong.cn立场,未经作者书面授权,禁止转载。[投诉 · 举报作者与内容]

「作者 · 档案」
提供最新、最快、最热的各种热点资讯阅读分享,欢迎大家关注!

  
(0)

相关阅读

发表回复

登录后才能评论
发布