机器翻译提前7年达到人类专业翻译水平,微软再现里程碑突破

作者: 新智元

来源: 新智元

发布日期: 2018-03-17

微软研发的机器翻译系统在通用新闻的汉译英上达到了人类专业水平,实现了自然语言处理的又一里程碑突破。这是首个在新闻报道的翻译质量和准确率上媲美人类专业译者的翻译系统。微软的这次突破,将机器翻译超越人类业余译者的时间,提前了整整7年。

微软本周宣布其研发的机器翻译系统首次在通用新闻的汉译英上达到了人类专业水平,实现了自然语言处理的又一里程碑突破。由微软亚洲研究院与雷德蒙研究院的研究人员组成的团队在3月14日宣布,其研发的机器翻译系统在通用新闻报道的中译英测试集上,达到了人类专业译者水平。这是首个在新闻报道的翻译质量和准确率上媲美人类专业译者的翻译系统。

微软技术院士,负责微软语音、自然语言和机器翻译工作的黄学东博士表示,这是自然语言处理领域的一项里程碑式的成就。黄学东骄傲地说,2015年微软率先在图像识别ImageNet数据集达到人类水平,2016年在Switchboard对话语义识别达到人类水平,2017在斯坦福问答数据集SQuAD上达到人类水平,今天又在机器翻译上达到人类水平,一路走来,微软的进步激动人心。

黄学东表示,微软语音和NLP组在成立时,便立下了要在两年后将机器翻译做到人类专业水平的目标。如今,这一目标提前实现。NLP里程碑式突破:首个媲美人类专业译者的机器翻译系统。这次微软的翻译系统是在数据集WMT-17的新闻数据集newstest2017上取得了上述成果。WMT是机器翻译领域的国际顶级评测比赛之一。WMT数据集也是机器翻译领域一个公认的主流数据集。

虽然研究人员只进行了汉译英的测试,但黄学东表示,英译汉结果也应该并无不同。为了确保翻译结果准确且达到人类的翻译水平,微软研究团队还邀请了双语语言顾问,将微软的翻译结果与两个独立的人工翻译结果进行了比较评估(全部盲测)。机器翻译提前7年超越业余译者,人工智能再下一城。微软的这次突破,将机器翻译超越人类业余译者的时间,提前了整整7年,远远超出了众多ML研究人员的预想。

虽然此次突破意义非凡,但微软研究人员也提醒大家,这并不代表人类已经完全解决了机器翻译的问题,只能说明我们离终极目标又更近了一步。突破当前神经机器翻译范式局限,性能再上一个数量级。为了能够取得中-英翻译的里程碑式突破,来自微软亚洲研究院和雷德蒙研究院的三个研究组,进行了跨越中美时区、跨越研究领域的联合创新。四大技术加持,神经机器翻译将成今后机器翻译绝对主流。

其中,微软亚洲研究院机器学习组将他们的最新研究成果——对偶学习(Dual Learning)和推敲网络(Deliberation Networks)应用在了此次取得突破的机器翻译系统中。深度学习NLP掌握着实现强人工智能的钥匙。

黄学东认为,神经机器翻译,或者说深度学习,最激动人心的地方在于,它能够学会自然语言内部的embedded feature,把语言的结构,语义结构和语义的表示学习出来,再反馈到系统,从而实现自然语言理解的突破。

UUID: 54df6bfc-8d1f-427f-8d5f-d94add9f2be8

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/环球科学公众号-pdf2txt/2018/2018-03-17_机器翻译提前7年达到人类专业翻译水平,微软再现里程碑突破.txt

是否为广告: 否

处理费用: 0.0052 元