科大讯飞说“冒充AI”只是个误会,我们又找“真的同传”聊了聊

作者: 雪竹、樟脑玩、武权

来源: 果壳

发布日期: 2018-09-23

科大讯飞被指控用人工翻译冒充AI同传,引发争议。果壳与科大讯飞AI研究院联席院长李世鹏对话,探讨人机耦合的可能性。翻译界业内人士认为,AI翻译在处理一词多义、复杂句子结构和现场变化方面仍有很大挑战。尽管AI翻译技术在进步,但短期内无法取代人类同传译员。

哪个行业会被人工智能消灭?从目前的状况看,至少不会是同传行业。同传译员Bell Wang指责科大讯飞用人工翻译伪装成AI同传的事儿,大家想必都听说了。果壳针对本次事件的争议焦点——人机耦合,同科大讯飞 AI 研究院联席院长李世鹏进行了独家对话,并听取了北外高翻学院李长栓副院长以及译员张伟、陈老师(化名)等多位翻译界业内人士的声音。

这是一场误会?9月20日, Bell Wang来到上海国际会议中心,为2018创新与新兴产业发展国际会议(IEID)的高端装备技术与产业分会做现场同传。在会议现场,他发现科大讯飞在识别出同传译员说的译文后,再将译文投放到屏幕和直播中。翻译工作并不是完全由AI完成。而且,科大讯飞没有提前将详细情况告诉Bell和搭档,就冒名使用了他们的翻译成果,涉嫌侵犯两人的知识产权。

21日晚上八点,讯飞通过电话会议的形式召开新闻发布会,高级副总裁江涛及负责翻译业务的产品经理刘晨璇等参会。在发布会上,科大讯飞否认相关指责,并声称这是同译员的“误解”:Bell不知道他所在的分会场,人工智能使用的是人机耦合工作模式。

据介绍,IEID使用的科大讯飞智能会议系统,有两种工作模式:其一是全自动翻译,即识别演讲者发言,转换成文字并实时翻译,随后投射到大屏幕上;其二为人机耦合,顾名思义,机器识别语音后转录为文字并进行翻译,降低人类同传译员的工作难度。

科大讯飞 AI 研究院联席院长李世鹏:AI不可能不犯错误。要判断人机耦合是否对译员有帮助,得先了解人机耦合听起来如此高深莫测的词究竟是什么意思。

对此,在当晚八点的新闻发布会前,果壳和科大讯飞 AI 研究院联席院长、前微软亚洲研究院副院长李世鹏进行了独家对话。李世鹏说,他特别不同意的一点就是宣称机器把所有的事情都做了,机器不会犯错误。“所有的AI都是基于统计上的意义,是有概率的。翻译的正确率,语音识别的正确率都有一个概率在后面。AI不可能不犯错误。”这就凸显了人机耦合的重要性。

同传中的人机耦合,目前只是一厢情愿。做了十年同传的前中山大学口译老师、现自由译员陈老师曾有和机器“耦合”的经历。会议开始前几天,技术人员拿着好几个机器处理不了的术语来咨询她的意见。她和搭档一一给出了参考译文,并配上了详细的注释,当时还考虑到了字幕的特点,尽量采用了简短、达意的版本。陈老师说:“现场AI展示的这些高难度术语译文,全是我们帮着提前翻的。”

人工智能翻译取代人类?虽然圈外人动不动就惊呼“翻译这个行当要消失了”、“人工智能翻译要取代人类了”,但在翻译圈内,大家心态相当乐观,一致认为,译员的饭碗稳得很,绝不会被机器抢走。在业内人士看来,即使听懂了每一个单词,人工智能翻译仍有三大障碍无法跨越。

一是一词多义。北外高翻学院的李长栓给我们举了个例子。

Mission一词,基本意思是“交给一个人或一群人的一项重要任务,通常需要旅行到国外完成”(牛津英语词典)。在这个意思基础上,引申出“使命”“任务”“特派任务”“出差”“使团”“代表团”“特派团”“传教团”“访问团”等具体意思。译员必须根据上下文判断翻译为“使命”还是“使团”,是“传教团”还是“特派团”。这个判断并非一目了然。

如果交给机器翻译,机器通常会根据统计得出的概率,选择最常见的那个意思,而这往往会出错。

二是复杂的句子结构。甚至都不需要过分复杂的句子,只是酒店电水壶上贴的一句简单的功能性指示语,“请阁下把自来水用电水壶烧开后饮用”,机器翻译都不尽如人意。

三是变化多端的现场。有学者研究发现,英文演讲者的语速在120个单词/每分钟,同传是最精准。请注意,这里的最精准不是指精度达到100%,而是80%到95%。

就算在最适宜的速度,人类译员也会丢失信息。如果演讲者的语速达到每分钟180个单词,译员会大面积漏词漏句;如果速度达到每分钟200个单词,人类译员基本就跟不上了。而机器不一样。就算演讲者说得再快,机器都能抓住每一个单词,不会遗漏任何一个信息点。这本该是机器的优势,但目前来看,反而成了劣势。译员在现场不光要翻译出信息,还要让翻译出来的中文长度和英文原文的长度尽可能靠近。

一个英文的缩写专有名词,中文翻译过来可能有六七个字长。这时,译员会临时调整,压缩简化后面的信息。一般情况下,演讲者发言结束的二到三秒后,译员也要结束发言。如果拖了五秒才结束,“那就完了。这五秒钟就像永恒一样漫长。”译员张伟说。

而机器没有应变的能力,只会尽职地听出每个字、再进行翻译。这就导致机器翻译出来的信息量过大,让观众听得吃力。张伟说:“逐字逐词译出来是能译出来,能不能被理解被消化,是另外一回事。为了让观众听起来舒服,译员随时在做取舍。”

同传译员的随机应变甚至可以说到了“随意”的程度。如果演讲者精神饱满地跟与会者打招呼,译员也会调整语气,喊出早上好。译员能够模仿演讲者的语气,在他强调的时候强调,在他讲段子的时候幽默。这也是为什么同传需要坐在会场后方的一个“箱子”(同传箱)里观看会场情况的原因:他们需要感知会场的氛围。这都是冰冷的机器没办法做到的。

《集异璧》作者侯世达(Douglas Hofstadter)在之前同果壳对话时曾提到,翻译软件根本就不理解任何东西。“零。它不知道有这样一个世界,有这么多事情正在其中发生,不知道有过去和未来,不知道有大有小有上有下。它什么都不知道。它所知道的一切就只是字词。”

在博鳌2018之《让人工智能“落地”》的论坛上,科大讯飞董事长刘庆峰表示,科大讯飞的翻译机已经达到了大学六级水平,两年之内会达到英语专业八级水平。对此,从事同声传译八年的张伟给出的回复是:“同传是爷爷,专业八级是孙子。”

北外高翻学院的李长栓曾受邀参加腾讯举办的智能翻译研讨会。听完腾讯方面的介绍后,李长栓觉得“非常可笑”。他认为,在翻译领域,不会有机器取代人类的那一天。对于李长栓的评价,李世鹏给出的回复是:“我们一直认为现阶段的AI翻译只能是辅助工具,至少在人工智能新的框架到来之前是这样的。”

后记“讯飞”事件爆发后,从译员们的反应中不难看出,在AI翻译这个特殊领域中,技术与翻译专家们存在着不小的矛盾。

需要指出的是,果壳接触过的几位翻译业内人士,反对的都不是技术进步,而是虚假宣传。陈老师表示:“AI犯错误也没有什么,很正常。AI跟人一样,也会成长,会进步,谷歌翻译的进步就很让人惊喜,有效提升了我们译前准备的效率。凡是踏踏实实做技术的公司,我们都打心底里敬佩,并愿意与之合作。”张伟也说,他在任务急时间紧的情况下,会使用“翻译狗”来翻译主办方提供的资料,“确实给了我很大的帮助”。

不可否认的是,AI翻译的实际表现不够优秀。这跟“翻译”这项任务的特殊性有很大关系。MIT教授、未来生命研究所创始人马克斯 •泰格马克(Max Tegmark)在其著作《生命3.0》中,给了“智能”和“人工智能”如下的定义和分类:智能:完成复杂目标的能力。狭义智能:只能完成非常特定的目标,如下棋和打电子游戏。广义智能:人类的智能非常“广义”,“目标”也更加复杂。

从这个角度,“翻译”这项任务可谓相当的复杂:它绝不仅仅是简单的文本的对应,而是需要综合文化、语境、专业知识、情绪、心理、认知、个人语言特点等无数复杂因素,方能有效地完成“目标”。换句话说,AI想做同传,可能需要在更复杂的“通用人工智能”技术突破的情况下才能实现。

实际上,李世鹏也同果壳谈到了这个问题。他认为,如果人工智能翻译有突破,一定是在框架上有所突破:不是基于现有的大数据加深度学习的框架,而是从人的认知层面出发,找到不依靠数据的AI新框架。科大讯飞正在朝这个方向努力。“我们做技术的人,了解情况。我们因为乐观,因为有信心,才会在这条路上越走越远。”

无论此事最后以何种方式落幕,希望能翻译人士的技能与工作得到充分的尊重,更希望人工智能领域有突破性进展的那一天早点到来。

UUID: 15a2b178-51da-4f66-ba5f-c751d58fd9c4

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/果壳公众号-pdf2txt/2018/2018-09-23_科大讯飞说“冒充AI”只是个误会,我们又找“真的同传”聊了聊深度.txt

是否为广告: 否

处理费用: 0.0087 元