谷歌AI助手Google Duplex:拯救电话恐惧症的新希望

作者: EON

来源: 果壳

发布日期: 2018-05-09

谷歌在Google I/O大会上展示了其AI助手Google Duplex,该助手能够通过电话进行自然流畅的预约服务,解决了电话恐惧症患者的问题。Duplex结合了自然语言处理、深度学习和文字语音转换技术,能够理解对话中的细微差别,甚至在对方有口音或语句不完整的情况下也能完成对话。尽管Duplex目前仅限于预约场景,但其自然对话能力标志着人工智能在自然语言处理和全自动机器对话方面的重大进步。

我们有大部分时间都浪费在日常通话中,打电话叫外卖、收快递、预约酒店……对于大忙人或者社交恐惧者来说,打电话可能是非常痛苦的一件事。当手机上的Siri只能帮你拨通电话时,你不禁要问,人工智能就这点本事?在昨天的Google I/O大会上,CEO桑德尔·皮查伊(Sundar Pichai)终于带来拯救社交恐惧症的福音。

他在现场演示中,展示了智能助手如何通过电话预约理发店和餐厅,能够流畅和自然交流的AI顿时技惊四座,成为此次大会的焦点。Google称其为Google Duplex,结合了自然语言处理、深度学习和文字语音转换的黑科技。

在演示中,AI的声音已经可以媲美人类,在电话的一端你绝不会听出这是蹩脚的机器语音。

而这也是Google正在开发的领域,此次他们就为语音助手带来6种不同的自然语音,其中还包括歌手John Legend的声音。不过,更令人惊艳的是毫无破绽的人机对话。正如皮查伊在现场所说的那样,“智能助手能够真正理解对话中的细微差别”。例如在另一个订餐的演示中,尽管对方的英语有口音且不完整,AI仍然理解并完成了对话。

在人机交互实现人机对话这一目标时,虽然Duplex的应用仍局限于预约场景,不能够进行一般的对话,但其自然程度已然是显著突破。

在现实生活中,人类之间的交谈往往是复杂的,对于机器来说,理解自然场景中的对话非常困难。人们交谈时,经常会自我纠正和省略语句,而且有时候语速很快,甚至有着不同的口音。当进行电话交谈时,背景噪音和语音质量更是让语音识别的难度上升。此外,人类交谈中,不同的语境也有不同的意思。

这些问题在Duplex上的解决,得益于循环神经网络(RNN)和谷歌机器学习平台TensorFlow Extended。为了让对话更自然,谷歌让AI在对话停顿期间发出“嗯哼”、“呃”之类的语气词。为了响应人们在说出“你好!”时对即时回复的期待,他们还设计了低延迟系统,以快速响应相关场景中的对话。另外,他们在测试中发现,当句子更复杂时,更多的延迟反而会让对话更自然。

解决语音识别的问题后,谷歌通过“实时导师训练”来训练Duplex系统。在现实中,导师使用这一方法指导学生,他们会提供必要的指导,确保学生执行任务时达到了导师水准。当系统在新的领域进行电话训练时,“导师”会在必要时影响系统的行为,直到系统达到期望的水平,能够自动打电话,成为真正的智能助手。目前Duplex的应用场景还不广泛,只能处理有限的问答。

谷歌尚未公布Duplex详细的应用场景,而且它使用的声音也不是此次公布的6个虚拟语音之一。

Duplex目前还处于测试阶段,虽然有着广泛的应用前景,但也会带来不少问题。首先,智能助手在人机对话中的角色是什么?在谷歌的第一段演示中,AI打电话时称自己在为“客人”预约。谷歌还没有公开推出Duplex,但是人们已经开始担心,AI在电话中没有明确表达自己的身份会带来诸多困惑。

对此,谷歌并未公开回应,不过他们告诉CNET,AI会告诉对方自己是数字个人助理。其次,Duplex或许会成为电影《她》里的情感倾诉对象,或许会代替你和他人撕逼,也可能被人用来打推销电话。谷歌已经推出了基于机器学习的虚拟语音,生成了John Legend的专属声音。那么当Duplex和虚拟语音相结合的技术变得更加普遍时,是否会出现身份冒用的问题呢?

例如,有人可以用AI伪造自己的伴侣,但他早已将其杀害,却一直在和冒用身份的AI进行对话,制造两人仍然生活在一起的假象。谷歌必定会限制Duplex的应用场景,但这一技术难免会有被黑客利用的风险。

正如《连线》杂志评论的那样,“对于谷歌来说,Duplex标志着自然语言、全自动机器对话的重大进步。对于我们来说,它介于极其方便和诡异的欺骗之间。

”这一届的谷歌开发者大会还公布了Gmail智能邮件回复、能够复制照片中文字的Google Lens、AI为你整理新闻的Google News、Android P和自动驾驶技术等。围绕着“人工智能”这一主题,谷歌想要全面渗透你的生活,让技术隐藏于生活背后。从Duplex来看,它渗透你生活的方式,首先会是客服。这也是谷歌在商业领域的愿景,他们“希望给商家和客户带来更好的用户体验”。

但是对于普通人来说,拯救社恐难道不是更重要的吗?

UUID: ac8dbf19-1579-4618-b559-6e78a34a3f50

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/果壳公众号-pdf2txt/2018/2018-05-09_你的电话恐惧症还没治好?谷歌AI:不用治了,我替你接电话.txt

是否为广告: 否

处理费用: 0.0043 元