人工智能超越我们的那一天

来源: 科学世界

发布日期: 2015-07-29 16:03:47

本文探讨了人工智能的发展历程及其未来可能超越人类智能的预测,介绍了“沃森”系统、东机器人君项目以及深度学习的概念,分析了人工智能在理解自然语言和图像方面的挑战。

计算机究竟可以聪明到什么程度?美国著名的未来学者雷•库兹韦尔(Ray Kurzweil)认为:“30年后的2045年,人工智能有可能超越人类的智能。”这被称为“2045年问题”。事实上,2011年,电脑问答系统“沃森”在美国的智力竞赛中击败人类获胜,表明人工智能正在切切实实地变得更加“聪明”。今后人工智能将会取得怎样的进步?让我们来探究人工智能的最前沿。

2015年2月,日本软银株式会社向研发人员发售世界首台具有人类感情的机器人“佩珀”(Pepper)。佩珀具备最新的“感情识别功能”,可以通过人的表情和声音来判读情绪。另外,它还通过互联网与庞大的会话数据库相连,对很多方面的话题都可以做出应答,就像具有人类的智力。所谓人工智能是指让计算机具有与人类同样智力的技术。

人工智能现在有了令人吃惊的进步。

特别是IBM公司开发的应答系统“沃森”(Watson)在2011年美国举办的智力竞赛“危险边缘”(Jeopardy)中获得冠军的消息给全世界以巨大的冲击。在智力竞赛中回答问题,意味着“沃森”可以理解人类的语言(自然语言),并且可以根据不同的问题作出应答。现在,“沃森”的技术已经运用到了很多不同的领域。比如,在美国,为了准确制定患者的治疗方案,人们利用了储存在“沃森”系统里的庞大的医疗数据。

在癌症治疗方面,60万项以上癌症方面的医学研究成果、200万页的医学专业期刊原文,以及150万人的治疗病例等都被输入其中。在这庞大的知识宝库支持下,“沃森”以自己独特的自然语言处理技术对患者进行“问诊”,然后针对不同患者的各种复杂情况给出最合适的诊断方法。

2011年,日本国立信息学研究所(NII)开始做一个项目——“人造大脑项目:机器人能考上东京大学吗?”这个项目不访问互联网上的信息,由计算机直接挑战模拟考试以及东京大学的入学考试试题。计算机的昵称为“东机器人君”。该项目的目标是2016年之前在联考中取得高分,2021年之前考上东京大学。

为什么将人工智能的目标定在“考取东大”?

主持这个项目的日本国立信息学研究所新井纪子教授如是说:“沃森项目是单纯以理解自然语言为目标的。但是,开发真正的人工智能,不应只满足于自然语言的处理,还需要‘听懂人说的话’(语音识别)以及‘理解图像’(图像识别)等各种各样的技术。而我们知道,在解答大学入学考试题时,不仅需要具备对语言的理解能力,还需要有理解图像的能力,以及回答听力问题等方面的技巧。

所以,参加大学入学考试对人工智能的进步来说是一个很好的目标。”

东机器人君分别参加了2013年和2014年代代木课程班举办的联考模拟考试。2014年参加的模考中,英语、日语、数学两个科目、世界史、日本史、物理等7科目的合计得分,900分为满分(英语、日语200分为满分,其他100分为满分),东机器人君得了386分。顺便提一下,考生平均分为422分。

对此结果,新井教授说:“2013年有的课程偏差值是40,可以说比较低,但是这次很多科目的偏差值达到了50,各科上没有太大的差距,给人的印象是没有了擅长或不擅长科目的区别。”

那么计算机最棘手的科目是哪一个呢?新井教授说:“物理的试题一般是在用自然语言说明日常状况后,询问会发生怎样的变化。计算机对这类问题理解起来非常困难。”

对计算机来说感觉棘手的还不只是对于这种图的理解。问题中,“在支点的垂直上方轻轻松开摆锤”这样的句子,计算机也难以理解。人当然理解为“用手将摆锤拿到上方,然后轻轻地放开”。但是,问题中并没有关于“手”的文字。所以,只是从文字信息来解读的话,也可以解释为“从小棍上放开摆锤”。两种解释在语法上都是正确的,所以从理论上不能说哪一个是错误的。

在这种情况下,怎么做才能解决问题呢?这时出场的是“物理模拟”。所谓物理模拟,是以现在的状态为初始条件,根据物理法则计算1秒、5秒、10秒后的未来状态的方法。据说运用这种办法,在导出答案的同时,还可以弥补常识的缺乏。

理解“概念”的困难对计算机来说,“理解插图”究竟是什么意思呢?我们用具体的问题来说明人类与计算机各自是如何理解插图的,并进行探讨。上面的插图是英语听力试题的选择项。问题的内容是妈妈与儿子之间的对话。儿子问:“蛋糕上怎么摆放蓝莓好呢?”妈妈回答说:“在奶油与奶油之间各放一个蓝莓吧。”问题:这段对话中所说的摆法是哪一个图?人如果听懂了英语,一定明白③是正确答案。但是,让计算机选择这个答案是非常困难的。

最新人工智能可以自主获得事物的概念。计算机中的数据与现实世界中的意象究竟怎样结合才好呢?这个是计算机内的符号(symbol)与现实世界中的意象相结合(to ground)的问题,所以被称作“符号接地问题”(symbol grounding problem)。现在,人们认为这个问题有可能得到解决,正在积极思考研究解决的方法,于是开发了被称为“深度学习”(Deep Learning)的方法。

所谓深度学习,是将神经网络(neural network)技术加以发展的一个方法,也就是说,这是一种电脑模拟人脑的神经回路的技术。

为了弄清深度学习的方法,首先我们要看看人是如何理解现实世界的。比如,一个人看到了一只猫。这时人在脑海里提取出了猫的各种特征,诸如“尖耳朵”、“长尾巴”等,然后加以综合,判断出眼前的动物就是“猫”。人们认为,在大脑里,通过各类神经的相互连接,各式各样的猫的特征被组合起来,“猫的概念”由此浮现。

深度学习就是与此类似的一种尝试。也就是说,我们在电脑上制作出多条如同神经回路的电路(人工神经元)层。

第一层是“输入层”,最后一层是“输出层”,其间的几层称为“隐藏层”。深度学习的“学习”是按以下的方式进行的。首先,将图像输入计算机,输入层的神经元会将图片分解成颜色、形状等单纯的要素信息,交给第二层的神经元。第二层的神经元将这些信号进行转换,或者将信息削减之后交给第三层的神经元。这种活动持续进行、逐层传递,直到输出层。最后,将输出信息与输入信息进行比较。

如果这两个信息相似,神经元之间的连接会加强;如果这两个信息不同,隐藏层的转换规则会改变,以削弱神经元之间的连接。

2012年,谷歌公司运用这一深度学习方法,让计算机学习了1000万个图像之后,宣布“计算机已能够识别猫脸”。最后的输出层中的一个神经元识别出猫脸的本质。据说这个神经元在输入了包含猫脸的图像后反映特别强烈。这就意味着计算机获得了猫的概念。在1000万张图像中,包含着各种各样的图像,计算机不仅能识别猫,还能识别包括人脸在内的很多种事物。

将来的人工智能会取得怎样的进步呢?美国著名的未来学者雷•库兹韦尔作出了这样的预测:“2029年,具有自我意识的人工智能将被研发出来;2045年左右,人工智能将会超越人类的智能。”人工智能的智力比全人类的智力更强,这一现象被称为“技术奇点”(Technological Singularity)。30年后,在《2001太空漫游》中大显身手的人类伙伴HAL 9000那样的人工智能也会成为现实。

UUID: 27eb2037-ccb9-4803-817d-dc951c859fba

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/科学世界公众号-pdf2txt/2015-2016/科学世界_2015-07-29_人工智能超越我们的那一天.txt

是否为广告: 否

处理费用: 0.0148 元