人类自开始认识自己以来,大概就一直在梦想着能创造能与自己别无二致的存在(从偃师献给周穆王的歌舞艺伎,到弗兰肯斯坦的怪物,再到越来越栩栩如生的机器人和越来越智能的软件程序),或者至少让这样的存在无法与其他人类被区分开。人类有能力办到这一点吗?还是说我们已经实现了这一目标,抑或是这仅仅只是一个梦想而已?
1950年,图灵发表了一篇划时代的论文,文中预言了创造出具有真正智能的机器的可能性。由于注意到「智能」这一概念难以确切定义,他提出了著名的图灵测试:如果一台机器能够与人类展开对话(通过某种设备),而不被人类辨别出其机器身份,那么这台机器便具有智能。这一简化使得图灵能够令人信服地说明「思考的机器」是可能的。论文中还回答了对这一假说的各种常见质疑。图灵测试是人工智能哲学方面第一个严肃的提案。
但近些年来图灵测试的有效性已经受到了很多的质疑,问题就在于图灵测试太容易作弊了——通过欺骗或假装无知便可以轻松通过测试。正如图灵本人所预测的那样,获胜的主要诀窍是避而不答。比如说,如果一个裁判问一个机器,你有感觉吗?机器必须撒谎才能通过测试。但是这种奇怪的扭曲不是特例,而是常态。通过图灵测试的方法其实就只能是欺骗。
研究者也在原始图灵测试思想的基础上提出了很多改进的版本,或其它评价人工智能的方法,包括增加对更多种类的内容的理解或引入创造力测试等等。
2015年io9网站的一篇文章就盘点了其中8种有可能代替图灵测试的方法,其中包括测试推理能力的Winograd Schema Challenge、评价创造力的Lovelace Test 2.0、评价结构能力的Construction Challenge、判断视觉能力的Visual Turing Test……
前段时间,心理学家和认知科学家Gary Marcus在《科学美国人》上也发文谈到了一些新的人工智能智能测试方式,比如其中一种是人类的标准化测试:人工智能将接受人类学生在小学、中学阶段面临的考试,不给任何宽限。这一方法是将语义理解和解决各类问题的任务联系在一起的绝妙方式。这很像是图灵测试,但前者更加简单直接。
只需让人工智能接受严格的标准化测试(如纽约市四年级科学考试的多选题),为机器配备足够的输入能力(如自然语言理解和机器视觉模块),然后开始考试吧。
尽管寻求替代的呼声越来越大,但图灵测试在很多人心中它仍然是智能技术前进的一大圣杯,而到目前为止,已经有一些研究者声称自己开发的软件已经通过了图灵测试。
最早的可能通过了图灵测试的程序出现在1966年,那是著名计算机科学家Joseph Weizenbaum所开发的一个程序ELIZA,可以检测用户的输入并寻找其中的关键词。当找到了特定的关键词后,该程序会根据一个规则给出了一个回应句子;而如果没有找到任何可用的关键词,那么ELIZA会根据一种通用的方式用之前的一条评论来进行回应。
据了解,Weizenbaum还在ELIZA上复制了一种罗氏疗法(Rogerian therapy)的行为,让ELIZA可以自由地假装对这个世界一无所知。通过这些技术和带有欺骗性的技巧,ELIZA成功让一些人相信与他们的交谈的是一个真正的人,甚至有评论说「很难相信ELIZA不是一个人类」。所以ELIZA大概是第一个通过了图灵测试的程序。
进入21世纪,更先进的技术和更强大的设备也带来了更强大的欺骗方式。2014年,举办图灵测试2014的英国雷丁大学宣称俄罗斯人Vladimir Veselov开发的人工智能软件Eugene Goostman通过了图灵测试,这被很多人看作是一个里程碑事件。据介绍,Eugene Goostman软件模仿的是一位13岁的男孩。
在当年共有5台超级计算机参赛的图灵测试竞赛上,Eugene Goostman设法让受试者相信被测试者33%的答复为人类所为。而图灵测试的通过标准为30%,这意味着这台超级计算机通过了图灵测试。
而在2016年,有研究者更是宣称发现了让任何软件都可以通过图灵测试的窍门:保持沉默。
考文垂大学的研究者Kevin Warwick和Huma Shah通过论文《在图灵的模仿游戏中采用第五修正案(Taking the fifth amendment in Turing』s imitation game)》介绍了他们的发现:如果一台机器在测试中采用「第五修正案」,即在整个测试过程保持沉默,可以潜在地说它通过了该测试,并且可以因此将其视为一个有思想的存在。
但这些也许真的通过了图灵测试的软件真的就是智能了的吗?我们可能无法认同。目前已经通过图灵测试的软件大都利用了四种欺骗性的技巧:1.用短句短词进行模棱两可的回答。2.根据裁判的社会习俗生活环境,进行相关处理。3.对问题进行反问式确认,比如裁判问到"你是从俄罗斯来的吗?",那么反问策略则是「你为什么不确定我是从俄罗斯来的?」。采用这种方式对抗裁判,往往是杀手锏。
这种反问式策略最初是心理咨询上的治疗手段,目前已被大量使用在图灵测试的游戏上。4.当人类回答的过于详细反而会被误认为是机器,参赛者可以抓住这一点引导裁判进行详细式提问,然后再进行模棱两可式的回答,而这种情况下,真正人类回答的反而更机械更像机器了。
其实除了上面提到了有些微妙的图灵测试,人工智能技术在欺骗人类方面实际上正在取得实实在在的进步。随着近些年深度学习的兴起和各种新型算法的出现,计算机在创造「以假乱真」的东西上已经取得了耀眼的成绩,甚至很多时候就连最顶级人类造假者也会自叹弗如,毕竟机器不仅做得好,还做得快。
下面我们将介绍一些人工智能在生成无法与人类作品相区分的新作品上所取得的新进展,其中我们也会给出一些样例,看你是否能够分辨「真」与「假」。相关答案集中在文末公布,看你能答对多少〜
1.谁在说话?如果你对机器人说话声音的认识还停留在一字一顿的阶段,那你可能还没尝试过谷歌助手(Google Assistant),它流畅的语音输出听起来就像是一个训练有素的《新闻联播》英语播音员。
但谷歌并不是唯一一个在语音合成上取得突破的公司或机构。2016年9月,DeepMind表示他们最新的深度生成模型WaveNet将机器语音合成的表现与人类之间水平的差距至少缩减了50%。2017年,Yoshua Bengio领导的一个研究团队又提出了一种端到端语音合成技术Char2Wav,可以学习直接根据文本生成音频。
此外,百度提出的Deep Voice模型更是一个高速度的完全由深度神经网络构建的高质量语音转文本系统。也许很快我们就无法区分电话那头的是人还是机器。
2.听,是谁在唱歌?人工智能也在学习生成音乐,2016年5月,谷歌研究科学家Douglas Eck向参加Moogfest艺术节的资深音乐迷们讲述了其团队通过训练计算机来帮助音乐人编写音乐的新成果——在一首歌中生成和弦、创造过渡和精心设计反复的旋律。
他相信,总有一天,机器可以学会完全靠自己去写一首歌。谷歌的这个项目名叫Magenta,在NIPS 2016上还曾赢得了Best Demo奖。下面这段音乐可能就是Magenta创作的,你能分辨出来吗?
3.风格迁移,伪造大师作品自从照片处理应用Prisma一夜走红之后,图像风格迁移技术就从实验室一下子飞入了寻常百姓家,让即使「没有艺术细胞」的人也能简单动动手指据创造出美轮美奂的艺术作品。
2016年10月,谷歌的一篇论文介绍了一种可以让单个深度卷积风格迁移网络同时学习多种风格的简单方法。这种方法不仅可以应用于静态图像,还可应用于视频。11月,Facebook将这方面的研究向前又推进了一步,并在移动设备上实现了实时的风格迁移。
实际上,风格迁移(style transfer)并不是什么新概念,但利用神经网络来做这件事还是最近由研究人员在发表于2015年8月的一篇题为《A Neural Algorithm for Artistic Style》的论文中引入的。而除了对照片的风格迁移,也有研究者将这项技术应用到了更多的领域,比如字体设计。
4.机器诗人用机器写诗并不是什么新思想,著名科幻小说《三体》系列的作者刘慈欣就曾经编写过一个可以写「现代诗」的程序「电子诗人」,不过这个仅有数百KB的小程序应该并没有用到神经网络,生成的作品可能格式比较工整,但却往往缺乏中心思想。现在,有自然语言处理和自然语言理解技术帮助机器分析和理解语言,人工智能在写诗的道路上也越走越远。
创作诗歌对于人来说都很难,对于机器来说就更是难上加难了。据介绍,虽然机器与人相比,在一些方面有着先天的优势,例如,机器有无穷无尽的词汇库可供选择,机器可以很容易的解决对仗、平仄和押韵等问题。但是,真正的诗歌是有灵魂的,诗歌本质上是在传达诗人的思想。机器自动创作在主题控制方面很弱,很难让整首诗都围绕一个统一的主题来生成。但机器有可能通过诗歌来说服人类,让人感觉到它是有灵魂的吗?
在「欺骗人类」的道路上,人工智能正越走越远。从语言合成到图像生成,再到模拟人类的对话,人工智能正在许多领域逼近甚至超越人类的表现水平。现在市面上也已经出现了一些在一定程度上可以替代人类的伴侣式设备或聊天软件。
而伴随着虚拟现实和技术、增强现实和混合现实等技术的日渐发展,未来的人工智能可能不仅能在图像和声音上伪装成人类,甚至还能在更大的范围内为我们创造一个足以以假乱真的世界——如果我们假设我们的世界是真实的话。
最后,答案揭晓:音频实际上是Buck O'Nine乐队的《My Town》的片段,不是机器的作品。图1是由艺术家Hall Groat II创作的作品;图2是用Prisma的Caribbean风格生成的图片。诗1「一夜秋凉雨湿衣」是计算机生成的诗歌;诗2「荻花风里桂花浮」为宋代诗人葛绍体所作,出自《东山诗文选》。