今天,计算机领域最高奖项“图灵奖”迎来了新一届得主——加拿大蒙特利尔大学教授约书亚·本希奥(Yoshua Bengio)、谷歌副总裁兼多伦多大学名誉教授杰弗里·欣顿(Geoffrey Hinton),以及纽约大学教授兼Facebook 首席 AI 科学家杨立昆(Yann LeCun)。
这三位被业内人士称为“当代人工智能教父”的科学家是深度神经网络(deep neural network)的开创者,这项技术已经成为计算科学的关键部分,为深度学习(deep learning)算法的发展和应用奠定了基础——这正是现在计算机视觉(Computer Vison)、语音识别(Speech Recognizing)、自然语言处理(Natural Language Processing)和机器人研发等领域展现出惊人活力、掀起科技创业热潮的重要原因。
图灵奖(ACM A.M. Turing Award)由美国计算机协会于 1966 年设立,专门奖励对计算机事业作出重要贡献的个人,有着“计算领域的诺贝尔奖”(Nobel Prize of Computing)的美誉。其名称源自计算机科学先驱、英国科学家、曼彻斯特大学教授艾伦·图灵(A.M. Turing),奖金高达 100 万美元,由谷歌公司提供赞助。
图灵奖大部分情况下只颁给一位获奖人,两位或三位科学家同时获奖的情况较为少见。2000 年图灵奖得主、中国科学院院士姚期智是目前唯一一位获得该奖项的中国科学家。
人工智能在 20 世纪 50 年代成为了一门科学。那时研究者们乐观地认为,在自己有生之年就可以看到拥有人类智力水准的机器出现。然而,当时的算法和计算能力都无法承担重任,美好的希望就此破灭。
一些怀疑论者甚至认为制造人工智能的企图在根本上就是一种自大。直至 21 世纪初,约书亚·本希奥、杰弗里·欣顿和杨立昆开创的深度神经网络技术使人们重燃希望。如今他们的想法却带来了重大的技术革新,他们的方法也无疑已经成为当今该领域研究中的主流范式。
深度学习指的是用计算机模拟神经元网络,以此逐渐“学会”各种任务的过程,比如识别图像、理解语音甚或是自己做决策。这项技术的基础是所谓的“人工神经网络”,它是现代人工智能的核心元素。人工神经网络和真实的大脑神经元工作方式并不完全一致,事实上它的理论基础只是普通的数学原理。但是经过训练后的人工神经网络却可以完成很多任务,比如识别照片中的人物和物体,或是在几种主要语言之间互相翻译等等。
深度学习技术彻底改变了人工智能研究的面貌,让计算机视觉、语音识别、自然语言处理和机器人领域重新焕发生机。2011 年,首个语音识别产品面世,也就是大家非常熟悉的 Siri。不久之后,用于识别图像内容的应用也成熟了起来,该功能现已被整合进了 Google Photos 的图片搜索引擎。
在利用深度学习解决各种问题的过程中,科学家们取得了惊人的成就。2016 年 3 月,神经网络模型 AlphaGo 击败了世界顶级围棋选手李世石的新闻占据了各大媒体的首页。机器在其他领域超越人类的步伐也在加快,而且不局限于竞技游戏。最新的深度学习算法可以从磁共振图像中准确检测出心脏是否衰竭,准确度甚至能和心脏病专家媲美。
深度学习属于人工智能领域内一个更宽泛的概念——机器学习,即根据某些基本原理训练一个智能计算系统,最终使机器具备自学的能力。其中一条基本原理,就涉及到人或者机器如何判断一个决策是好是坏。
对动物来说这就是演化原理,“好”的决策意味着提高存活和繁衍几率;在人类社会中,“好”决策可能是指提高地位或产生舒适感的社会活动;对机器而言,以智能汽车为例,一个决策的“好坏”则可能被定义为其行驶模式在多大程度上接近优秀的人类司机。
深度学习技术的成功依赖于两个关键因素。首先是计算速度的大幅提升:科学家借用了本为电子游戏所设计的图形处理器(GPU),使计算速度提升了 10 倍,这使得在有限的时间内训练大规模网络变为可能。让深度学习研究开展得如火如荼的第二个因素是海量带标记数据集的出现,这些数据集内的所有样例都配有正确的标记——如一幅图中有猫这个元素,便会被标上“猫”。
深度学习近年来的成功还有一个原因:它可以通过学习算法找到一系列运算操作,对一幅图像、一段音频或是其他信号进行逐步的重构或分析,这里的步数,就代表着网络的深度。目前人工智能可以高效地处理很多视觉或听觉识别任务,都要求网络的深度足够大。事实上,最近的理论和实验的相关研究表明,假如网络深度太浅,是无法完成这些复杂的数学运算的。