“深度学习先驱”谢诺夫斯基：AI的下一个目标，是与人交流

20世纪80年代，距离人工智能概念的提出已经过去了30年。这时，该领域的主流学者正在“符号主义”的指导下苦苦挣扎。他们试图通过编程实现人工智能，但收效甚微，始终无法解决计算机视觉、语音合成等实际问题。显然，人工智能一直没有找到正确的发展方向。

这时，两位初出茅庐的年轻人——特伦斯·谢诺夫斯基（Terrence Sejnowski）和杰弗里·辛顿（Geoffrey Hinton）——意识到，当前的思路不会带来真正的突破。他们从大脑中获得启发，开始尝试构建神经网络，让人工智能自我学习。很快，这些挑战权威的“异端”得到了回报。他们发明了一种随机生成神经网络——玻尔兹曼机，并且证明人工智能可以用于解决实际问题。

这些突破奠定了人工智能的发展方向，也让人工智能从边缘走向舞台中央。

现在，谢诺夫斯基这位当初挑战权威的年轻人，已经成为全球最声名显赫的人工智能科学家之一。身为美国国家科学院、美国国家工程院、美国国家艺术与科学学院、美国国家发明学院的“四院院士”，被称作“深度学习先驱”的谢诺夫斯基依然站在探索人类智能的最前沿，并作为顾问委员会成员参与了美国“BRAIN”脑计划的方向制定。

在研究之余，谢诺夫斯基也长期致力于科普。就在去年，谢诺夫斯基的新书《深度学习：智能时代的核心驱动力量》出版问世。2019年11月下旬，在谢诺夫斯基在北京参加讲座活动之际，我们对这位顶级人工智能学家进行了专访。在一个小时的交谈中，谢诺夫斯基以高涨的热情讲述了他亲历的人工智能早期发展历程，以及对人工智能现状与未来的看法。

《环球科学》：上世纪70年代，当你涉足AI领域的研究时，学界的主流思想是“符号主义”，试图通过编程实现人工智能。在这种情况下，你和辛顿为什么会坚持研究在当时无人问津的神经网络？

谢诺夫斯基：对于计算机科学家来说，符号主义是很自然的想法。因为计算机的运算是二进制的，它的逻辑是非0即1。而我们的直觉是基于以下两点：首先，复杂的现实世界不是“非黑即白”的，存在很多维度。

而用二进制的逻辑描述世界，往往会得到错误的结果。其次，更重要的原因，来自我们对大脑的观察。从对大脑的研究中，我们获得了启发。我们意识到，大脑与计算机的运作方式截然不同：大脑中有大量并行的信息处理，无论是整合信息，还是作出决定，都是基于数据统计产生的可能性，而不是非黑即白的。因此，我们产生了这样的直觉：我们要寻找的AI架构，应该能体现出大脑中的上述特征。为此，我们从最简单的结构入手。

我们最初研究神经网络的目的，只是想探索这样一个问题：利用与大脑类似的构造，计算机可以完成什么任务。于是，作为先驱者，我们开始为人工智能探索新的发展方向。

当时，人工智能的概念已经提出了30年，人们都在符号主义的框架中开展研究，进展很不尽如人意。我很清楚，这些科学家大大低估了问题的难度。我们意识到，我们需要的可扩展构造必须是并行的。如果在某个时刻只能处理一条指令，那么它的低效率一定会成为瓶颈。

而如果要做大量并行计算，需要数千亿个神经元，这就是人类大脑中的情形。当时，AI领域的权威包括麻省理工学院的马文·明斯基（Marvin Minsky）、斯坦福大学的约翰·麦卡锡（John McCarthy），还有卡内基梅隆大学的科学家。他们拥有一切资源，有所有的经费、学生，他们具备了一切，唯独缺少正确的想法。当时我们还很年轻，我们感觉到我们走在正确的方向上。这就是我们所做的。

《环球科学》：神经网络发展的转折点是什么？其他研究者何时开始意识到，神经网络可能是更有效的解决方式？

谢诺夫斯基：在我看来，我们上世纪80年代所做的工作，更多的是一种原理验证。我们证明了，为多层神经网络创建学习逻辑是可行的，而在此之前人们认为这是不可能实现的。这是非常重要的进展。当时的计算机还不足以解决真实世界的问题，所以我们当时的论证，只是使用很小的数据库，做一些类似玩具的演示。

但一个例外是语音合成：输入字符串，输出语音。我们在1986年实现了这个功能，这也是神经网络学习的首个实际应用。在英语中，语音合成是个很难的问题。意外的是，我们构建的神经网络只包含几百个单元，但已经能做得很好了。这些词汇属于符号，但他们（当时的主流AI学者）用符号主义却无法解决任何语言问题。这个网络的优美之处在于，它提取的是词语间的语义学信息。有些词汇的含义很丰富，这是我们交流的基础。

我们将词汇视作底层，它们与其他词汇的关系，携带了特定的含义。这可能是新旧AI系统最大的区别：我们创建的新系统基于非常复杂的深度学习网络中的高维结构，可以通过学习创建。

《环球科学》：在那之后，一些研究者开始将研究方向改变为神经网络？

谢诺夫斯基：是的，但最大的转折点是在2012年，辛顿和他的两个研究生在李飞飞创建的ImageNet图像识别比赛中，运用深度学习大幅提升了图像识别的准确率。

这是一次巨大的飞跃，相当于20年的计算机视觉研究。这是通过学习实现的，而不是编程。因此，这是在不同的框架中，完全不同的思考方式。计算机科学家总是通过编程来解决问题：写下一段代码，这样就得到一个算法。但问题是，在面对计算机视觉或语言等复杂问题时，这种非黑即白的逻辑非常脆弱。但学习可以带来额外的奖励。奖励是什么？如果你有了数据，你不需要自己理解它，因为算法帮你解决了。它能够按照人类的方式学习。

正如你懂汉语，但你不知道你是如何学会汉语的。这正是我们的意图：学习是AI缺失的一块，它很难被装进简单的程序框架，但却很容易被放进神经网络中，这也正是自然的处理方式。自然界用了数亿年演化出非常高效的策略来解决问题，我们可以从中受益。每个物种都能解决不同的问题，我们需要理解这些。神经科学的研究开启了全新的方向。

《环球科学》：现在，人工智能系统开始在不同的领域发挥作用，例如一些AI检测特定疾病的准确率，可能比人类专家更高。你认为，AI会在某些领域取代人类吗？

谢诺夫斯基：我认为AI与人类不是取代与被取代的关系，它们是两个不同的选项。所有的证据都表明，AI将成为人类的同伴。例如，医生有着丰富的经验，可以从数据中挖掘出更加复杂的事情。而AI的能力范围很窄，只能直接获取数据中的信息。

在《深度学习》这本书中，我举了这样一个例子：通过深度学习网络诊断皮肤疾病。对于皮肤科医生来说，诊断皮肤病变是极具挑战性的任务。不同的皮肤病变有超过2000种，医生需要给出诊断，判断病变是良性的，还是有致癌风险的。一篇发表于《自然》的论文，就用包含了两千种皮肤病变的14万张图像，对深度学习网络进行训练。经过训练的AI系统预测病变的正确率达到92%，这一数字与一组经过专业训练的人类专家持平。

这个案例告诉我们，通过海量的数据，我们可以训练AI，用于解决很复杂的问题。但是，无论是AI还是人类，正确率都停留在92%。可以做得更好吗？于是，他们做了另一项试验：让一组医生使用先前的AI系统协助诊断，这时正确率达到了98%。

《环球科学》：所以，AI可以用作医生的工具。

谢诺夫斯基：完全正确，这时诊断的错误率从8%降至2%，这是巨大的进步。AI可以带来相对独立的信息，这些信息与医生的经验结合，能够提升整体表现。我认为这将是未来的图景：医生不会被取代，他们可以在AI的协助下做得更好。人们喜欢非黑即白的思考方式，但实际上，合作才是解决问题的更有效方式。

《环球科学》：我们知道，你是美国脑计划顾问委员会的一员，可以聊一下你在美国脑计划中的工作吗？

谢诺夫斯基：美国脑计划始于2013年，由奥巴马政府发起。该计划要解决的重要问题之一，是寻找能够有效记录大脑活动的工具。我们的大脑经过数亿年的演化，形成了拥有上千亿个神经元、千万亿神经元连接的复杂结构。根据传统的手段，微电极一次性只能记录少量（例如几百个）神经元的活动，但我们需要了解对象有上千亿个。作为顾问委员会成员之一，我和其他专家讨论了脑计划的7个主要目标。

其中之一，就是能同时记录大量神经元的活动。现在，10年计划已经过了一半，我们已经能够运用光学技术和微电极阵列，一次性监测数万个神经元活动。这为思考大脑的工作方式，提供了全局的视角。我们可以更好地理解神经元如何相互作用、信息如何传递。为了将我们测得的小范围结果放大到更大的脑区，深度学习需要参与其中。

对于神经元和突触的轮廓、不同区域间的连接方式，使用人类已经测出的数据训练，AI可以大幅增加我们重建的神经元数目。现在我们可以重建出包含数十亿个突触，厘米尺度的皮质区域。因此，我们看到了有趣的一幕：我们大脑的智慧创造了AI，AI反过来又帮助我们理解大脑。因此，生物学与算法最终汇聚在一起，相互学习，帮助实现目标。

《环球科学》：一些学者的观点是，将大脑的完整结构模拟出来，就能理解智能。你同意这样的观点吗？

谢诺夫斯基：实际上，这是个很有趣的问题。1968年，悉尼·布伦纳（Sydney Brenner）就已经重建了包含300个神经元的涡虫的脑。但这并不能告诉我们，它们是如何工作的。这就像是线路图，但你必须掌握它的信号，需要记录神经元活动、突触是处于兴奋还是抑制状态。现在，我们能够在提取出“线路图”的同时，记录其中的神经元活动。两者都很重要，现在我们已经两者兼具了。

《环球科学》：除了你正在参与的美国脑计划，其他国家也开展了一些脑科学项目：中国的脑计划刚刚起步；欧盟的人脑计划开展了6年，但遇到一些障碍。可以聊聊你对这些项目的看法吗？

谢诺夫斯基：我是欧盟的人类脑计划的科学顾问，因此我知道这个项目的确遭遇了麻烦。欧盟的人类脑计划更多的是一个计算机科学项目，而不是脑科学本身。这个项目的大量经费并非用于开展脑科学试验，而是用于建造数据库。

计算机科学家正在设计这些大型计算系统，其中的芯片拥有大量类似神经元的处理单元。显然，这样的研究具有重要价值，所以我相信欧盟的项目在计算机方面将收获好的结果。美国的脑计划已经非常成功了，它选取了不同的研究方向：开发用于研究大脑的工具与技术。因此可以说，这两个计划是互补的：美国的项目获取数据后，欧盟的可以进行数据分析。

《环球科学》：因此，这些不同的项目聚焦的方向不同，但都将在脑科学这个问题上发挥作用。

谢诺夫斯基：没错，要理解大脑这样复杂的结构，我们需要大量不同的才能。因此我们看到，每个国家的研究方向都有所差异。包括中国，尽管中国的脑科学计划还没有官方宣布，但基本可以确定，中国将重点研究灵长类的脑科学，而AI将在这类研究中扮演重要角色。这也是区别于美国、欧盟脑计划的一点。

《环球科学》：你如何看待AI的未来发展？在你看来，AI的下一个阶段是什么？

谢诺夫斯基：对未来进行预测很困难，未来总是复杂、充满未知的。AI的前30年缺乏牢固的基础，只有很脆弱的符号。他们不知道自己在做什么，没有正确的工具、正确的数学。我说了，他们缺少牢固的基础。但什么才是“牢固的基础”？我认为是与人的交互，能与人类交流。这可以通过词汇，通过图像来实现。

我想，深度学习已经提供了这样的基础，在现实世界与计算机之间成功建立起联系。所以现在，我们可以在这样的基础之上开展研究。幸运的是，这样的基础是建立在成熟的数学、物理、工程、生物科学的基础上。我们享受着来自数学、物理的所有工具的好处。这将帮助我们在基础之上，建立更加复杂的算法。现在我们面对的是一个非常年轻的领域：深度学习只有不到10年的历史，还需要数十年才能走向成熟。

我们有一个很好的起步，但必须缓慢地前进。从原理验证到可靠的实际应用，总是要花费数十年。在此期间，我们需要非常谨慎，因为在创建新事物的过程中，可能会有意料之外的结果。所以我们需要等待，确保这些进展对人类是安全的。