近日,MIT的 AI 科学家 Lex Fridman 对乔姆斯基进行了专访,在接受采访的时候,从外星人谈到了语言学,然后谈到了深度学习,并探讨了人类哲学。他认为深度学习当前都在学习大量的例子,没有对本质进行探寻。另外,他还认为我们人类的意义由我们自己决定,人类的行动就是人类存在的意义。乔姆斯基是一位开创性的人物,尤其是他那本《句法结构》被认为是20世纪理论语言学研究上最伟大的贡献。
不光《句法结构》,还有《现代希伯莱语语素音位学》、《转换分析》等一系列语言学著作传达了对多种正规语言的洞见,也对计算机科学产生了重要的影响。据说,乔姆斯基的语言模式也可从数学的角度来讨论,这也引起了数学家,尤其是组合数学家的兴趣。
问:如果外星人造访地球,你认为我们能找到与他们沟通的共同语言么?答:是可以的。
大约在二三十年前,马文·明斯基就和他的学生一起做了一个实验:不加限制条件的运行最简单的图灵机,看看会发生什么?结果是大多数要么死机,要么进入无限循环,只有少数给出了类似算术的东西。所以马文得出结论:如果高智商的外星人造访地球,那么他们至少会做一些简单的算术。实际上,马文并不知道,自然语言的核心原理是在极限情况产生类似于算术的运算。
所以,基于人类语言的核心属性或者算术的核心属性可以建立一种普遍共享的交流模式。
问:语言的结构是什么?语言在我们头脑中的内部系统与它所表达的外部结构有何不同。答:这是两种不同的语言概念,两个概念是同时存在的。你本身的一些属性决定了你要说的是英文,而不是其他语言,所以有一个内在的系统,并且是局部性存在于你的大脑中决定了你的表达,和笔记本电脑的内部结构类似,这个系统也属于大脑中的特定配置。
你也可以用语言外化脑海中的东西,但是我们对语言的使用,大多数数是内在的思考,而我们正在外化的那套东西是一个外部系统。
问:像视觉等基本的东西都是从人类头脑中涌现的么?答:在某种程度上,是由我们的基因决定。基因决定了我们拥有的是哺乳动物而不是昆虫的视觉系统,基因决定了我们拥有人类的语言能力。
早在几个世纪前的工业革命时期,就已经有人认为语言是人类认知本质的核心,是思想的源泉,是构建思想和表达思想的方式,并且语言具有基本的创造能力,是自由、独立、无拘无束。确实,语言是我们人类非凡能力的基础,但这些能力帮助人类取得是一些并不那么伟大,但同时又有那么点独特的成就。
问:思考和推理的能力和语言有很深的联系么?内在的语言系统本质上是内部推理的机制么?答:语言肯定是推理的机制,但我们还有更多的科学天赋,没人知道这个天赋到底是什么,但是它却能确定什么是有意义的,什么是没有意义的。我们本身在使用语言,但同时也获得了超出范围的理解。
问:您能尝试定义什么是极限么?您认为有可能找到人类认知的极限么?
答:大多数科学家认为,人类智力原则上可以回答任何问题,但这是一个非常奇怪的信念。我们不是神,所以我们的能力存在范围和界限。举个例子,遗传因素决定了你是一个丰富而复杂的有机体,也让你拥有了哺乳动物的视觉系统以及手臂,这个遗传因素规定了人类发展的方向,阻止其他方向的发展,例如,胚胎出来的动物没有发育成昆虫。因此在赋予丰富性和复杂性的同时也限制了所能获得的东西。
假设我们的认知能力是世界的一部分,那么它们就应该具有相同的属性,并形成了丰富和复杂结构的内在能力,同时规定了“方向”,所以认知有极限。
问:您认为深度学习,或者基于神经网络的机器学习的极限是什么?答:要给出一个真实的答案,必须要了解发生事情的确切过程,如果这些过程是不透明的,那么很难清晰地证明可以做什么,不可以做什么。抛开细节不谈,深度学习现在正在做的是收集大量的例子,并试图找到一些模式。
这在某些方面可能会很有趣,但我还是想问:AI是工学还是理学?工学的意义是试图理解关于世界元素的东西,所以他可能需要一个谷歌翻译器。它有用么?非常有用,所以从工学的角度来说,谷歌翻译器非常有用。但是它有没有告诉我们关于人类语言的事情?显然没有。所以,从一开始它就已经远离了科学。
问:您认为我们可以描绘的东西其实比蜜蜂大,然后发现一些东西,让我们能够理解量子世界,量子力学么?
答:你可以,麻省理工的学生能够学习和理解量子力学。问:其实他们也不是真的理解。答:不是物理意义上的,这可能另一个理解有限的领域,其实我们理解这些理论,但它描述的世界没有任何意义。例如薛定谔的猫,你可以理解这个理论,但正如薛定谔指出那样,这并不是一个可以理解的世界。爱因斯坦是一个经典的现实主义者,所以他总是怀疑量子理论。
问:您在语言学或认知科学中看到的语言或思想中最迷人的方面是什么?
答:我认为语言最深层的属性或者最令人费解的属性是一种结构性依赖的东西。现在我们对它很了解,但之前却令人费解了很长一段时间。举例来说,这家伙修车小心翼翼地打包工具(the guy who fixed the car carefully packed his tools),这句话其实是令人模棱两可的,它所表达的意思可以是小心翼翼地修理汽车,也可以是小心地打包他的工具。
副词与哪个动词相关的(是离最近的还是最远的)是一个非常令人费解的事情。
问:你认为深度学习,或者基于神经网络的机器学习的极限是什么?答:要给出一个真实的答案,必须要了解发生事情的确切过程,如果这些过程是不透明的,那么很难清晰地证明可以做什么,不可以做什么。抛开细节不谈,深度学习现在正在做的是收集大量的例子,并试图找到一些模式。这在某些方面可能会很有趣,但我还是想问:AI是工学还是理学?
工学的意义是试图理解关于世界元素的东西,所以他可能需要一个谷歌翻译器。它有用么?非常有用,所以从工学的角度来说,谷歌翻译器非常有用。但是它有没有告诉我们关于人类语言的事情?显然没有。所以,从一开始它就已经远离了科学。
问:您认为我们可以描绘的东西其实比蜜蜂大,然后发现一些东西,让我们能够理解量子世界,量子力学么?答:你可以,麻省理工的学生能够学习和理解量子力学。问:其实他们也不是真的理解。
答:不是物理意义上的,这可能另一个理解有限的领域,其实我们理解这些理论,但它描述的世界没有任何意义。例如薛定谔的猫,你可以理解这个理论,但正如薛定谔指出那样,这并不是一个可以理解的世界。爱因斯坦是一个经典的现实主义者,所以他总是怀疑量子理论。
问:您在语言学,认知学方面给世界做出了突出的贡献,重温你当时第一次想到那些概念的时候,会让你感到兴奋么?答:兴奋。
当你发现一些东西的时候,例如对结构依赖性的观察和解释,都是令人兴奋的。在20世纪50年代,那时候语言被认为是一种外部的现象,一种思想之外的东西。很明显,这似乎是不合理的,就像我前面说的,你身上的东西决定了你说的是英文,而不是斯瓦希里语。但不是真正的发现,而是一种观察,这有点像17世纪,那时候现代科学刚刚开始,科学家们愿意对看似显而易见的事情感到困惑。
问:对人类来说,最特殊的事情就是死亡率,您是否在考虑死亡率的价值?答:我自己对于死亡率不怎么在意,但我担心如果我的意识消失了,整个宇宙都会消失,那就非常可怕了。问:你找到这个问题的答案了么?答:没有人能够找到答案,但我不再被它所困扰。
问:在问一个荒谬的问题,您认为我们存在,我们在地球上生活有什么意义。答:人类通过自己的活动已经回答了这个问题,没有普遍的答案。需要我们自己来确定有什么意义。