过去十年,AI的进步不能让图灵奖得主Alan Kay满意。他在计算机世界混沌初开的时候进入这个领域,见过太多的“革命性突破”。他现在关心的是,如何让人类科技发展的潜能最大限度地激活,来面对最重大的挑战:气候变暖。他认为,人类现在有能力解决这一问题,但因为鸵鸟悖论等认知偏见而迟迟没有行动。“我们需要来真的。”在上个月的北京智源大会上,Alan Kay呼吁道。
当2003年图灵奖得主Alan Kay被问到对过去60年,尤其是过去10年的AI进展怎么看时,他笑着回答道:“哦,这个问题很简单…… AI这个词已经被偷走了。当年我们称之为人工智能的研究,现在被改作‘通用’人工智能(General AI)。
有些人想要取得成功,于是他们决定忽略人工智能研究中较难的问题,也就是关于认知的那部分……我承认机器学习领域取得了醒目的成就,但我绝不会将其和真正的AI混淆,绝无可能。”这是2020北京智源大会的压轴演讲现场,我和几千人一起在线观看了Alan Kay和华人计算机专家张宏江的对谈。看上去,Alan Kay似乎对AI过去十年的发展并不买账。
在他看来,一个足够复杂的机器学习系统,就像是一只“超级鸽子”。
这只超级鸽子可以做许多有用的事情。但机器学习领域的研究人员,不能用这个子领域的进展来标榜整个人工智能领域的成功。Alan指出,如果我们想要发明能够和人类自然交互的AI系统,就必须让AI学会理解人类的语境和常识。过去四十年中,这个领域几乎没有得到经费支持。
而现在,Alan表示,即便我们拥有巨量神经元构成的神经网络和专用的芯片,我们做的一切不过是Judea Pearl所说的“曲线拟合”(curve fitting),无论是通过多项式这样的最简单的模型来完成,还是通过最复杂的深度神经网络模型来达成,曲线拟合都仅仅是在输入数据和输出数据之间找到某种固定的模式,而非“理解”数据。
Alan Kay的这番话,让我想到了另一个著名的“非主流”研究者和AI大潮中的“异见人士”,印第安纳大学的认知科学教授侯世达(Douglas Hofstadter)。略懂中文的他为自己取了侯世达这个名字。他通常以跨学科巨著《GEB》闻名于世,但成名并获得终身教职后,他一直以自己的方式研究人工智能。在2019年接受果壳网的采访中,他严厉地批评AI领域的机器学习路径。
例如,Google翻译团队宣称他们的翻译水平已经达到了人类水平,但仍然会犯低级错误。
不难理解Alan Kay,Judea Pearl,侯世达这些前辈,对当前AI领域繁荣表象的批评。图灵在那篇启发后世的论文中,提出的问题是“机器能思考吗?”(Can machine think)?
许多老一辈研究者关心的是从科学上理解智能,而机器学习并非人类智能的运作方式,因为人类显然不需要从巨量的数据中学习如何分辨猫狗。在他们看来,想靠机器学习实现真正的人工智能,就像那个古老的寓言,“有人想顺着一棵树往上爬,一直爬到月球”。而如今,拥有六十年前研究者不敢想象的数据量和计算能力的AI研究者,会更加倾向于相信,飞机为了飞行,并不需要像鸟一样挥动翅膀。
诚然我们能造出厉害的机器,在围棋领域战胜人类世界冠军。但是,我们还是不理解人类的智能是如何运作的。“我们应该严肃对待人工智能中的‘智能’二字(We should take the word 'Intelligence' seriously)。”Alan Kay强调道。
80岁的Alan Kay语出惊人的背后,的确有真本事。他1940年出生于美国麻省,父亲是生理学教授,母亲是音乐家。
小时候的Alan是个神童,三岁就学会了流利的阅读,上小学前,他已经读完了150本书。他说,“不知道是幸运还是不幸……小学一年级的时候,我就已经知道老师在骗我了。”Alan大学在西弗吉尼亚的Behany学院读生物学专业,还辅修了数学。他没毕业就参加了空军,并因此接触到了计算机,成为一名IBM 1401程序员。从空军退役后,Alan到科罗拉多大学继续读书,拿到了数学和分子生物学的本科学位。
1966年,进入犹他大学工程学院读研究生,研究电气工程。1970年,Alan加入了加州的Xerox PARC(Palo Alto Research Center)。
PARC是1970年施乐(Xerox)发起的,致力于为“未来的办公室”做长期研究的机构。
施乐靠激光打印机成为全球知名的数字与信息技术产品公司,其前身是ARPA(Advanced Research Projects Agency),互联网的原型阿帕网(APRAnet)就是这个机构在1966年的研究产物。在PARC,Alan发明了图形用户界面(GUI)。
如果没有这个发明,就不会有后来的Windows和Macintash,我们就不会像现在这样使用鼠标和键盘,通过点击或者触摸屏幕上的图形来和电脑交互了。不过这还不算什么。在施乐期间,Alan Kay基于Smalltalk语言,提出了面向对象编程(Object-oriented Programing)的思想。
这个思想几乎应用在一切现代日常计算机应用软件的代码中,也是C++,Java,Ruby等现代编程语言的基础设计。此外,他在70年代初,他还提出了Dynabook的原型,启发了现代笔记本电脑,平板电脑和电子书的设计。他关于GUI和“每个人都能用电脑”的思想,深刻影响了比尔盖茨和乔布斯。
年少功成的Alan Kay多才多艺,曾是职业爵士吉他演奏家和业余管风琴演奏家。
显然,他认为自己是名有科学背景的艺术家。“艺术家不会因为别人不接受他的想法就停止创造,他们创造并不是为了售卖,而是为了让自己的思想得以显现于世。”他在分享中说道。Alan Kay毫无意外地提到最近40年来计算机技术的“停滞”。
Alan曾在17年FastCompany的采访中表示,Tim Berners-Lee创造的万维网(World Wide Web,即WWW)和HTML,与Douglas Engelbart(超文本链接和鼠标的发明人)的思路相比格局太小,只是碰巧被其他同样头脑简单的人接受,变成了标准。
而iPad,也只是他在70年代创造的Dynabook和后来的产品Xerox Palo的延长线,不幸的是,iPad更加消费主义。微型计算机Xerox Palo,比Macintosh早了足足11年,只不过售价相当于现在的11万美元。
在他看来,最近20年只有Croquet项目值得一提。
该项目设想了一个所有参与者都可以自由互动的虚拟现实环境,像是创造一个大型多人在线网游,但人们相互交流的是整套的操作系统,应用软件和人机交互方式,这使得参与者可以随时改变各种物件的源代码。Alan Kay认为,“Croquet的重要性可以和TCP/IP相提并论。”Croquet是Alan Kay尚未实现的一项远景(Vision)。
他当年在ARPA工作时的领导,信息处理技术办公室的负责人J. C. R Licklider正是一个善于描绘远景的人。
1960年代,Licklider看到“计算机命中注定要成为和未来普遍联网的人类交互的智能放大器”(Computers are destined to become interactive intellectual amplifiers for all humans pervasively networked worldwide)。
也就是说,他已经预言了个人计算机,基于图形界面的人机交互技术,以及互联网的诞生。更准确的说,不是预言,而是“导演”了这一切。在Alan Kay看来,杰出领袖的责任在于提供远景,而不是提供目标(goal)。只有这样,才可能取得前所未有的突破。“远景给你一种感觉,一种渴望,但没有任何具体细节,没有任何你可以直接上手的问题。
你需要自己从远景中寻找可以做的事情……远景就像磁场,研究者能够感受到这些磁场的存在,感受到北方在哪儿……但前往这个方向的途径可以是多种多样的。”
这些远景,Alan Kay说,让当时的年轻人间获得了一种“美学意义的联接”。“我们爱Licklider的远景,就像爱一个情人...我们受到这远景的召唤,就像一些人被宗教召唤。
”从ARPA到后来的Xerox PARC,Alan说,他遇到的领导者没有官僚,而是科学家政客(Scientist statesman)。他们尽可能地免除了种种官僚手续和文书工作,更多地凭借信任工作,放手让年轻人去尝试。他们甚至取消了同行审议(peer review)。在他看来,最顶级的工作,是无法找到同行的。确实,两个机构的几乎每项工作,都开创了一个全新的行业,它们根本就没有竞争者。
在Xerox PARC,25名研究人员,5年的时间,每年1500万美元的投资,便带来了8.5个重大发明(那0.5是互联网),科研投资带来的回报,现在已经超过了40万亿美元。
以阿帕网项目的诞生为例,Alan回忆到,人类的互联网时代始于一个15分钟的谈话。
1960年代初的一年,Robert Taylor和当时ARPA的负责人Charles Herzfeld进行了一场谈话,在15分钟的时间里,Robert估算出约合现在700万美元的启动资金,Charles稍加询问后同意了。几乎在同一天,ARPAnet项目开始运转,而项目申请的文书工作直到一年后才补完。这种程度的信任和效率,无疑会让现在深陷经费申请泥潭的项目带头人心生羡慕。
Alan Kay认为,为了取得开创性的研究进展,就必须要有“疯钱”(mad money),不在乎后果和回报,投资可以没有任何明确的目标收益。换言之,这些投资是“非理性”的。但为了创造,非理性是必要的。
在Alan Kay看来,Mad money需要占到某个机构R&D经费的1%~5%。
如果我们认为Xerox PARC的经费——每年约合现在的1500万美元——全都是“疯钱”,那么财富Top 418的公司,都能供养得起自己的Xerox PARC。而像中国和美国这样的大国,各自至少可以拥有超过330个Xerox PARC。也就是说,我们的科技进步速度远远没有达到应有的水平。Alan Kay指出,人类应该有足够的能力,去解决那些更大的挑战,例如全球变暖。
全球变暖才是Alan Kay现在最关注的问题。比起过去的科学家和工程师身份,Alan Kay现在更像一个思想家。他关心的是如何用科技来应对人类面临的重大挑战,例如全球变暖带来的气候灾难。“我们可以想象一个今年出生的孩子,在22世纪来到的时候刚好80岁。我们应该思考,如何让他度过这一生?如何让他在80岁的时候的地球看上去比现在更好,而不是更糟?”Alan问道。
确实,气候变暖问题是一个远比新冠疫情危害更大的挑战。地球上的大气二氧化碳含量,一直在200ppm~300ppm之间震荡。但自从1950年代以来,这个数字已经上升了33%,达到了414ppm。温室气体增多会让地球气温升高,而这对环境的许多影响将是不可逆的。
“我们不能用创造问题时的思维水平来解决问题。”Alan Kay引用爱因斯坦这句话,以解释解决问题和产生问题并不是对称的。
他指出,打破一个系统的稳态是很容易的,但要恢复稳态就很难了。例如,推倒一个竖立的玻璃瓶,要比扶起一个平放的玻璃瓶需要的能量少得多。同样,修复地球的生态,也远比破坏生态系统要困难得多。然而,因为人类固有的种种认知偏见,人们并没有像面对二战或冷战那样的战争威胁一样,迅速组织起来,用科技的力量去解决问题。
Alan Kay认为,这些认知偏见中最重要的就是鸵鸟悖论,正如心理学者丹尼尔·卡尼曼在《思考,快与慢》中所列举的那样:1) 在时间和环境中的近视 2)失忆(快速忘记过去的困难) 3)乐观(认为事情会自动变好) 4)惯性(尤其是面对不确定性的时候) 5)简化(尤其是认知负担过重的时候) 6)从众(即要通过社会共识来做决定)。“一个不好笑的笑话是,人类只能在面对外星人入侵的时候才能团结起来。
然而,对于气候灾难来说,这就太迟了。”Alan Kay警告说。
ARPA和Xerox的经历告诉Alan Kay,只要有适当的投资,优秀的管理和杰出的人才,凭借人类的创造力和组织能力,可以解决最难的问题,做成伟大的事情。而如何让人们能够在灾难降临前就做好准备,而不是继续假装没有问题发生,Alan Kay认为,这一问题亟需解决方案和行动。如同他在演讲中所说,“我们需要来真的(get real)。”