最近,来自麻省理工学院(MIT)的两位物理学家Tailin Wu和Max Tegmark创造出了一个人工智能(AI)物理学家,能够在一些为了模拟我们宇宙的复杂性而创造出的神秘世界中梳理出物理定律。这标志着我们朝着创造出不仅能发现模式、还能从这些模式中对未来进行预测的机器学习算法迈出了重要一步,为完全由AI来完成科学发现奠定了基础。
在这个神秘世界中,视场被分为四个象限,每个象限都受不同的物理效应的支配,比如引力(左下)或电磁场(右下)。点和线代表球在环境中的轨迹。基于球如何在环境中运动,AI必须使用它被给予的策略来描述支配球运动的物理定律。
当给AI一个数据集时,它能对这个数据集进行分析从而创建一个模型。模型的功能取决于具体的任务。例如,假如你想要训练AI对猫进行识别,那么可以给它展示数千张猫的图片,这样算法就可以从每张照片中找出相似特征,从而归纳出一个猫的模型。
AI创建模型的方式,有点像科学家通过理论,从一个现象的特定事例,类推到这一现象在类似情况下的所有事例的方法。但是,这二者之间也存在一个关键区别。
继续以识别猫为例,给AI的那些图片都是已经聚焦在猫身上的图片。而更艰难的任务是给AI提供猫在相似环境下的图片,例如在森林中。这一学习过程就有点类似于科学研究了。对于这样的数据集,AI的任务是创建一个能忽略其他无关细节(例如所有植物)而只关注猫的模型。又或者,它可能会得出一个将所有猫都描绘成是居住在森林里的模型。
如果是这样的话,那么当你再给AI提供一张猫咪趴在床上睡觉的照片时,它就识别不出来了,因为它的模型出了问题。
虽然也不能说AI就完全错了,因为有很多种猫只在森林中生活,但它犯了一个错误——它创建了一个大的模型,并试图将这个模型套用在所有的数据上。一种更有成效的方法,也是科学家通常采用的方法,是创建许多适用于观测到的数据子集的小模型或理论,然后把这些小的理论加在一起,再得到一个适用于“万物”的理论。
对于研究机器学习的科学家来说,训练AI如何对数据进行分区,创建出能最终加在一起的小模型以获得更大的模型,是一项非常艰巨的挑战。Tailin Wu和Max Tegmark在arXiv上发表的论文中详细描述了他们如何运用“AI物理学家”,朝这一方向迈出了重大一步。
为了实现这一目标,Tegmark和Wu的机器学习算法具有四种策略,这四种策略也同样可被人类科学家所采用,以对复杂的观测推导理论。这几个策略分别是:分治法、奥卡姆剃刀、统一和“终身学习”。
在将这些策略编码到机器学习算法中之后,Tegmark和Wu向AI展示了一系列复杂程度越来越甚的虚拟环境,这些虚拟环境由奇怪的物理定律所支配,并让AI去理解它。它的目标是尽可能准确地预测物体在二维空间的运动。这需要AI为每个“神秘环境”推导独特的物理理论,才能理解物体在该环境下的运动方式。
正如Tegmark和Wu所发现的那样,随着环境变得越来越复杂,这位AI物理学家越来越难理解物理定律。最后,这位AI物理学家总共接触了40种不同的神秘环境,并能在超过90%的情况下,推导出支配这些环境的正确物理定律。此外,Tegmark和Wu的AI物理学家能够比传统的机器学习算法减少“十亿倍”的预测误差。
这一工作或许对人类在未来从事科学研究的方式产生重大影响。特别是它或许能极其有效的应用于理解大量复杂的数据集上,比如那些用于气候或经济建模的数据集上。或许,下一位即将到来的牛顿或爱因斯坦,将只是一些计算机代码而已?