在对宇宙可能性的模拟中,研究人员发现神经网络仅仅学习一个星系,就能推断出整个宇宙物质的组成成分。本来只是给本科生正常布置了作业,天文学家却从作业成果中发现了未曾设想的关联。或许,这个宇宙真的是“一花一世界,一叶一菩提”,机器学习可以“一叶知秋”,从单个星系推测出整个宇宙的性质,比如宇宙的物质密度几何。
天文学家试图在其中寻找解释,但又不得不怀疑,机器学习是否在“偷懒”,只是找到了隐藏在模拟代码背后的捷径?天文学家正在寻找着答案。为了弄清楚宇宙的组成成分,宇宙学家通常会扩大观测范围,尽可能看到整个宇宙。但一组研究人员发现了一种机器学习算法,可以通过单个模拟星系的状态预言整个数字宇宙的性质。这有点类似于在显微镜下随便研究一粒沙子,就能计算出整个欧亚大陆的情况。
这一机制似乎已经找到了这种不可思议的范式,或许有一天,天文学家可以只通过研究宇宙的基本组成成分,就能得出关于整个宇宙的全面结论。这是一个完全不同的想法,相较于测量数百万个星系,你其实只需要测量一个。这是这项工作最令人吃惊的地方。事情本不该是这样的。这个不太可能的发现源于维拉斯库萨-纳瓦罗给普林斯顿大学本科生朱庇特·丁的一个练习:建立一个神经网络,在知道星系属性的情况下,可以估计几个宇宙学属性。
这项作业本来只是想让丁熟悉机器学习,然后他们注意到计算机正在测量物质的总密度。我一开始以为是学生搞错了,实话说,这对我而言有些难以置信。随后的调查结果在1月6日以预印本的形式公开。研究人员分析了2000个由宇宙学和天体物理学机器学习模拟项目生成的数字宇宙。这些宇宙拥有不同的物质组成,其中物质占整个宇宙的比例从10%到50%不等,其余部分则是让宇宙膨胀越来越快的暗能量。
丁的神经网络项目研究在如此多彩的宇宙环境中研究了100万个模拟星系。这个神经网络从中知道了每个星系的大小、组成成分、质量和十余个其他特征,它试图将这些数字与整个宇宙的物质密度联系起来。它成功了。当这个模型检测它从未见过的星系时,神经网络能推断出它所属宇宙中的物质密度,误差不到10%。这与你选取哪个星系是无关的,所有人都认为这不可能。
这个算法的表现让马克思·普朗克天体物理研究所的星系模拟演化专家沃尔克·斯普林格尔感到震惊,因为星系本身是非常混乱的天体。有的只是自己默默成长,有的则会不断吞噬邻近星系。大型星系通常能捕获更多物质,而矮星系中的超新星和黑洞则可能喷射出很多物质。尽管如此,每个星系的细节似乎都和整个宇宙的密度息息相关。一种理解是“宇宙或星系比我们预想的要简单得多”,西安大略大学的天文学家波琳·巴姆比说到。
而另一种理解是这些模拟存在一些我们还没注意到的瑕疵。研究团队花了半年时间想搞明白这个神经网络为何如此智能。他们不断检查,想确保这个算法并没有从模拟本身的代码中找到规律。神经网络很强大,但也很懒惰。经过一系列的实验后,研究人员开始渐渐理解这个算法是如何算出宇宙密度的了。通过反复训练神经网络,系统性地模糊不同属性,他们渐渐将注意力集中在几个最重要的属性上。
最重要的属性是星系的旋转速度,这和星系中心区域含有多少物质(不管是暗物质还是正常物质)密切相关。这一发现和斯普林格尔的物理直觉相符。在充满暗物质的宇宙中,星系的成长、旋转速度都会更快。所以将旋转速度和宇宙整体的物质密度关联起来也合乎情理,尽管这种关系太粗糙,我们并不能以此作出预测性的成果。而神经网络则找到了17个与宇宙物质密度相关的星系属性,并且更精准、更复杂。
不论是星系合并、恒星爆炸还是黑洞坍塌,都无法摧毁这种关系。一旦属性的数量超出2个,你就不能简单画个图用肉眼去寻找趋势了,但神经网络可以。尽管这个算法的成功引出了一个问题——我们可以通过研究一个星系了解多少宇宙的属性?但宇宙学家怀疑这种算法在真实世界里会处处受限。当维拉斯库萨-纳瓦罗的团队用其他属性来检测一些别的属性时,常常一无所获。
斯普林格尔则将其解释为诸如宇宙膨胀加速度之类的宇宙属性,是和暗能量有关的,而暗能量在单个星系的尺度上影响很小。研究确实佐证了这一点,理论上,对银河系和邻近几个星系进行彻底的研究,可以极其精准的预言我们整个宇宙。维拉斯库萨-纳瓦罗表示,这样的实验可能为宇宙中其他重要的数字提供线索,比如宇宙中三种中微子的质量之和。但在实践中,这样的技术还有一个关键的弱点需要克服。
CAMELS合作组织用两种不同的方法生成模拟宇宙。在一种方法下训练的神经网络在猜测另一种方法生成的宇宙密度时效果并不好。没能通过交叉检验暗示着这种算法仅仅是从模拟宇宙生成算法本身中寻找捷径。而对于由真实物理定律生成的银河系,它肯定不知道从何下手。在这项技术推向真实世界之前,研究人员还需要让他们的模拟更切合实际,尝试更通用的机器学习技术——而这是一项艰巨的任务。
我对这种可能性感到惊讶,但也大可不必太过震惊。但维拉斯库萨-纳瓦罗则坚信神经网络能找到两种独立模拟之间的关系。这样的数字发现能增加我们通过“一叶知秋”方式了解整个宇宙的可能性。这是一件非常美妙的是,这建立了整个宇宙和单一一个星系之间的联系。