天文爱好者们或许该学学机器学习了,在人工智能时代,用望远镜来猎星已经略显过时。去年12月份,谷歌训练了一个神经网络,通过分析美国宇航局(NASA)Kepler空间望远镜获得的一些数据,发现两颗系外行星。这项工作作为将机器学习的方法应用到天体物理中的典型案例,或将大大加速人类对系外行星的探索步伐。而在今天,谷歌开源了他们的代码,任何有兴趣的同学都可以下载代码和数据,在自己的机器上运行。
系外行星,指在太阳系之外的行星。天文学家估计银河系中可能包含多达4,000亿颗系外行星。截至2016年2月22日,已经被认定的系外行星总数为2085颗,这些行星分属1331个行星系,其中有509个多行星系。
我们知道,行星是不发光的,我们之所以能够看到水、金、火、木、土星,是因为它们反射了太阳光线,但这些光线相比于恒星来说是微不足道的。
当距离遥远时,即使那些巨大的恒星都可能难以察觉,更何况那些系外行星。天文学家于是想到了另外一种办法——当行星经过恒星的前方时会遮挡一部分光线,这就会导致我们测量的恒星亮度稍微下降,当离开后又会恢复,于是在恒星亮度曲线上就会出现「U形」凹陷;通过这种方法,天文学家可以间接地证明系外行星的存在。
为了在Kepler空间望远镜的数据中搜索行星,天文学家们使用了自动化软件来检测可能由行星遮光引起的信号,然后手动跟踪去确定这些信号到底是行星还是误报。为了避免检测到太多的信号,以至于他们没有那么多人手来处理,天文学家们对自动检测设置了一个截止点:只有信噪比超过固定阈值才会被提取出来;否则就丢掉。不过即使这样,仍然有大量的信号需要检测。
例如到目前为止,已经有超过30000个信号被手动检测过,其中约2500个被验证为系外行星。
考虑到数据的庞大和人力的密集,自然而言想到的一个方法就是:机器学习。基于以上的考虑,Google Brain团队找到了UT Austin大学的Andrew Vanderburg,Vanderburg是一位著名的天体物理学家,专注于研究系外行星探测。他们合作开发了一个神经网络(CNN模型),用来在低信噪比检测的信号中搜索系外行星。
从670颗恒星中找到了两颗新的系外行星。
这项工作可能只是一个开始,而且远没有完成,因为开普勒观测到的数据为20万颗恒星。谁知道当把这项技术应用到整个数据集时我们会发现什么。独乐乐不如众乐乐,Google Brain团队最近开源了他们的代码。有兴趣的同学不妨加入这场大众的猎星行动,一起来寻找那颗可能属于自己的星球。人工智能时代的天文爱好者,可能不再是拿着昂贵的器材到野外去看星空了,而是使用更强大的工具——机器学习,来搜索宇宙。