从海量数据中寻找未知

作者: 陆寅枫

来源: 牧夫天文

发布日期: 2018-10-01 17:45:58

在大规模巡天、公众科学和机器学习发展的背景下,天文学家正在利用大数据技术寻找宇宙中的未知。通过新技术如LSST,天文学家期望能够发现大量早期宇宙中的天体,解释恒星和星系的形成,以及实现意料之外的发现。

在大规模巡天、公众科学和机器学习盛兴的时代,天文学应该期待预料之外的发现。天文学的发展不仅依靠长时间以来理论和观测间的调解,也大大得益于意料之外的发现。过去二十年间,哈勃望远镜出色地完成了它最初的目标,但它同时也发现了环绕年轻恒星的电离原行星盘,揭开了暗能量的面纱,并且向我们展示了天空中看似漆黑空旷的区域其实也点缀着无数星系。当哈勃望远镜刚发射升空时,没有人会预料到这些发现。

随着科技的迅速发展,天文学进入了大数据时代。高分辨率成像技术和新的数据收集技术让天文学家能以前所未有的速度收集并储存大量的数据。他们往往会淹没在这些数据中而没有足够的时间去处理它们。所以,大数据天文时代需要一种处理数据的全新方式,而天文学家现在也正在努力改善他们的方法,希望能提高他们做出意料之外发现的机会。天文学中许多意想不到的发现都直接得益于新技术的发展。

伽利略的望远镜让人们第一次能够以全新的角度观测天空,从而发现令人震惊的惊喜。几个世纪后,哈勃望远镜让天文学家能够更进一步的看入深空,揭露无法想象的奇妙现象。现在,天文学家雷·诺里斯将使用射电对宇宙进行一项新的调查。宇宙演化图(Evolutionary Map of the Universe, EMU)项目使用澳大利亚平方千米阵列对夜空中的射电源进行研究。

它的目标是在比之前任何尝试更广的视场中寻找更微弱的射电源。目前已知的射电源大概在二百五十万个左右,而EMU项目预期另发现七千万个。射电源通常都位于最具活力和爆炸性的天体中。EMU项目期望能够通过发现大量早期宇宙中的天体来解释最初的恒星和星系是如何形成的。诺里斯已经花了许多时间来思考该如何实现那些意料之外的发现了。

为了寻找这些意料之外的发现,诺里斯正着手于一个称为宽场异常值探测器(Widefield ouTlier Finder)的项目。这个探测器明确的目的便是使用云计算和复杂的算法,从海量的数据中筛选出异常值,有效地减少数据量。如果你找不到什么新的目标去观测,那就尝试看得比其他人都更仔细吧。当乔斯林·贝尔还是剑桥大学的一名研究生时,她被分配到一项研究类星体数据的任务。

在众多信号数据中,她注意到有一个信号源变化的速率太快,不像是类星体。于是她便发现了脉冲星。这种方法是许多研究的基础,例如大型综合巡天望远镜(LSST),它每隔几晚便将整个天空勘测一遍。LSST计划于2021年投入使用,届时起LSST将会向天文学家提供持续不断的详尽的巡天数据。LSST的宽场视野可以装下40个满月,在如此宽的视场中,LSST将会在从可见光到近红外的几个不同波段拍摄照片。

每个天晴的晚上,LSST就会记录下超过30TB的数据。在它预计10年的工作时间中,它将对天空的每块区域进行超过一千次的拍摄,对大约四百亿天体进行超过三万亿(3×10^12)次观测。很显然,这种观测的方式会把那些亮度变化显著的天体区分出来,例如脉冲星,超新星,类星体等;同时,它也会把移动的天体给区分出来,比如小行星或是其他在我们太阳系中的小天体。科学家希望LSST还能找出除了这两种方式以外的变化。

大规模巡天以前当然也进行过,只是从未到达过LSST这种程度。在LSST之前,最大一次规模的巡天是斯隆数字化巡天(Sloan Digital Sky Survey, SDSS),但SDSS只对四分之一的天空进行巡天。和SDSS比起来,LSST使用的望远镜几乎要大三倍,分辨率高两倍,能探测的光谱波长范围也更大,并且目标是整个天空。

有了LSST如此高的数据收集效率,研究人员将可以依靠它在影像方面保持前列。为此,LSST的科学家们设计了一套系统,它可以在一分钟内识别出两张图片中改变的部分。当然,找到哪里变化了是一回事,理解这变化背后的原因就是另一回事了,科学家仍需花上很多时间来做分析。

UUID: 19e44263-2d20-4019-b997-baa973144fca

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/中科院物理所公众号-pdf2txt/2018/中科院物理所_2018-10-01_「转」从海量数据中寻找未知.txt

是否为广告: 否

处理费用: 0.0051 元