2017年6月15日,硬X射线调制望远镜卫星(HXMT)成功发射;2018年1月30日,卫星成功在轨交付。其实,发射成功只是第一步。为了顺利在轨交付,需要对硬件和科学载荷分别进行测试,其中重要的工作就是结合在轨实验数据完善数据校准流程。这就要说到在天文学研究中举足轻重的数据科学。
要建造一台望远镜,一般来说,流程是这样:天文学家提议建造望远镜,天文学家和工程师共同设计望远镜,工程师建造望远镜并交付天文学家,望远镜开光(与寺庙无关)后投入使用。从17世纪至今,望远镜越造越庞大,所需资源不断上涨,论证、设计、建造和使用过程也日益复杂。一方面是因为天文学本身就是观测驱动的,另一方面则是得益于人类社会也在不断发展。
以2017年6月15日发射的硬X射线调制望远镜卫星为例,在20世纪90年代提出设想之后,便是研发和论证两条腿走路。其中,卫星平台负责科学载荷的供配电,负责实现导航制导与控制。不同单位承担不同的工作,而卫星总体又要与运载、发射场、测控等其他系统协同工作。
望远镜建成并投入使用后,天文学家将利用它进行天文观测,并基于观测数据,进行科学研究。这个过程中,最为核心的问题就是观测时间的分配。有限的望远镜、探测器总是无法满足同时在所有波段观察所有目标的需求,因此,观察什么/不观察什么、什么时候观察、用何种模式观察,等等,都与望远镜有限资源有限寿命能取得的科学产出有关。
在X射线天文学中,望远镜的观测时间分配和观测数据获取都具有显著的开放性,这或许与X射线天文学足够年轻有关吧。天文学与数据科学在天文观测中,观测数据本身并不带来知识,但它是知识的基础。观测数据除了包含来自天体的信息,更与观测过程和探测器有关。探测器能力越来越强,观测过程也越来越复杂,积累的观测数据堪称海量。天文数据分析的模式也在悄然发生改变。
现代天文学的数据分析需求日益强烈,且与统计学、计算科学等不断交叉。例如,预计将于2020年出光的平方公里射电望远镜阵(SKA),则必须采取必要的在线数据分析了,因为SKA需要用上千台射电天线,合成相当于一平方公里有效面积的望远镜,数据产生速率实在太快。数据分析领域面临如此挑战,以至于引起了高性能计算领域的持续关注。
文章开篇提到,望远镜卫星要想产出成果,发射成功只是第一步,相信读到这里,您一定明白了,在轨交付也不是最后一步。未来要想获取科学成果,依然离不开Ta——数据科学。