在《“慧眼”卫星的在轨交付离不开Ta,未来产出成果更离不开Ta》一文中,我们介绍了天文学研究中非常重要的数据科学。今天,我们仍以硬X射线调制望远镜(HXMT)卫星为例,为大家讲述它是如何用数据“看”宇宙的。硬X射线调制望远镜是天文台级空间天文卫星。它的名字是望远镜,然而事实上,卫星上搭载了高能望远镜、中能望远镜和低能望远镜三台望远镜载荷。三台载荷都由不同视场准直器单体组成,区别主要在于探测器。
高能望远镜采用碘化钠/碘化铯复合晶体闪烁体探测器,能将高能X射线、伽马射线的能量吸收后,以低能光子的形式再把能量释放出来。接下来,通过光电倍增管把低能光子转换为电信号,就可以间接探测到高能光子的到达时刻和能量。高能望远镜探测20keV以上能量的X射线。中能望远镜和低能望远镜分别采用不同类型的半导体探测器,探测5keV~30keV和1keV~15keV能量范围的X射线。
在数据分析方法的层面上,高、中、低能三台望远镜没有本质区别。因此,接下来我们以高能望远镜为例,进一步展开介绍硬X射线调制望远镜的科学数据分析。CT的中文名是计算机断层扫描成像。这和硬X射线调制望远镜的扫描观测模式十分接近。区别在于,CT是把样品(比如患者)放在中心,射线源和探测器绕着样品转,所成图像反映样品断层不同位置对射线的吸收率或者透过率。
望远镜的扫描在几何意义上相当于从样品(比如银河系)内部扫描,所得图像反映样品沿着视线方向投影到某个单位球面上的亮度分布。准直器本质上就是一根中空的管子,用X射线不容易穿过的材料制成。
当准直器正对X射线源时,能够穿过准直器并到达探测器的X射线光子最多;当准直器略微偏转时,X射线光子计数率(单位时间的个数)随之下降;当准直器偏转角度大到一定程度时,X射线光子就无法通过准直器的孔径入射了,而只能在内壁散射或者从外壁穿透到达探测器,计数率也因此显著降低。
因此,我们用准直器一边旋转扫描并记录每个时刻准直器指向与初始指向的夹角,一边记录每个光子到达探测器的时刻,就完成了对X射线源的扫描观测,并取得了观测数据——光子到达事件与探测器状态时间序列。我们把时间轴划分成等间隔的时间段,并累加出每个时间段内到达的光子个数。也就是说,每个时间段内到达光子个数就是随着探测器指向变化的函数。推广一步来说,观测数据可以表示为探测器状态的函数。
上面的图反映了给定的观测模式、探测器对给定位置的单个点状X射线源的观测输出。数据分析中,我们把它称为“探测器响应”。根据准直器的设计,我们可以根据几何参数和材料特征,预先估计得到探测器响应的理论模型。发射之前,我们在地面预先通过标定实验,标定了探测器的特性(例如探测效率、空间响应、能量响应等),并与理论模型相比较,从而检验理论模型是否全面、准确。发射之后,我们还将在轨开展标定实验,不断修正模型。
这样,探测器响应大体上可作为带有一定不确定性的已知函数。探测器响应、观测数据,是我们推算目标特征的关键。假设有一个建有游泳馆的小镇,“观测数据”就是我们每天记录下来的小镇游泳馆门票销量,“探测器响应”主要描述实际入馆游泳人数和门票销量之间的对应关系,我们需要从这些信息中,来推测出,游泳爱好者团体的成员数量变化以及锻炼强度变化等“目标特征”。
对目标特征(未知)、观测数据(已知)、探测器响应(部分已知),我们可以建立一个方程,来求解未知的目标特征。习惯上,我们将这个方程称为调制方程,求解调制方程,也就被称为解调。这也就是硬X射线调制望远镜和直接解调方法这两个名词中“调制”和“解调”的来历。
如果目标特征描述的是目标的空间亮度分布(也就是图像),那么解调过程就是成像过程;当然,我们也可以利用类似的手段,来重建目标的能谱(也就是光谱,目标在不同能量段的亮度变化)、光变(也就是目标亮度随时间的变化)。当然,上面介绍的内容是极大简化之后的理想情形,实际工作中要考虑的因素更多,情况也更为复杂,但基本逻辑和原理是清晰的。
工程中,硬X射线调制望远镜卫星工程除了包含卫星、运载、发射场、测控等大系统之外,还包含地面应用系统。地面应用系统中的科学应用部分就负责科学数据分析。该部分包含科学支撑分系统,负责研究本底估计方法、观测模拟方法以及解调方法,并开发相应的软件。实际工作中,我们采用了一些具体方法,来解决上述简化情形没有涵盖的具体问题。
例如,尽管望远镜专门配备的探测器来测量本底,但是考虑到不同成分的本底,以及探测器之间的个体差异,我们仍然设计了多种在轨实验方案和数据分析方法,来估计望远镜探测过程中的本底——还记得前面的小镇游泳馆模型吗?再比如,实际的调制方程维度高、复杂性高,这样依赖,解调的计算需求就很突出。因此,我们基于机器学习、压缩感知等技术,设计了自适应的快速算法。
过去,利用美国、欧洲或者日本的望远镜开展研究工作时,我们不需要系统性的设计数据分析方法、也不需要开展工程化的科学数据分析软件开发。但现在,我们开始自顶向下设计、建造自己的望远镜了,可谓顶天(从顶层科学目标出发)立地(落实到工程、设施、仪器)。自然地,我们也要系统性的设计为它量身定制的数据分析方法,开发数据分析软件。
在笔者看来,这个过程尽管需要在不断摸索中前进,又没有短期回报,但对于人才队伍的建设,乃至建立更为全面研究人员考评体系,使之与“顶天立地”的研究模式相匹配,是十分必要的。