科学家对数据也会有偏见吗?

作者: Manuel Gnida

来源: http://www.symmetrymagazine.org/article/the-facts-and-nothing-but-the-facts

发布日期: 2017-05-21

本文讨论了科学家在数据分析中可能存在的偏见问题,以及如何通过盲法分析来减少或消除这种偏见。盲法分析在科学研究中应用广泛,尤其是在粒子物理学和天体物理学中,它帮助研究人员在复杂的实验数据中寻找新发现,同时避免个人期望影响结果。文章还介绍了不同的盲法分析方法,如“黑箱子”和“加盐”,并探讨了盲法分析在未来的太空巡天和暗能量研究中的重要性。

科学实验的意义在于检验事实,在对实验数据进行复杂的分析过程中,存在着这样一种风险:研究人员会无意中将分析结果与自己的期望值靠拢。上世纪,包括费曼在内一些物理学家开始意识到这类令人担忧的问题:对基本物理常数的最新计算中,结果通常更接近已发表的数值,而非考虑了标准测量误差后所预期的值。他们意识到,研究人员更倾向去“认可”过去的结果,而非反驳它们,因而不符合他们期望的结果经常被系统性的排除或修改。

为了减少或消除这种潜在的偏见,研究员们开始将“盲法分析”应用到科学研究中。最常见的盲法研究应该是在药物临床试验中的使用,患者在不知情的情况下服下实际药物或安慰剂。这种方法能帮助研究人员判断治疗的结果是源自于治疗本身还是患者认为接受了治疗的信念。

除此以外,盲法研究在粒子物理学和天体物理学中也运用广泛。这个方法的价值在物理学家们试图寻找到隐藏在背景噪声中的微小的效应时更尤为突出,因为问题的关键在于找寻现有模型中没有考虑到的新事物的存在。例如大型强子对撞机(LHC)实验中发现的希格斯玻色子,以及升级后的LIGO探测器侦测到的引力波。

Kavli粒子天体物理学与宇宙学研究所(KIPAC)最近举办了一次关于盲法分析的研讨会,主旨是讨论如何避免研究人员的期望影响分析结果。KIPAC的博士后伊利莎白•克劳斯(Elisabeth Krause)是这次研讨会的主要组织者,她探讨了如何将盲法分析与下一代天文观测结合,从而能更精确了解宇宙是由什么构成的,以及宇宙演化是被如何推动的。

她说:科学分析是个迭代的过程,过程中我们会对理论模型进行一系列微小的调整,直到模型能准确的描述实验数据。我们所掌握的先验知识在每个分析步骤中都有可能引导我们进行调整的操作,而盲法分析则有助于我们做出独立和更好的判断。

这次研讨会的其中一个结果是发现:盲法研究中不存在一个对任何实验都完全通用的万能方法,每个实验盲法分析都需单独设计。并且盲法分析不代表“全盲”,也需根据每个实验的数据类型,留下足够研究人员进行有效分析的信息。一种常见的方法是将分析仅基于一部分数据,去除会被隐藏的异常部分。被排除的数据被称作“黑箱子(black boxes)”。

就拿希格斯玻色子的搜索过程为例:通过分析LHC在2011年年底前收集的数据,研究人员发现一个异常凸起,这可能代表了一个质量约为125GeV的新粒子的存在。当他们看新数据时,故意“隔离”了这个凸起周围所代表的质量范围(关入小黑箱),只分析余下的那些能确保使用的模型足够准确的数据。然后他们“打开箱子”,将同样的模型应用到这些未触动过的区域,发现那个凸起正是我们苦苦寻找的希格斯粒子。

对希格斯粒子研究者来说,“黑箱子”方法很有效。但是,研讨会上一些参与到大型地下氙实验(LUX)的科学家表示,“黑箱子”方法不适用于分析LUX实验,因为如果故意不看的数据中有包含对了解、完备理论模型很关键的异常事件,那么问题就来了。LUX最近完成了世界上最灵敏的搜索之一——对暗物质的假想粒子WIPM的探测。LUX的科学家已经做了大量的工作来确保LUX免受背景粒子的影响。

他们将探测器置于无尘室中,用净化过的液体填充探测器,将其包围屏蔽并放置在离地面一英里的地下。尽管如此,仍有少数杂散粒子存在,因此科学家们则需要查看所有的数据来找到和排除这些粒子。LUX研究人员选择了不同的盲法进行分析。他们使用的不叫“黑盒子”,而是一个叫做“加盐(salting)”的过程。他们让没有参与到最新的LUX数据分析的科学家在数据中认为的添加一些事件,让这些事件看起来与真实的一样。

就像盲法药物试验中的患者一样,LUX的科学家不知道他们正在分析的是真实数据还是“安慰剂”数据。一旦分析完成,那些“加盐”的科学家再透露出哪些事件是虚假的。LIGO的科学家就使用了类似“加盐”的技术,这个方法最终让他们首次探测到在时空中微不足道的涟漪——引力波。

此次KIPAC举办的盲法分析研讨会专注于未来的太空巡天,包括对暗能量和宇宙微波背景辐射(CMB)进行前所未有的测量,这些结果将极大的帮助宇宙学家更好地理解宇宙的演化。暗能量被认为是导致宇宙加速膨胀的神秘力量;CMB则是散布在整个天空中的非常微弱的微波,它是宇宙中最古老的光,在宇宙诞生后的约38万年的时候出现。

为了揭开暗能量的神秘属性,暗能量科学合作(DESC)正在准备分析从大型综合巡天望远镜(LSST)中得到的数据。凭借LSST独有的3.2千兆像素相机,数十亿星系都能被观测到,而这些星系的分布被认为受到暗能量的强烈影响。

克劳斯也同为DESC的成员,她说:盲法将帮助我们寻找那些独立于过去研究中众所周知的宇宙学含义的星系的性质。DESC的计划是在研究人员进入分析前,扭曲星系的图像,对成员的先前知识进行盲化。但并不是科学界的所有人都相信盲法是必要的。盲法分析比非盲分析更为复杂,且需要花费更多的时间才能完成。因此参与盲法分析的科学家不可避免地需要花更长的时间处理假数据,这让他们觉得是种浪费。

然而还是有许多人提倡使用盲法,KIPAC的天体物理学家阿伦•卢德曼(Aaron Roodman)在过去20年中一直使用盲法分析。他说:盲法分析在粒子物理学中已经变得相当标准。它们对下一代宇宙学研究中去除偏见至关重要,特别是当研究成本很高时。例如,我们只会建造一个LSST这样规格的望远镜来让我们看到前所未见的景象。

UUID: cac25f50-1c1a-402a-a029-245478bba099

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/原理公众号-pdf2txt/2017年/2017-05-21_科学家对数据也会有偏见吗?.txt

是否为广告: 否

处理费用: 0.0053 元