因为这个数字，物理学家无数次陷入困境

费米实验室的缪子磁矩实验结果，是否为新物理学的存在提供了更坚实的证据？这个问题的关键，就在于实验结果的置信度能否达到5σ。粒子物理学家在实验中一直坚持着5σ的准则，不是他们比其他学者更严谨，而是因为他们已经被实验数据欺骗过太多次。

在这篇选自《环球科学》8月新刊的文章中，物理学家霍森菲尔德就讲述了关于5σ的故事。2001年，美国布鲁克海文国家实验室的科学家在一次实验中首次发现了缪子反常现象。20年来，缪子磁矩的计算值与实验测定值之间的微小偏差一直维持着3.7σ左右的置信度，这代表着99.98%的置信水平，或者说这一偏差有大约1/4500的几率来自随机波动。

最近，费米国家实验室公布了在伊利诺伊州巴达维亚进行的缪子g-2实验的结果，该结果将上述偏差的置信度提高到了4.2σ，也就是大约99.997%的置信水平，这意味着观察到的偏差只有大约1/40000的几率是巧合所致。费米实验室新的测量结果本身其实只有3.3σ的置信度，但由于它重现了布鲁克海文国家实验室先前的发现，所以综合置信度提升到了4.2σ。

尽管如此，这仍未达到粒子物理学界宣称新发现所要求的阈值——5σ。

人们对这一结果寄予厚望，因为它有可能最终打破已经存在50年的粒子物理标准模型。该模型集合了已知的物质基本成分，目前包含了17类基本粒子，其中大多数都不稳定，无法从身边常见的物质中找到。这些不稳定的粒子诞生自高能事件，比如宇宙线撞击上层大气；它们也可以由实验室的粒子碰撞实验制造出来，例如费米实验室中测定缪子磁矩的实验。

缪子是最早为人类所知的不稳定粒子之一，其发现可以追溯到1936年。它是电子的加重版本，和电子一样带有负电荷。缪子的寿命约为2微秒，这在粒子物理学家眼里已经是很长的时间了，因此这种粒子能够得到精确测量。缪子的磁矩决定了其自旋轴绕磁力线运行的速度。为了在费米实验室进行测量，物理学家制造出缪子，并用强磁铁将它们约束在直径约15米的圆周上运动。缪子最终会衰变，由衰变产物的分布就可以推断出它们的磁矩。

本次测量的结果通常被称为“g-2”，其中“g”代表与磁矩相关的g因子，“2”则意味着这个值接近于2，而与2的偏差就来自物理学家感兴趣的量子效应。这些效应来自包含了所有粒子的真空涨落，但这些粒子是以虚粒子的形式存在的：它们只会短暂出现，随即消失。这意味着，如果实际存在的粒子类型比标准模型里的更多，这些粒子就会导致缪子的g-2异常。

因此，测量结果与标准模型预测值的偏差意味着可能存在未知的粒子，或者是全新的物理现象，如额外的空间维度。

那么，我们如何看待此次4.2σ的偏差呢？首先，粒子物理学家最初使用5σ标准不是毫无理由的。究其原因，并不是粒子物理学在本质上比其他科学领域更为精确，也不是粒子物理学家在实验方面做得更好，而主要是粒子物理学家需要处理很多数据。经手的数据越多，就越有可能产生看起来像是某种新发现的随机波动。

粒子物理学家在20世纪90年代中期开始普遍使用5σ准则，以免太多“发现”日后被证明只是统计波动的结果。但是，5σ只是一个人为设定的分割点，粒子物理学家也会讨论远低于这一界限的异常现象。事实上，在过去这些年里，有相当多的3σ和4σ异常现象出现后又消失。

以希格斯玻色子为例，1996年，欧洲核子研究中心（CERN）的大型正负电子对撞机（LEP）就出现过一个置信度约为4σ的信号——但随后这个信号又消失了。最终，是LEP的后继者大型强子对撞机（LHC）成为了希格斯玻色子的发现者。同样在1996年，夸克亚结构以3σ左右的置信度被发现，但最终被证明又是一次乌龙。

2003年，物理学家利用LEP发现了超对称性（一种标准模型的拓展猜想，将引入新的粒子）存在的迹象，置信度约为3σ，但很快就消失了。2015年，LHC中出现了双光子异常，它在消失之前徘徊在4σ附近。

还有一些发现的置信度达到令人震惊的6σ，不过仍未得到证实，例如1998年在费米实验室的万亿电子伏特加速器（Tevatron）上发现的“超级喷流”——直到今天也没有人知道它到底是什么，以及2004年在德国的强子电子环加速器（HERA）上观测到的五夸克态（直到2015年，五夸克态才真正被探测）。

这段历史可以帮助你衡量一个具有4.2σ置信度的粒子物理学发现的重要程度。

但无论如何，对于g-2的反常现象来说，有利的一方面是，它的置信度正随着接连不断的实验而变得更强，而不是更弱。这种反常的持续存在意味着什么？在低能态下的高精度实验，例如g-2，可以作为高能态实验的补充。它们可以提供类似的信息，因为从原则上来说，所有高能态的粒子作用在低能态也会出现，只是会变得非常微弱——这是指实验值和理论值在小数点后11位才出现差异。

实际上，这意味着对理论预测值的计算必须精确到能够涵盖许多微弱的粒子作用，这样才能达到所需的精度。在粒子物理学中，这些计算是用费曼图完成的。费曼图是一种由节点和连线构成的图，表示粒子及其相互作用。作为一种数学工具，它可以用来记录需要计算的积分。费曼图越大、越多，计算就越复杂，精度也更高。对于缪子g-2实验，物理学家需要计算超过15 000张图。虽然计算机帮了大忙，但这项工作仍极具挑战性。

强子的作用尤其令人头痛。强子是由几个夸克通过胶子结合形成的复合粒子，计算这些粒子对g-2值的贡献极其困难，这也是理论计算中最大的误差来源。

还有各种各样的交叉测量也可能导致误差，比如依赖于其他常数（包括轻子的质量和耦合常数）数值的理论预测。因此，偏差的出现很可能意味着标准模型的计算出了问题，其中强子作用是首要的可疑因素。但也存在这种可能：缺陷出自标准模型本身，而不是计算过程。

偏差也可能来自新粒子——超对称粒子是最热门的候选。这种解释的问题在于，超对称性并不是一个独立的模型——相反，这是一个源自大量模型的属性，而不同模型会给出不同的理论预测。此外，对g-2值的贡献还取决于所假设的超对称粒子的质量，而这也是未知的。所以，现在还无法将偏差归因于超对称性。

因此，费米实验室最近的高精度缪子磁矩测量是一项了不起的实验成就，但是现在就宣布标准模型已被打破还为时过早。