以我们现有技术手段,弦论做出的预测都是无法通过实验验证的。这种情况令弦论遭受了大量批评。对于许多物理学家和哲学家来说,一个理论无需实验验证,就意味着放弃了科学的底线。另一方面,弦论的拥护者则在用它的几个内在属性为它辩护。围绕弦论的争议引出了一个根本性问题:我们是不是需要重新定义何为科学?《科学美国人》西班牙版分析了这些争论的前因后果。
是什么让人们认定一个理论是科学,而不仅仅是猜测?
科学家根据什么标准判断某种理论比另一种理论更可信?尽管对任何一种科学理论的评估都隐含着这样的问题,但传统上只有科学哲学关心它们,并给出了明确的答案。然而,近些年在理论物理学家之间的一场激烈辩论中,这些问题成为了焦点。物理学家争论的是,他们中的部分人对某些理论的支持到底有没有道理。这些理论包括弦论、多重宇宙等,它们的共同之处是不能通过实验来验证,至少用现有的技术手段没法验证。
维也纳大学的物理学家、科学哲学家理查德·达维德(Richard Dawid)在2013年出版的《弦论与科学方法》中主张,要评判一个理论可以有一系列标准,而不是只有实验这一个方法。在达维德看来,符合这些标准的研究就是好的科学实践,而高能物理学因其本身的特性尤其适合这类标准。此外,在科学史上,虽然例子不多,但其他学科也曾以此为依据支持某些理论。
而在弦论这个具体的例子中,这种标准表明部分物理学家对弦论支持是合理的。
当然了,不是所有人都支持这种观点。2014年,开普敦大学的宇宙学家乔治·埃利斯(George Ellis)和巴黎天体物理研究所研究员乔·斯尔克(Joe Silk)在《自然》上发表的一篇文章得到了广泛关注。他们认为,正是因为弦论,物理学正在渐渐偏离它的根基——通过实验验证理论,而这是非常危险的。埃利斯和斯尔克的评价,以及其他针对弦论的严厉批判,得到了许多物理学家和哲学家的赞同。
这样的争论虽然已经不算新鲜,但近年来似乎愈演愈烈。2015年12月,一些物理学家和哲学家在慕尼黑召开了一次会议,来讨论这些问题。这场争论的根源是一个非常基础的问题——我们究竟该如何理解科学。对于有的人来说,支持那些不可通过实验验证的理论可能会危及科学的完整性。可是,对于另一些人来说,这恰恰预示着一场变革——也就是说,我们有必要重新定义科学了。
弦论是数学复杂程度最高的科学理论之一。
它的目标是用一维的微观实体(弦)及其振动模式来统一描述所有的基本粒子和相互作用。研究弦论的人都对这个理论非常有信心,即便弦论目前还未完成,研究者仍坚信这是基础物理学中最有野心、也最有可能成功的理论。这在很大程度上是由于弦论有望解决20世纪物理学的两大支柱,也就是量子力学和爱因斯坦广义相对论无法兼容的问题。
而肩负如此期待的弦论受到的批评可能会让你感到惊讶:有人认为它不能通过实验得到验证,甚至还有人指责它根本不能做出可验证的预测。
对弦论的批评包括两个方面。首先,弦论做出的大部分预测影响的都是极高的能标,我们现有技术所能探测的能量与之相差甚远。事实上,人类可能永远都无法触及那么高的能标。比方说,弦论的有限扩展只能在普朗克能标上造成可直接观测的效应,而我们目前在欧洲核子研究中心的大型强子对撞机上进行的实验,能量大概只有普朗克能标的1015分之一。
但更糟糕的是,弦论的一些推论并不仅仅因为实验问题受到批评,在理论层面上也存在争议。弦论预测,基本的自然常数不是唯一的,而是分布在一片辽阔无比的“景观”上,这意味着,可能存在近乎无穷多个具备不同基本自然常数的宇宙。在这样的情况下,批判弦论的人在最近几年中变得越来越多,他们不再只是质疑弦论本身了(这是科学界中常见的事),而是开始认为弦论根本不是真正的科学理论。
他们批评支持弦论的观点的合理性,并隐晦地质疑用于评判弦论的标准是否真的适合用来评价一个科学理论。
不难想象,这样的指控对于任何一个理论来说都是无比严重的,严重到令我们思考,我们所理解的科学是不是已经到了需要重新定义的时候?非常严重,没错,但这样的情况在物理学历史上并不罕见。
波普尔的评判标准要更好地理解这场争论,我们必须知道当代多数科学家和科学哲学家在评判一个科学理论的时候,采用的标准方法是什么。应该强调的是,按照通常的理解,这种方法并不是我们平时说的科学实践的一部分,但它是科学方法论的一个重要的基本特征。这套方法常被当作评判理论的标准,也就是说,不符合其要求的理论就不能称之为科学。
这种评判方法最初是奥地利哲学家卡尔·波普尔(Karl Popper)在20世纪30年代提出的。按照这种方法,科学理论与其他猜测之间的本质区别就在于可证伪性:前者能做出可通过实验来验证的预测,如果理论做出的预测被驳倒,那么这个理论就被“证伪”了。正是这种方法把广义相对论(做出了可用实验检验的预测,比如水星近日点的进动和最近被发现的引力波)和精神分析之类的理论(波普尔也举过的例子)区分开来。
另一个反面例子是伪科学,尽管它们看似能够做出预测,但是它们还是无法满足可证伪性的标准,这是因为它们的预测根本站不住脚。
毫无疑问,可证伪性标准捕捉到了实验科学的几个要点。但是,波普尔自己也知道,他提出的方法并不是毫无缺陷的。如果我们把这个方法当作评判标准来使用的话,也会出现一个关键问题:在推导预测结果的时候,辅助假设总会起到干扰作用,而恰恰有可能是因为这些假设,预测才会失败。而且,科学史告诉我们,这种“防御机制”——也就是说,在某些情况下接受理论的错误预测,经常会给我们带来可能在将来得到验证的新假说。
暗物质就是一个这样的例子,它最初看似是引力理论的错误预测,但它本身最终成了一个新的研究领域,做出了大量新的预测。尽管如此,我们还是可以认为,除了一些细节问题,科学理论的精髓就在于它的预测能力,而且必须根据这一点对它进行评估。
难以检验的弦论毫无疑问,当前弦论争议的焦点——如何评判科学理论,与波普尔提出的方法密切相关。虽然波普尔在物理学家中享有非常高的声誉,但是他提出的理论并不足以解答有关弦论的疑问。主要的障碍在于,可证伪性标准不能区分可信程度不同的理论。
与弦论的预测能力相关的问题有两个,它们相互联系,但是又互不相同:一个是弦论做出预测的能力;另一个是我们验证预测的能力。确实,弦论的某些方面似乎不能给出任何具体的实验预测。弦论预测,存在数十亿个具有不同自然常数的宇宙,但是,我们似乎无法证明它们存在,也无法得知我们的宇宙是否其中之一。
弦论能否做出预测与科学性的标准直接相关:如果弦论不能做出任何可验证的预测,那么物理学家肯定会达成共识,宣布弦论不是科学。然而,这样的事并没有发生。弦论确实做出了预测,或者说,至少大多数人都是这么认为的。但是,它做出的预测涉及的能标太高了,远远超出了我们目前最强大的技术手段所能探测的范围。
因此,问题其实不在于弦论是否是科学理论。真正的问题是,根据我们现有的,以及未来将得到的实验数据来判断,众多物理学家对弦论的信心是否有道理。毕竟,对弦论的支持也意味着要付出巨大的财力、精力和脑力去研究它。换句话说,我们该不该相信弦论很有可能充分地描述自然?我们是否应该认为弦论在某种意义、某种程度上是正确的呢?
达维德的建议针对的就是这个问题。
他认为,要想理解弦论的支持者与反对者之间的争论,我们应该考虑到,支持弦论的人使用了一系列评价标准,但是反对弦论的人不愿接受这种标准。可能是因为反对者没有意识到这些标准已经发生了变化,或者至少某些标准的相对重要性有了变化。如果我们能认识到用来评估理论的标准必将随时间演变,也就不会因为后面这点而惊讶了。
特别是自从20世纪下半叶以来,在粒子物理学界,对于一些没办法直接用实验来验证的理论,研究者已经开始把它们的某些特征视为有效性的依据。
但除了实验之外,还有哪些特征能表明一个物理理论是有效的呢?它们有什么性质?有多可靠?这些问题就是达维德研究的核心。要分析这些标志,首先我们应该先了解另一种实证理论——贝叶斯主义。近几十年来,这个理论在科学哲学领域得到了相当程度的重视。
贝叶斯主义的主要思想很容易解释。假设我们能够给一项科学假说指定一个概率(这个概率可以理解成我们对这个理论的信任程度,它是我们主观且理性地指定的,而且要根据实验证据做出修正)。一旦我们指定了概率,我们就可以提出这样的问题——随着理论做出的预测逐渐得到证实,这个概率将如何变化呢?
概率论中有一个贝叶斯定理,说的是如果我们从某个假说中推测出了一种预测结果,那么这个假说为真的概率会随着预测结果得到证实而升高。
我们可以把贝叶斯定理理解成公式化的传统理论评判方法,或者按达维德的说法,经典的科学范式——预测得到验证可以证实一个理论,也是检验理论的唯一手段,这在某种意义上说,也就是预测得到验证会提高理论为真的概率。
但是,这就是贝叶斯定理的唯一作用吗?达维德认为,贝叶斯定理的意义不仅限于实验验证。某种理论,例如弦论无法通过实验验证,是因为出于某种原因,它所作出的预测无法用实验来检验。那么,物理学家要怎样评判它呢?毫无疑问,如果我们坚持认为通过实验验证一个理论的预测是证实它的唯一手段,弦论就永远无法符合标准了。那么,弦论还有什么别的特征可供我们利用呢?
实验之外的证据还有别的原因让物理学家拥护弦论。首先,在支持者看来,弦论是目前唯一一个能把包括引力在内的所有已知相互作用统一起来的方案。的确,也有其他一些理论试图将引力和量子力学结合起来,比如圈量子引力,然而,弦论是唯一一个有望成为真正的“万物理论”的。这是第一个支持弦论的非经验主义论据,也就是达维德说的“缺乏替代理论”。
总的来说,我们在寻找量子引力理论的过程中遇到的主要问题就是计算中出现的无穷大。其他理论也曾遇到这种问题,比如电动力学和量子色动力学,但物理学家使用一种叫做重正化的方法消除了无穷大。然而,当物理学家在引力场中使用重正化方法时,所有的尝试都未能成功。弦论将点状的粒子替换成一维的弦,解决了这个问题。一方面,弦的一种振动模式就是引力子;另一方面,弦是有长度的,并非无穷小,因此也就避免了计算中的无穷大问题。
而除此之外,弦的其他振动模式可以容纳更多的粒子及其相互作用,这使得弦论有潜力解释任何出人意料的结果。
所以说,虽然我们最初研究弦论的原因之一,是为了解决量子引力理论遇到的问题,但该理论的后续进展表明,它还有能力解答更多的问题,例如推导出不同的相互作用(而不仅仅是统一它们),或是解释黑洞熵等现象。在原本的目标之外,弦论意外地可以解释众多其他现象。这一特性显然是弦论的优点。达维德称这个支持弦论的论据为“意外的解释性联系”。
最后,弦论可以看成是在粒子物理标准模型的基础上建立起来的,诞生于20世纪的标准模型是现代物理学史上最伟大的成就之一。可以说,物理学家一开始也是为了解决技术性问题而提出标准模型的。然而,这个模型后来逐渐展现出更强大的、没有其他理论可以媲美的解释能力,最终还成为科学史上得到最严格验证的理论。标准模型获得了巨大的成功,如果弦论也有同样的优点,我们是否可以据此推断弦论也有可能成功呢?
达维德认为这个问题的答案是肯定的,这就是第三个论据,基于过去理论成功的“元归纳”。
这些论据就是弦论拥护者支持它的主要理由。但是,另一方面,反对弦论的人认为这些论据都是站不住脚的,而且总是抓住弦论无法通过实验验证这一问题不放。而达维德的核心观点是,上面所说的这些论据都不是间接证据,也不仅仅是主观判断,而是基于所谓的真实非经验主义评判标准。如果的确如此,一个理论在通过实验验证之前,物理学家就能够完全根据理论标准对它做出评判了。
恰恰是这种过度自负,招致了大量批评,同时也激发了对弦论的攻击。因此,对弦论的拥护者来说,当务之急是证明这些论据是合理的,并确定它们是基于什么原理。
无可替代的理论现在让我们来思考一下刚刚提到的三个论据。首先要强调的是,这三个论据的性质是不一样的。第一个论据认为,找不到可以替代弦论的理论表明它是可信的;第二个论据强调了弦论的本质属性,也就是它的解释能力;第三个论据从之前一个理论的成功出发,推断出了弦论成功的可能。分开看的话,这几个论据似乎并没有什么说服力。
达维德工作的原创之处,并不是用这些论据支持弦论,而是指出,这些论据指向弦论的一种“暗藏”的属性,而这种属性的存在可以证明弦论是正确的。也就是说,这些论据的实际作用是展示了理论的某些特性,而这些特性就是这个理论获得证实的标志。
让我们来仔细分析一下这个结论。只有缺少替代理论意味着替代理论不可能存在的时候,第一个论据才站得住脚。
如果没有替代理论只是一个偶然事件,是因为物理学家缺乏想象力的话,这个论据也就不能真正成立了。基于弦论解释能力的论据也是如此,因为它也是根据弦论对同一种现象解释比别的理论更优秀、更完整也更全面,来判断弦论是合理的。因此不难发现,两个论据要成立的话需要同一个前提——能对同类现象做出解释的理论非常少。
缺少替代理论和解释能力更强,当这两个论据表明能给出同样结论的理论数量极少时,我们才能把它们当成支持一个理论的依据,并遵循贝叶斯定理的逻辑,证实这个理论。
弦论的拥护者认为它是目前我们所知的理论中唯一一个有潜力成为真正的“万物理论”的。20世纪90年代,研究者通过“对偶性”(数学上的等价性)把5种弦论分支相互联系起来,增强了物理学家对弦论的信心。如今,研究者认为,这些分支理论其实是一个基础理论的特殊情况,他们称这个基础理论为M理论。不过,M理论的方程至今仍远未完成。
实验数据不能分辨结论相同的理论,永远无法完全确定解释它们的理论模型,用哲学术语说,这叫做理论的不完全决定性。正如我们所看到的,达维德的前两个论据都预设了前提,就是待验证的理论不完全决定性非常低,也就是不存在竞争理论或竞争理论极少。事实上,这也是实验验证标准的一个隐含条件。但是,在没有实验验证的情况下,我们有何理由接受这样的前提呢?这其实就是那个问题:我们提到的这些特性能否充当支持理论的独立依据?
为此,达维德采用了第三个论据:以前那些具备相同特性的理论最终都获得了实验验证。但是,为了让这种“元归纳”成立,这些特性要有助于解释理论在预测方面的成功。这就要求不具备这些特性的理论不能成功预测实验结果。结果,自相矛盾的是,第三个论据与其他两个论据有着同样的前提:必须只有非常少的理论能代替我们要评判的理论。
因此,达维德分析的所有论据都与数据对理论的不完全决定性有关。具体地讲,它们都假设这种不完全决定性不存在,或者只能以非常低的程度存在。达维德认为,当一个理论的不完全决定性很低的时候,或者在某种理论条件下,那个总会存在、会给出相同预测的替代理论并不会构成真正威胁的时候,我们就可以把这些论据当作检验理论的非经验主义标准。在达维德来说,弦论就完全符合这个条件。
这是真的吗?对于弦论,这些非经验主义的论据是合理的吗?写到这里,我们必须强调,无论是弦论的反对者还是拥护者都同意,一个物理理论要得到验证,最终还是要通过实验。两者的区别在于是否认可非经验主义的论据。对于一些人来说这类论据也是一种验证理论的方式,但对于另外一些人来说,它们只有从一个侧面进行分析的作用。
达维德的提议为我们提供了一种合理的方式,来理解这些论据为何具有验证理论的力量。反对的一方可以,也应该从两个不同的方面来对这种方法进行测试:一方面,弦论是否真的有具有那些优势(比如,有些人不认为它真的缺少可行的替代理论);另一方面,满足这些标准是否真的在某种意义上表明弦论得到了非经验主义的验证。
达维德的工作很有价值。他指出,不同的论据都指向了不完全决定性问题,而且他提出,当代物理学已经进入了一个新的阶段,对科学方法的理解可能会变得与过去完全不同。但即便这样,要想理解未来物理学的基础,我们依然还有很长的路要走。