近二十年前,凯斯西储大学的心理学家罗伊•鲍迈斯特(Roy Baumeister)和戴安娜•泰斯(Dianne Tice)夫妇设计了一个关于自制力的奠基性实验。这个实验是这么进行的。鲍迈斯特和泰斯在一个盘子里放上刚烤出的饼干,而旁边一个碗里则是小红萝卜和小白萝卜,一组学生志愿者被带进来参与实验。他们让其中一些学生在没人陪伴的情况下在实验室里呆一会儿,只吃碗里的萝卜,而另一组学生只吃饼干。
之后,每一位志愿者会尝试去解决一个难题,而这个难题被故意设成是无解的。鲍迈斯特和泰斯随后测量了学生们在这个难题上花的时间,看看他们到底用了多长时间才放弃。两位研究者发现,平均而言,吃了巧克力片饼干的学生会在19分钟后放弃解答,什么也没有吃的对照组也差不多。而吃了小萝卜的学生则在难题测试上表现糟糕,八分钟后就沮丧得放弃了尝试。
两位作者把这个现象“自我损耗”(ego depletion),并称这是关于人类心理的一个重要事实: 我们只有有限的意志力,过度使用就会下降。就像肌肉一样,意志力会因使用而耗尽。在刚出炉的巧克力片曲奇的诱惑下只吃萝卜,似乎大大消耗了受试者们在其他方面的意志力。这个简单的结论——对非科学家来说或许是直觉性的,但在心理学领域有革命性的意义——成为了理论界的巨头。
在随后的几年,鲍迈斯特和泰斯的实验室,以及许多其他实验室,都发表了使用类似实验手段的研究。首先,科学家通过需要自制力的任务来耗尽实验参与者的毅力:忍住不吃巧克力饼干,看悲情电影但压抑反应。几分钟后,研究者会用一个难题、一个游戏,或是其他需要脑力的任务来测试这些实验参与者。心理学家发现,许多不同的任务都可能消耗人的精力,使他们的认知力枯竭。
2010年,由马丁•哈格(Martin Hagger)所领导的一组研究人员对这种研究进行了元分析——即对以往研究结果系统性的定量分析。通过分析来自83个研究和198个独立实验的数据,哈格的团队确认了主要的结果。“自我损耗”似乎是一个真实可靠的现象。2011年,鲍迈斯特和纽约时报的约翰·蒂尔尼(John Tierney)出版了一本基于这一研究的科学励志书。
他们的畅销书《意志力:关于专注、自控与效率的心理学》就如何利用“自我损耗”研究向读者给出了建议。他们说,一杯柠檬汁,加上真正的糖,可以帮助你恢复自制力。如果意志力像肌肉一样,那么有规律的练习就能增强它的力量。但这个故事即将改变。一篇论文描述了一项规模巨大的尝试,试图再现这项研究的主要结果。
论文已经公布,并将于下个月正式发表在学术期刊《心理科学观点》(Perspectives on Psychological Science)上。这项研究包括超过2000名受试者,在数大洲的二十四个实验室进行了测试,但没有发现任何结果。“自我损耗”的效应为零:没有任何迹象表明人类意志力的运作方式与“自我损耗”理论相符;而且,此前的几百项研究似乎也并没有得出多少有意义的结论。
这已经不是心理学研究结果第一次被挑战了,远远不是第一次。心理学,以及许多其他领域都存在“可重复性危机” 。一项发表于去年夏天的研究,试图逐一再现100个心理学实验,结果只有40%再现成功。上周,另一项研究批判了这一研究,声称原作者出现了统计错误,但这项批判本身也被攻击为曲解事实、无视证据,沉浸于一厢情愿中。对于科学家和科学记者来说,这些你来我往是令人担忧的。
我们倾向于认为,一项已发表的研究,真的可能性总该比假的高。这项关于自我损耗的新研究上的利害关系还要重大得多:它并非指出单一的研究可能是不可靠的,而是质疑了一整套已经完全成型的学术文献。换言之:它瞄准的不是一篇论文,而是核心理论本身。鲍迈斯特的意志力理论,和他聪明的测试手段,已在一次又一次实证研究中被证实。这项研究的结果已被数百种不同方式再现,背后的概念也已被元分析证实。
这不是建立在一堆可疑数据上的疯狂新想法;而是一栋由坚固砖块垒成的结实的学术大厦。然而,现在看来,自我损耗可能是完全虚假的,可能建立在腐朽的地基之上。这意味着整个领域的研究——以及一些科学家职业生涯的很大部分——都可能建立在一个不成立的前提上。如果这样一个广被接受的理论都能分崩离析,那接下来会发生什么?这不仅仅令人担忧。这让人害怕。
埃文•卡特(Evan Carter)是率先发现自我损耗研究漏洞的研究者之一。作为一名即将从迈阿密大学毕业的博士生,卡特试图重现柠檬汁效应,一项于2007年提出的效应,即消费含糖饮料可以避免意志力的损失。卡特对我说,“我征集了尽可能多的研究对象,最后,我们的研究拥有了自我损耗领域最大的样本之一。尽管他付出了这么多努力,但还是无法从研究中得出任何结果。“我还以为是他们教给我的实验方法有问题。”他说。
为了找出什么地方出了错,卡特回顾了2010年的元分析,这篇分析了使用了83个研究和198次实验的数据。然而,他越仔细地阅读这篇论文,就越不相信这篇论文的结论。首先,这项元分析仅包括发表的研究,这意味着数据受到了偏重正面结果的标准偏差影响。其次,它包括的一些研究中,对自制力的标准自相矛盾或不合常理。
例如,一项研究表明,自制力受损的受试者会把更多的钱捐给慈善机构,而另一个则说,自制力受损的受试者会花更少的时间帮助一个陌生人。当他和他的导师,迈克尔•麦卡洛(Michael McCullough),重新运用最先进的分析方法来重新分析这篇2010年论文的数据时,他们没有发现自我损耗效应。在去年发表的第二篇论文中,卡特和麦克洛完成了第二个元研究,包括了48个从未发表过的实验的数据。
再次,他们发现“几乎没有证据”证明自我损耗效应的确存在。“突然之间,我觉得一切都崩塌了,”卡特说。他现年31岁了,还没有拿到终身教职方向的职位。“我算是失去了方向。通常我会说,既然已经有100篇发表过的文章证实这个研究了,那我对它感觉良好,我对这个研究有自信。然后这一切都烟消云散了。”并不是所有人都相信卡特和麦克洛对自我损耗领域的重新评估。
他们使用了一个新方法来纠正发表偏差,但这个新方法并没有完全得到检验。自我损耗领域中一些的研究者认为他们的发现是不成熟的。但事到如今,文献存在问题的其他迹象也已出现。比如柠檬汁效应,看起来就有点难以相信:大脑没法靠一杯柠檬汁那么少的葡萄糖、在那么短的时间内发生改变。而且,有几个实验室让人们用柠檬汁漱口然后吐出来,而不是喝下去,也得出了同样的结果——自制力恢复。
其他实验室发现,被试者的个人观念和思维方式也会对他们的意志力会不会被损耗、以及损耗的方式产生影响。这些批评本身并不是决定性的。或许,自制力是有限的资源,但可随动机不同而扩展。毕竟钱也是如此:一个人的消费习惯可能受许多不同因素影响,包括他/她有多少钱,对自己的财务状况感觉如何。但这些关于意志力本质的大问题,再加上有关元分析的争论,开始让整个研究领域显得可疑。
2014年10月,美国心理学协会宣布,将会在不同的实验室重现能代表这一领域的实验。2010年元分析的作者马丁•哈格将担任这一项目的首席作者;鲍迈斯特本人则将负责实验方法的咨询。在鲍迈斯特的指导下,哈格的团队选择了一篇密歇根大学的研究者发表于2014年的论文。这项研究使用了标准的自制力任务。
受试者们观看屏幕上出现的单词,比如水平(level), 麻烦(trouble), 塑料(plastic)和商业(business)等等。给受试者的要求是,如果单词包含字母e就按一下键,但是这个e的两格之内不能还有别的元音。(比如在屏幕上出现trouble时按下按键,出现level或business时不按。)在原始研究中,这项自制力任务表现出了很强的损耗效应,受试者们在随后的上机测试中表现很差。
重复实验团队在24个不同的实验室开展了这项实验,其中还包括了将找e任务改为当地字母的荷兰、德国、法国和印尼的实验室。仅有两组研究人员得出了显著、正面的效应,其中一组还得出了相反的结论。总体而言,这些实验完全没有表现出鲍迈斯特和泰斯得出的原始效应。这究竟意味着什么呢?至少,它告诉了我们这一项特定的任务——找e游戏——不会消耗被试对象的意志力,或者随后的任务并不能准确衡量出意志力的消耗。
鲍迈斯特就是这么看的。“全世界有很多人费了很大精力做了这个研究,到头来却什么都没发现,我为他们感到难过。”他对我说。他仍然相信自我损耗是个真实的效应,失败的是这项任务,而不是理论本身。鲍迈斯特告诉我,如果让他的实验室来完成这项实验,实验方法会有所不同。首先,他会让自己的被试者们挑出所有含有e的单词,直到固化成为习惯。然后,他才会加上第二条规则,即前面和后面两个字母是元音的单词不算。
他表示,这样的任务需要更多的自制力。其次,他会让自己的被试者用纸笔来完成任务,而不是在电脑上。他认为,比起不动手指敲键盘,不动手臂做记号或许需要更多的自制力。但在我看来,这次重复失败可能意味着更大的灾难。就算退一步说,测试方法是错的,自我损耗的确是个真实的效应,那么这项研究也明确地表明,自我损耗效应并没有表面上那么有力。
这个理论的一大卖点就在于它的灵活性:自我损耗不仅适用于巧克力片曲奇和萝卜的实验,也适用于文字游戏、黑人和白人之间的谈话、决定是否购买肥皂,甚至还适用于狗的行为。事实上,这一效应广泛的适用性常常被引作它的优势。用这么多不同方法完成的这么多实验,怎么会都是错的呢?但现在,我们知道自我效应或许十分脆弱,就连用键盘、而不是纸笔这样一点小小的区别都能让它消失,那么我们凭什么要相信这一主题的其他变奏呢?
乐观者们认为,虽然心理实验的规模可能并不足以展现出真实的效应,科学家们有时也会挑选好看的数据(并不是说恶意造假),但如果所有这些成功结果全都是随机的,那也未免太巧;但悲观者反驳,一个糟糕的结果会引向另一个。自我损耗是个“大概念”,这意味着标准范式的不同版本仍会得出相同的结果。因此,你可以想怎么改动概念本身就怎么改动、想用多久就用多久,直到找到得出积极结论的那个版本。
但这样得出的结论并不是真正的结果:它只证明了你拥有抱住自己的假设不放手、直到做出合适的实验证明它为止的意志力。表面上看,这项新研究并没有证伪任何我们关于意志力的知识。当然,人的自制力会松懈,但我们不知道何时松懈、为何松懈。或许,鲍迈斯特甚至有可能是对的——人的精神力量的确是有限的,每次使用都会被消耗。但他和泰斯20年前发明的两步实验方法似乎并不可信。因此,整个领域都受到了质疑。
这项研究的合著者之一,多伦多大学的迈克尔•因兹利特(Michael Inzlicht)说:“在某个阶段,我们总得从头来过,承认这是我们的创始年。”他指的不仅是自我损耗研究,有时,这也是他对整个社会心理学领域的感受。所有的老方法都受到了质疑,就连元分析也似乎毫无价值,而它一度是评价研究领域的黄金标准。因兹利特警告我:“元分析完蛋了。”分析200篇糟糕的文章,你就会在最后得到一个糟糕的结果。
进去的是垃圾,出来的还是垃圾。鲍迈斯特正在用他认为有效的方法重复自己的结果,:“我们试图用诚实直观的方法工作,现在我们得从零开始,证明我们在20年前提出的观点。发表‘破’的结果比‘立’容易多了,”他疲惫地告诉我,“这个过程对我来说没什么乐趣。”对毕生研究受到质疑的人们和怀疑论者们来说,这段时间都不怎么轻松。最近,因兹利特在自己的博客上写道:“我感到内心一片黑暗。
脚下的大地在移动,我不再知道什么是真、什么是假了。”