最近,心理学界遭受了一点小震动:又有一些著名实验没能重复。发表这些重复结果的,是一项名为Many Labs 2的大规模国际合作项目。过去几年间,该项目背后的200多名心理学家试图重复28项高引用和轰动性的研究,最终发现只有一半的重复实验能得出和原始研究一致的结论。如果这发生在六年前,或许是震撼学术界的大新闻。而现在,结果已然在预料之中。
其实,“可重复性危机”已经困扰心理学界好几年。虽然各种质疑、捍卫之声聚讼纷然,越来越多的人已经意识到,即使是那些业界公认的心理学现象,也不一定是真的。也就是说,你还未更新的旧教材,收藏列表里的Ted演讲,都有可能错了。
为了尝试重复更多经典实验,开放科学中心(Center for Open Science)于2013年成立。但他们的首次结果并不足够乐观:在100项已发表的心理学实验中,只有不到40%成功重复。而作为该中心的新项目,Many Labs 2的结果表明,在更严格的统计学标准下(p< 0.0001,通常认为p<0.05时具有统计显著性),重复成功率仅为50%。
Many Labs 2就是专门设计出来回答这些质疑的。他们总共招募了15305名被试,平均每个实验的被试数量是原始版本的60倍之多。这些研究人员与原版实验的科学家们深入交流过,确保每个细节准确无偏差。而且,重复实验的被试来自36个国家,每项实验都重复了多次,以判断被试的文化和背景是否对实验结果产生影响。
尽管这项工程的样本巨大,操作方式也得到了被重复的研究者的认可,他们依旧没能验证许多研究的结果。重复失败的实验包括:潜意识接触过“热”这个概念的人更容易相信全球变暖;道德上“肮脏”的行为会迫使人们需要清洁自己的肉体,就像麦克白夫人那样;一个人成长中拥有更多兄弟姐妹,行为也就更利他……
不过,人类行为的文化差异并非无关项。许多研究人员指出,来自经济状况好、教育水平高的西方工业化民主国家,也就是所谓的“怪异”(WEIRD)国家的志愿者,他们的思维和其他地方的人不太一样。因而,相关研究也就更容易出现差异性。
心理学家桑杰·斯瑞瓦斯塔瓦(Sanjay Srivastava)认为,Many Labs 2实验结果的相对一致性其实是个好兆头。一方面,它表明大规模重复失败很可能就是学术不端行为导致的。但另一方面,实验结果缺乏差异恰恰意味着心理学的本职工作做得很优秀:研究人员成功地把参差错落、难以捉摸的人类心智塞进了实验室里。
重复危机的确存在,但未来没那么绝望。如果情况与之相反,那才是心理学真正的噩梦。如果我们发现人类实在太善变,连最严格的重复实验都导致了五花八门的结果,“那么我们就没法解释这些实验,连阳性结果都无据可依了。”斯瑞瓦斯塔瓦说,“如果真是这样,我们可以不把重复失败当回事,但那些原始研究也沦为了笑话。长远来看,Many Labs 2带给我们的结果是积极乐观的。”