最近,两个赫赫有名的心理学经典实验接连遭遇“信任危机”:首先,2018年5月发表于《心理科学》(Psychological Science)上的一篇论文表明,一直以来被认为能够预测儿童未来学业与发展状况的“棉花糖实验”,实际上并不能决定孩子们未来的命运。接下来,2018年6月一篇发表在Medium上的报道则直接将20世纪最有名的“斯坦福监狱实验”称为“欺诈”和“谎言”。那么,到底是哪里出了错呢?
生活中,我们常常需要等待。小时候,父母可能会要求我们安静地坐着等他们回来,或者是将正在播放动画片的电视机关掉几分钟,或者是在客人来之前不要吃摆在桌子上的零食。耐心地等待,以期望获得更好的奖励,是个体成长中的必修课之一。这种为了更有价值的长远结果而主动放弃即时满足的抉择取向,并且在等待期中展示自我控制的能力,被称为延迟满足(delay of gratification)。
这一概念最早由西格蒙德·弗洛伊德(Sigmund Freud)提出。在1970年,沃尔特·米歇尔(Walter Mischel)首次将延迟满足作为一个独立的研究内容进行方法上的探索,也就是我们所熟知的棉花糖实验。
在棉花糖实验中,研究人员将1颗棉花糖放在儿童面前,并且告诉他们如果能够在研究人员回来之前忍住不吃这颗棉花糖的话(研究人员会离开15分钟),就能得到第2颗棉花糖。
如果他们吃了这颗棉花糖,就只能得到这1颗棉花糖了。实验并没有在这里结束。大约10年后,研究者们又与其中一部分孩子取得了联系,他们发现,小时候越能忍住不吃棉花糖的孩子,他们的学术能力评估测试(也就是俗称“美国高考”的SAT,Scholastic Assessment Test)成绩越高,问题行为越少。
之后,研究者们又做了一系列相关研究,结果表明,儿童的延迟满足能力与其之后的认知发展、社会性发展、健康、甚至是大脑结构有关。
这似乎是一个令人惊喜的发现,它被大多数人解读为:如果我们能够教会儿童更有耐心、进行更好的自我控制,他们之后就很有可能取得成功。在教育研究中,延迟满足常常被称为“非认知因素”。研究者们认为,提高孩子们非认知因素的发展水平有助于他们未来的成功。棉花糖实验的结果有力地支持了该观点,并在学校教育中产生了广泛的影响,比如成长型思维(growth mindset)。
然而,棉花糖实验的结果也一直饱受争议。其中非常有趣的一点是,这项开展于上世纪90年代的研究中,这些面对棉花糖诱惑的小家伙们都是来自富裕家庭的儿童,他们的父母也都受过良好的教育。那么,对于那些家庭经济条件不那么优秀的孩子来说,之前的研究结果是否依然有意义?毕竟,他们的生活常常充满不稳定的因素,等待对他们来说可能存在什么都得不到的风险。
基于早期棉花糖实验的局限性,纽约大学心理学教授Tyler Watts和同事利用美国国立卫生研究院(NIH)的一项大型测试中1000名4岁儿童的数据,试图重复该实验,并且探索简单的延迟满足实验结果是否能够预测儿童未来在学校和生活中的成就。研究者将儿童分为两组,一组儿童的母亲至少完成了大学的课程(有学位组),另一组儿童的母亲则没有(无学位组)。
通过比较可以明显看出,母亲有学位组的儿童在实验中等待时间更长、未来表现也更好。进一步的分析表明,该研究结果与早期的研究结果存在差异。儿童4岁时棉花糖实验的测试成绩与其15岁时的成就之间的相关性只有早期研究的一半。当研究者控制了家庭背景和智力等因素后,它们之间的相关几乎消失了。这意味着,儿童的延迟满足能力并不能影响其之后生活中的其他方面。
影响儿童未来的,可能是更宏观、更难改变的因素,例如儿童的智力和其所处的环境。
此外,在没有任何控制的情况下,延迟满足和儿童的行为结果间也不存在相关性。“从这个意义上来说,我们对棉花糖实验的复制失败了。” Watts说。这并不是说延迟满足对儿童来讲不重要,它仍然是一项需要儿童掌握的、重要的生活技能。只是,在谈及孩子的未来发展时,我们需要将家庭社会经济地位和父母受教育程度纳入考虑范围内。
“目前很难找到家庭社会经济地位无法解释的心理因素。”密歇根大学的发展心理学家 Pamela Davis-Kean说。金钱可以买到美味的食物、安静的社区、安全的家庭、更少的压力、更健康的父母和更多的亲子时光。Davis-Kean指出,教孩子如何等待或者是变得有耐心“可能并不是改变他们境况的主要因素”。
儿童的发展受到多方面因素的影响。研究者们希望能够通过干预儿童某方面的发展来影响其未来的全面发展,这似乎是不可行的。“人们正在拼命寻找一个简单、快速并且明显有效的方法,来改变那些处于困境中的人的生活。”人格心理学家 Brent Roberts说,“然而令人沮丧的是,人性的另一个特点是,我们过于在意用快速而简单的方法解决复杂问题了。”
这是另一个在心理学历史上赫赫有名的行为学实验——1971年,菲利普·津巴多(Philip Zimbardo)及其同事在斯坦福大学的地下室搭建了一个模拟监狱,并且招募了24名大学生,将其随机分配为囚犯或者狱警的角色。狱警每班工作8小时,而囚犯则24小时生活在模拟监狱里。由于参与者后来发生出乎意料的极端消极的反应,这项预计进行两周的实验在6天后被终止。
这就是众所周知的斯坦福监狱实验(Stanford prison experiment,SPE),它的研究结果在几十年来产生了巨大的社会和政治影响。
与棉花糖实验受到的来自学界的“推翻”不同,SPE得到的是来自学术圈外的质疑:2018年6月7日,记者Ben Blum在一家媒体平台Medium上发表了一篇文章,对SPE的真实性和价值提出疑问,将其称为“欺诈”和“谎言”。
Ben Blum指出:SPE中的实验者对扮演狱警的参与者的行为进行了诱导,其中一名扮演狱警的参与者为了配合实验者故意表现得残忍;一名扮演囚犯的参与者承认自己是为了提前出去复习研究生考试而假装崩溃;另有一名参与实验的工作人员公开谴责SPE有缺陷并且不诚实;英国的一个研究团队未能成功复制这项实验;为了避免被拒稿,该实验的研究结果发表在了一个非同行评审的期刊上。
质疑一出便引起了轩然大波。
几天后,SPE的主持者津巴多出现,回应了Ben Blum的质疑:他们仅仅是在第一天要求其中一名表现懦弱的守卫“早日进入到你认为的角色中”,并且没有交代他具体怎么做;关于那名故意表现出残忍的参与者,他自己事后说是受之前看的电影的影响,而且不光是他,其他狱警也参与了这些残忍的行为;那名说自己假装崩溃的参与者,他曾在采访中提到他当囚犯的那段时间是他一生中最令人难过的一段经历;那名所谓的工作人员是一名编剧,并没有真正参与SPE;英国研究团队对SPE的复制更像是一场“真人秀”,在任何意义上都没有达到一个科学复制的标准;将研究结果发表在非同行评审期刊上是由于经费原因,并且他们后来在许多同行评审的期刊和书籍上发表了关于SPE的研究。
按照今天的心理学实验设计标准和伦理标准,SPE确实存在着许多问题:它没有严格地控制变量、实验结果可能无法重复、实验对参与者造成了伤害……但是,综合考虑SPE的时代背景和其对心理学的贡献,它仍然是心理学历史上重要的组成部分之一。人类行为是受多种因素影响的,这些因素可能来自内部因素或外部因素,可能来自生理因素或环境因素,可能来自历史或当代,可能来自文化或个体。
毫无疑问,人是非常复杂的,研究对象越复杂,研究方法就要更加严苛。那些快速、简单发现的积极的实验结果,往往需要进行更严格的验证。
科学研究是一项艰苦的工作,令人兴奋的研究结果通常需要长期的实验研究。令人振奋的是,研究者已经开始对以往奉为经典的心理学实验进行反思,并且越来越重视心理学实验的科学性,包括对P值、效应量的讨论,公开研究数据,对心理学实验进行可重复性检验,开展更广泛的合作网络等。
简言之,心理学正遵守着“否定之否定”的规律蓬勃发展,而真理也需要一个愈辩愈明的过程。从这个角度来说,经典实验或理论遭到质疑或推翻,说明了心理学正在变得更好。而我们作为旁观者,要做的事情只有一件——给它一点时间。