王立铭
浙江大学教授,国家青年千人计划入选者,毕业于北京大学和加州理工学院,神经生物学专家、科普作家。他曾出版过《吃货的生物学修养》和《上帝的手术刀》,获得过“文津图书奖”。私底下,他是两个可爱女儿的父亲。怎么给孩子讲科学,怎么保护孩子们的好奇心,又怎么锻炼他们的科学思维方式,他会有特别的见解。
前面我们说到,人类是“相关性学习者”——只要两件事差不多同时出现,就会认定它们之间有因果关系。
看到Lucy上天价幼儿园紧跟着语言水平提高之后,不知有多少焦虑的爸妈跳进了坑里。但这也不怪我们啊!毕竟,相比判断相关性,判断因果关系的难度要高得多啊!前者只需要知道两件事总是、或者很多时候会差不多同时出现就行了,注意观察、记录一下就可以。而因果关系很难直接被“看”到,甚至有时候人们以为“看”到的因果关系还不一定是真的。
怎么办呢?为了解决这个问题,科学家们发明了一个好方法:对照实验。而这种思维方法,也可以被我们借来用于判断育儿网文是否可靠。
“对照实验”究竟是什么呢?举个健康方面的简单例子:如果我们想知道常吃脂肪含量很高的食物会不会发胖,那么一个简单的做法就是,养上两群小老鼠,一群天天吃奶酪,一群还吃平常吃的粮食坚果等等,过上一个月比比谁更胖。如果前者确实更胖,那么我们就可以比较放心的说,常吃奶酪确实会让小老鼠发胖。在这个简单的实验里,吃常规食物的小老鼠就作为“对照”,可以作为基准,帮助我们看到吃奶酪会不会影响小老鼠的体重。
对照实验的精髓在于,除了食物,其他各方面的条件,比如老鼠的年纪、性别、遗传背景、饲养环境、温度、湿度、光照、噪音等等都需要严格的保持一致,这样我们才能放心的知道,如果两组老鼠的体重真有区别,只能是因为食物本身。而这个结论做一下推广,我们就可以相对不那么放心的说上一句:常吃高脂肪食物也有可能让人变胖。
可以毫不夸张的说,我们当中的每一个人,之所以能活到此时此刻捧着手机读本文,都要拜对照实验的赐福。
因为今天市场上可以说所有的药物,从抗生素、感冒药到抗癌药降糖药,都需要经过“对照实验”的检验才允许上市销售,保护我们每个人对抗无处不在的病痛威胁。这里头的道理说白了也很简单,吃药,对于大多数人来说,是一件特别特别需要——如果不是最需要——明确因果性的事情。
我们生产出一种药物来,一定要有确凿无疑的证据,吃了它比不吃它能够更好地治疗疾病才行,否则后果就严重了:可能吃了毒药把好好的人也给毒死了,可能吃了没用的药耽误了本来还有机会治愈的病人,也可能白白花了病人家庭大笔的金钱落得人财两空。
因此药厂在推出一种新药之前,也需要模仿上面小老鼠吃奶酪的操作,把病人分成两组,一组吃药一组不吃,对比一下两组病人的情况,判断这种药物是不是真的有效。(当然了,实际操作的时候要远比这个复杂得多,像是一定要保证病人数量足够大,分组足够公平,还要把种族、年龄、性别、体重和安慰剂效应等列入考虑。)
我们大家在各路媒体上看到的各种养生指南和健康小贴士,例如吃什么能防癌症,或者什么东西千万不要吃,最靠谱的可能也就是这个水平了——剩下的当然都是纯粹的胡编乱造,不评论。
如果看到这里你的思维还没有被我带跑,还在想着“这个唐僧作者什么时候才会写到育儿啊”,那你可能马上会意识到一个问题:如果验证因果性这么麻烦的话,那我天天看到的各种育儿指南里说:“每天做XXX,孩子会更坚强”,“当妈妈的千万不能说YYY,否则孩子会没有自我管理能力”,“ZZZ家庭的孩子更容易幸福”……这样的结论都是怎么来的啊?难道说,药不可以乱吃,孩子就可以乱教么?
育儿网文为啥都不靠谱?原因很简单:想要在育儿的场景里设置对照实验是一件难度突破天际的事情。我们再回头想一下小老鼠啃奶酪的实验好了,想要严格证明孩子吃奶酪会变胖,我们需要抓两群孩子分组,强迫他们同时睡觉吃一样的饭做一样的功课穿一样的衣服……先不说家长们会不会愿意,几乎已经站在反人类罪行的门槛上了。育儿真做不了“对照实验”。
人类历史上,倒是真的发生过这样突破道德底线的科学研究:1939年,美国爱荷华大学有几个心理学家试图搞清楚口吃到底是天生的还是家长后天的教养导致的。他们的做法居然是召集了一批孤儿(有的已经口吃,有的则完全正常),然后用对照实验的逻辑给他们分组,接受正面引导的一组,总是收到表扬,说他们说话很流利。而接受所谓负面引导的一组,则总是会被严厉地批评说话太口吃。
实验的结果残忍的正如研究者所料:那些总是受到严厉批评的孩子——不管他们原本是不是口吃——很多终身都无法摆脱口吃和各种情绪疾病的困扰。让我们首先祈祷这样的研究永远不再出现在这颗星球上。手段很可耻,但是问题还存在:我们总是需要搞清楚在儿童成长和教育的过程中哪些因素重要哪些因素不重要,哪些实践是有益的哪些又是需要避免的。这些信息对于我们持续地完善改进儿童教育还是非常重要的。我们该怎么做呢?
我们可以想象,在有些温和的场景里,一定程度的“对照实验”还是可以做到的。比如,美国有几项研究,想要找到方法提高中学生们完成作业的能力,提高他们申请大学的积极性。他们是这么做的,首先给中学生们随机分组,然后给一组学生的手机定期发短信,提醒他们作业还没交,提醒他们某某大学申请的截止时间快到了,等等。一段时间下来,研究者们果然发现这一组学生完成作业或者申请大学入学的比例提高了不少。
这样的操作(发发短信)总体比较温和,不管是接受还是不接受短信的一组都相对容易接受些。
但是即便如此,我们也马上可以想象到这个结论也不是完美无暇的。简单举几个可能性吧:这个结论能不能推广到其他国家、其他文化、其他年龄段?也许美国孩子更倾向短信交流,中国孩子就更倾向于QQ,那么短信提醒对中国孩子就不是很有效的手段。这个结论有没有考虑其他影响?
这些接收短信的孩子确实作业做的更好,但与此同时会不会因为老是收短信影响了视力、专注力、社交时间?会不会因为总是操心短信产生了焦虑?这个结论的长期后果是什么?研究者们一般也不可能成年累月的观察孩子们的后续发展情况。会不会出现反弹和逆转?比如那些接收短信的孩子也许确实上大学的比例高,但是之后退学的比例也高,最后算下来大学毕业的比例没什么差别甚至更差?
总的来说,因为人是一种太过复杂的生物,人的思想、情绪、人与人之间的互动,人类社会的组织形式提供了太多难以完全“控制”的变量,使得想要设置完美的“控制实验”,搞清楚某种操作对儿童成长的影响,就会变得非常困难。
如果看到这你开始怀疑看过的那么多育儿经验是不是被骗了,别着急——真实情况可能还要更更更(再加一百个更吧)站不住脚!做不了“对照实验”,好意思谈因果吗?
别忘了,只有在类似发短信提醒这种非常温和的场景下,研究者才有可能在人类个体上尝试一些“对照实验”。在绝大多数时候,一丁点操作都是不可能做,或者根本做不到的。举个例子吧。很多爸爸妈妈可能都看过类似的育儿网文,建议多和宝宝们说话,说亲子间的对话有助于孩子的心智发育。文章里会说,那些和爸爸妈妈经常说话的孩子,长大以后不管是语言能力、理解能力还是学习成绩都更好一些。
这项建议当然是充满温情的了,不管怎么说,陪伴自己的孩子,和他们说说自己的眼睛鼻子在哪里、爸爸妈妈的头发是什么颜色的、小熊的鼻子软不软,应该都是一个小家庭最温暖的时光了。
但是如果我们追问一句,这个结论有什么样的证据呢?显然,我们没有办法真的设置“对照实验”。研究者不可能随机挑一群家长,强迫他们对着自己的孩子喋喋不休,更加不可能强迫另一群家长就是不和宝宝说话。
因此研究者们能做到的最好的研究,就是观察。在美国就有好几项这样的研究,给许多父母佩戴录音机,随机记录下他们每天和孩子都说了什么话、说了多少话,然后追踪这些孩子的成长,看看他们的未来表现和小时候听了多少爸妈的唠叨有关系。你还别说,这些研究还真发现话痨的家庭里,孩子长大以后心智发育的更好。
我猜,这也许就是那些育儿网文的证据来源吧。当然了,一般那些网文不会满足于介绍几个科学研究。
它们可能还会试图挖掘其中的因果关系,例如孩子需要更多父母的陪伴啦,孩子需要尽早开始语言的交流啦,更多的来自爸爸妈妈的平等交流帮助孩子成长啦,等等。有理论,有科学证据,听起来是不是特别靠谱?你是不是恨不得马上冲回家对着孩子唠叨了?别急别急。
如果你还记得上篇文章里的Lucy和狗剩的故事,就应该能意识到,上面我描述的这些录音研究,本质上都是在探索相关性(唠叨的父母和成熟的孩子同时出现),而不是因果性(唠叨的父母导致了成熟的孩子)。
而就像Lucy上天价幼儿园跟她的语言水平提升之间不一定有因果关系,我们也可以给“爸妈话痨的家庭孩子成长更好”找出一百个另外的解释:有没有可能,那些话痨的家庭本质上是因为经济条件较好,爸妈下班后有更多空余时间陪孩子导致的说话多,同时也导致的子女受教育程度更好?反过来,可能有些家庭父母不得不为了填饱肚子打好几份工,这样和子女聊天的机会显然会降低?
有没有可能,对话多的家庭是因为孩子语言发育较早,因此是孩子,而不是父母成为了对话的启动者和引导者?即便这些研究确实有因果性的成分,这种因果关系能不能简单推广到其他文化(比如从美国孩子到中国家庭)?能不能直接套用在不同年龄段?即便爸妈说话多→子女心智发育好这个结论确实有普适性,那么对话的内容有没有影响?比如对话多,但是都是训斥性语气的家庭是不是仍然比对话少,但是总是语气积极鼓励的家庭好?
如果不是的话,一刀切的在所有家庭里推广多说话是不是会引发更大的问题?
另外还得提醒一句,这里咱们讨论的,已经是一个至少接受过大规模科学研究的结论了!更多的所谓育儿经验,仅仅是一个自以为有点育儿成功经验的爸爸或妈妈的分享罢了(比如……著名的“好妈妈胜过好老师”系列)。
如果把这些问题都好好考虑一遍,你还会觉得各种“爸爸必须要这样做”、“妈妈千万不能这样做”、“这样的家庭里孩子会如何如何”的育儿网文值得信任、足以引发你的行动(或者焦虑)吗?因此我的经验是,下一次再看到一篇题目抓人眼球的育儿文的时候,你可以反问自己三个问题:这篇文章分享的是个案还是大规模数据分析?如果是个案的话,作者爸爸妈妈是不是错把偶然巧合当成了成功的因果关系来介绍了?
这篇文章分享的是相关性还是因果性?如果仅仅是相关性的话,网文作者有没有错把相关性研究拓展到因果关系了?这项“育儿贴士”背后有没有隐藏的原因没有讨论?这篇文章介绍的经验到底是针对多大的孩子、什么国家民族、什么家庭情况?能不能随意拓展到我自己的宝宝身上呢?人类社会很复杂,辨别“因果性”也没有什么放之四海而皆准的标准,但是至少这几个简单的招数,能帮你过滤掉大多数无效和有害信息吧。