让科学不再“自欺欺人”

来源: 中国科学报

发布日期: 2015-10-21 16:58:01

本文讨论了科学研究中数据分析错误的问题,指出人类大脑的不可靠性和无意识偏见可能导致研究结果的错误。文章还提到了科研成果的不可再现性问题,并强调了改进科学工具和方法的重要性。

这是一个对研究成果进行研究的伟大时代。2013年,距离自己作为共同作者之一完成的一篇稿件——文章指出美国民主党候选人通过略微向右调整其经济政策可以获得更多选票——已经过去了5年,纽约市哥伦比亚大学的Andrew Gelman非常苦恼地了解到,他的数据分析中发现了错误。在尝试重复这篇稿件分析结果的过程中,一个名叫胡阳阳(音译)的研究生发现,Gelman在分析一个变量时把符号弄错了。

Gelman随即迅速发表了一个勘误声明,表示在未得到纠正前,该论文中的所有关键部分都是错误的。

今天,在回顾这篇论文出错的原因时,Gelman把他的错误归咎于人类大脑天生的不可靠性。“结果看起来非常合理。”他说,“很多时候,当存在这种编码错误时,你得出的结论就是那么荒唐可笑。所以,如果你知道哪些地方可能发生了错误,然后你回头去核查直到找到问题;但是如果你没有察觉到这样的错误,你就很容易错过它。”

这是科学上最大的问题,然而讨论它的人却极少:即便一个诚实的人,也会因此成为一个自欺的高手。人类的大脑很久以前在非洲大草原上得到进化,在那里早期人类很容易做出对熟果子在哪儿或者天敌在哪里出现等关于生存问题的合理设想。但是躲避狮子的妙招并没有被传承到现在的实验室中,在这里要被授予终身教席职位,就需要借助对大量多维数据的分析。在今天的环境中,如果人们轻而易举地推断出结论,随机出现错误的概率将非常高。

也就是说,不加质疑地忽略其他的潜在结论,而去接受“看似合理”的结果,就会让人们误入歧途而不自知。信任危机由于人们未能了解自己的偏见,从而致使科研成果不能重复,因此产生了信任危机,统计学家、斯坦福大学Meta研究创新中心的John Ioannidis说。这些事件背后可能并非是学术造假。今年早些时候,一个试图重现100项心理研究成果的项目,最终仅使其中1/3的论文再现。

2012年,加州千橡树安进生物技术公司的研究人员报告称,在53篇关于肿瘤学和血液学的地标性研究成果中,他们仅能重现其中的6项。2009年,Ioannidis和同事表示,在18项微阵列基因表达研究中,他们只能重现其中的两项。尽管几乎不可能记录研究人员在数据分析方面“自我愚弄”的例子有多少,但是这些研究成果的不可再现性均需要作出解释。

以上述100篇心理学研究论文的重现性实验为例,如果人们假设做出这些成果的绝大多数研究人员是诚实、务实的,那些只有无意识情况下发生的偏见才能够解释这些大量出现的问题。“这是一个对研究成果进行研究的伟大时代。”Ioannidis说,“大量的科学研究涌现出大量的科学成果,然而其中也有大量的错误和偏见等着我们去研究。因为,我们非常希望可以找到更好的方式应对这些错误。”

“当诸如此类的不可再现性危机出现时,也为我们提供了改进科学工具的新机遇。”斯坦福大学社科学家Robert MacCoun说。这种情况此前也曾出现过,20世纪中期,科学家已经认识到,实验者和研究人员经常会无意识地改变他们的行为,使之与预期相符合。正因为发现了这一点,双盲标准才诞生。“人们忘记了,当我们谈论科学方法时,我们所指的并不是一件完成的产品。

”加州大学伯克利分校天文物理学家Saul Perlmutter说,“科学是我们创造愚弄自我和避免愚弄自我之间的一场竞赛。”

因此,研究人员试图用各种创新方式去除数据分析中的偏见,这其中也会碰到与竞争对手进行合作、研究尚未开始但文章已然发表以及处理有意造假数据等各种问题。

UUID: b170074b-9408-4f0c-b312-136cbaaef7a0

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/中国科学报公众号-pdf2txt/2015-2016/中国科学报_2015-10-21_让科学不再“自欺欺人”.txt

是否为广告: 否

处理费用: 0.0036 元