“最难高考作文”的背后,蕴藏着怎样深刻的科学道理?

作者: Charles Wheelan

来源: 果壳少年

发布日期: 2018-06-11 14:42:33

本文讨论了高考作文题目背后的科学道理,特别是统计学中的“幸存者偏差”概念,以及如何正确选择评估样本以避免得出错误的结论。

前两天的全国大事件毋庸置疑是我们物理所的90周年所庆,但除了它以外,大家肯定有关注一年一度的高考!以及出题人被骂的情况。全国 II 的作文到底做错了什么?它是这样的——全国 II 高考作文阅读下面的材料,根据要求写作。(60分)“二战”期间,为了加强对战机的防护,英美军方调查了作战后幸存飞机上弹痕的分布,决定哪里弹痕多就加强哪里。

然而统计学家沃德力排众议,指出更应该注意弹痕少的部位,因为这些部位受到重创的战机,很难有机会返航,而这部分数据被忽略了。事实证明,沃德是正确的。概括一下诸位考生的疑问,就是——但是,作文故事的背后蕴藏着十分深刻的科学道理。想知道这篇文章怎么写吗?赶快来补补课吧~诡异的判断二战期间,为了降低伤亡率,盟军试图对战斗机进行加固。在研究了大量返航的战斗机之后,研究人员发现飞机的弹痕是这样分布的。

弹孔分布假想图:如果你是决策者,你会选择将哪里加固呢?图片来源:wikipedia.org海军分析中心的工作人员认为,飞机的弹孔大多集中在机翼和尾部,于是他们建议将这些受损最严重的地方加固。统计学家亚伯拉罕·沃尔德(Abraham Wald)却得出一个跟直觉相反的结论。通过计算,他发现参与调查的都是在战斗中幸存下来的飞机,它们并未遭受致命的袭击。

相反,机舱和发动机等看似毫发无伤的地方反而比较危险,因为这些区域一旦被击中,就会导致飞机失事坠毁。机舱和发动机没有弹痕,是因为这里中弹的飞机都坠毁了。图片来源:wikipedia.org事实证明他的建议才是正确的,战斗机的伤亡率最终得到了控制。死掉的数据不会开口讲话,这被人们称作“幸存者偏差”。

“幸存者偏差”是统计学的一种逻辑谬误,它是指我们忽略了数据筛选过程的逻辑陷阱,从而得出了一个错误的结论。

“幸存者偏差”背后更值得深究的问题是:我们如何选择评估样本?在进行统计调查特别是抽样调查时,我们必须确认,接受评估的群体中,每一个成员都有均等的机会入选样本,否则最终得出的结论就会有偏颇。选择偏倚还有其他很多种形式。

在机场做消费者问卷调查很可能造成偏倚,因为坐飞机的人大体上会比一般人更富裕;而在一些贫穷街区做同样的调查,问卷结果又会偏向另一端。这类调查所共同面对的问题是,收到的反馈都来自那些愿意在公共场合接受问卷调查的人,而他们同那些不愿意被打扰的人又大不相同。如果你在公共场合问100个人做一份简短的调查,其中只有60人愿意,剩下40个看都不看你一眼就走开。那么这60个人的数据显然就有失偏颇。

每项重要的研究背后都离不开好的数据,是它们使分析成为可能。错误选用的数据,往往会使我们得出完全相反的结论。如果说统计学家是侦探,那么数据就是线索。用正确的方法找到好的数据,永远是侦探心中的第一要务。

UUID: 1bdffbbd-f282-4845-8556-18fe1b81e93e

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/中科院物理所公众号-pdf2txt/2018/中科院物理所_2018-06-11_“最难高考作文”的背后,蕴藏着怎样深刻的科学道理?.txt

是否为广告: 否

处理费用: 0.0041 元