概率迷雾死亡事件番外:一个弹珠游戏的终极启示

作者: 薛饿编委会

来源: 薛定饿了么

发布日期: 2018-11-09 12:24:22

本文通过一个弹珠游戏的例子,解释了正态分布和回归效应的概念,并探讨了这些统计学现象在生活中的应用和误解。

上期的节目中,我们讲了一个由概率引发的冤案。下面我们轻松一下,来看一个和概率有关的小游戏。小时候在庙会玩过一个游戏,一个木板上均匀地钉着一些钉子,我们把弹珠从顶部放进去,弹珠在钉子之间随机地穿梭,最后可能落到下面的任何一个凹槽里。不同的凹槽代表着不同的奖项,比如毛绒玩具、肥皂盒等等。后来才知道这个玩具不是庙会原创,它的雏形是“高尔顿板”,设计者高尔顿是我们熟知的那位生物学家达尔文的表弟。

和庙会那个玩具略有不同,高尔顿板上方的正中间有一个开口,将小球放入其中,小球会以一个随机的路线向下运动,下落的过程中每碰到一个钉子有50%的概率往左、50%的概率往右,最后落入底部的某一个凹槽内。当你放了很多很多的小球之后,它们就会在凹槽上呈现一个明显有规律的分布:一条钟形曲线。这就是正态分布。

高尔顿用这个板向当时的人们演示了正态分布的产生过程,并打算用它来解释世人的身高、智商等特征为什么会遵循这样一个分布规律:你可以把这个板的平面图想象成一个坐标系,横坐标代表身高,纵坐标代表每个身高值上的人数。正态分布就是说,身高特别高和特别矮的人就像处在板子左右边缘的小球一样,是少数派,大多数人都是中间派的小球,处在一个不高不矮的身高范围内。

高尔顿不满足于这个单一的玩法,他将这个装置升级成一个“高尔顿板2.0”——在凹槽下面再放上一些钉子作隔挡,然后在第二排钉子隔挡区域下面再放上第二排凹槽。他想用这个高尔顿板2.0,模拟身高的遗传。那些掉落到中间凹槽并呈正态分布的小球代表父辈,掉落到底层凹槽的结果代表后代。这个结果是不难想象的。

我们从理论上分析一下,小球们会基于新的起点,在下面形成一个个小的正态分布,然后这些小正态分布的结果,叠加成一个大的正态分布,并且区域会更加广阔,形状会更加扁平。我们的想象是没错的,小球们的确在底部的凹槽形成了更广阔更扁平的正态分布形态。那么身高的遗传是不是能遵循高尔顿板2.0的演示结果呢?我们对着这个板儿想象一下:假设现在有一批身高特别高的人,他们处在第一代正态分布曲线的右侧边缘地带。

身高特别矮的人,处在第一代正态分布曲线的左侧边缘地带。这些身高特殊人群就像中间凹槽处那些处于边缘位置的小球,因为球下落后的落脚点遵循正态分布,落下之后应该有一半左右处在更边缘的位置。如此说来,第二代身高的边界,应该比第一代更宽才对。世界上的人群的身高应该会变得越来越悬殊。事实却并非如此!人类身高的遗传并不遵循高尔顿板2.0体现出的规律!

高尔顿费尽苦心地搜集了一千多对父子的身高数据,他发现,虽然总的趋势是父亲长得高,儿子也相对高,但还有一个很奇怪的现象:当父亲高于平均身高时,儿子身高比他更高的概率要小于比他更矮的概率;父亲矮于平均身高时,儿子身高比他更矮的概率要小于比他高的概率。意思就是说,拥有“极端身高”的父亲,他们的儿子也并没有在身高上继续去“开疆拓土”,而是有向普通人身高回归的趋势。

高尔顿望着手里的这些数据和他的高尔顿板2.0,陷入了沉思。其实想想也能知道,身高的遗传并不会像高尔顿板上的小球球一样,走势越来越极端。不然这样下去,过不了多少代,人类种族就将由特别高和特别矮的两极构成,满大街就都跑着姚明了。不仅身高、智商等遗传性状存在这样的“回归普通人群”现象,在生活中,还有很多事情也存在着蹊跷。

在一次考试中,一个成绩普普通通的同学,这次考试中超常发挥考了95分,老师表扬了他的进步。但下次考试他的成绩立刻滑落下去。老师觉得,是不是表扬不但不会让学生获得进步,还会让他们骄傲自满导致退步?NBA的选秀状元,会一夜成名变成媒体和大众眼中的红人。但是,很多状元在加入球队后,在一段时间内的表现会让人失望,是不是这些运动员被金钱和名声冲昏了头,自我膨胀了?还是他本来就是个“水货”?

某公司刚上市,势头很猛,业绩剧增,你觉得它是个潜力股,赶紧买进做长线,结果赔了个底朝天。是不是这个公司为了上市而在数据上弄虚作假,上市后没几年就原形毕露了呢?但事实真相往往不像人们想象的那样。

学生在考试中超常发挥或者失常发挥都是极端事件,被表扬后考得不如上次好,可能只是从极端事件回归到正常水平罢了;而NBA新秀在选秀中可能也只是超常发挥,如果这种超高水平表现在之后没有靠超出常人的努力来维持,其随后表现平平就再正常不过了;某只股票收益突飞猛进可能也是一种极端情形,第二年就很可能要反弹。

超级高个子家长的孩子身高可能不会再继续变得更高,以及上面讲到的学生、球员、股票在“极端表现”之后“回归普通表现”的现象,叫做回归效应。其实回归效应就是个简单的统计学现象,也不是什么大自然的神秘力量作祟,只是在统计学上样本达到一定数量之后出现的必然规律而已。虽然很多领域,如经济学、工程学、心理学等,都存在回归效应,但很多时候人们在直观感觉上不大习惯这个概念。

他们喜欢找其他的因果关系来解释,并据此做出错误的决策。

UUID: 981a6270-39fa-4457-867e-b116d5ece684

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/中科院物理所公众号-pdf2txt/2018/中科院物理所_2018-11-09_「转」概率迷雾死亡事件番外:一个弹珠游戏的终极启示.txt

是否为广告: 否

处理费用: 0.0055 元