贝叶斯定理:我们几乎每天都在使用的数学工具

作者: Mike Lee & Benedict King

来源: https://theconversation.com/bayes-theorem-the-maths-tool-we-probably-use-every-day-but-what-is-it-76140

发布日期: 2017-05-19

贝叶斯定理是一个在150多年前由托马斯·贝叶斯设计的数学工具,它在科学、技术、医学等领域有广泛应用,包括破解二战时期的恩尼格码密码。该定理通过结合先验知识和新的证据来评估假设的真实性,帮助人们在日常生活和专业领域中做出更准确的判断和决策。

我们的世界观和因其导致的行为往往是由一个简单的定理促成的,在150多年前,这个定理由一位性格内向的英国数学家和神学家托马斯·贝叶斯悄悄设计,直到他去世后才将其发表。贝叶斯定理最著名的运用之一是在二战期间被用来破解纳粹的恩尼格码密码。如今,该定理更是广泛深入的被运用在科学、技术、医学等领域。

但什么是贝叶斯定理?它又是如何运作的呢?托马斯·贝叶斯的洞察力非常简明。一个假设是真实的概率取决于两个标准:1. 根据当前的知识(“先验”),判断它的合理程度;2. 评估它与新的证据的契合程度。然而,在贝叶斯去世后的100多年里,科学家通常仅通过对新的证据来评估他们提出的假设。这是我们大多数人在科学课上受到的传统的假设-检验(频率论者)方法的教育。

当一个不合理的解释与一个新的证据完美契合时,贝叶斯定理和频率论者的方法之间的区别尤为明显。让我们先来制造一个假设:“月亮是用奶酪做的!”接着,我们仰望星空,并收集相关的新证据,并发现月亮的颜色是奶酪黄。在传统的假设-检验框架中,我们会得出新的证据与我们天马行空的假设相符的结论,从而增加了我们对该假设的信心。但如果使用贝叶斯定理,就会得到更加谨慎的结论。

我们会意识到虽然这个假设符合新的证据,但这个想法从一开始便极其荒唐,它违背了我们对宇宙学和矿物学所熟识的一切知识。因此,月球是奶酪的综合概率(即这两项评估的乘积)依旧是很低的。

运用先前的经验和记忆中积累的知识、和意识中提炼出的新证据,我们对日常事物的概率进行分配和生活进行管理。举一个生活中的简单事件:接听手机。通常在工作时你将它放在办公桌上,而在家里时把它放在在充电器上。

现在你在家里的花园里浇花,听到屋内电话声响起。新的数据会告诉你它处于室内任何地方,但你仍会直接走向充电器。因为你将的先前对手机位置的认知(通常在办公桌上或家中的充电器上)与新的证据(房屋的某处)相结合,从而确定了它的位置。

贝叶斯推理的一个特征是:当数据较弱时,那么先前对事物的认知是最重要的。这个原则一直被我们直觉性地使用。

例如,你在酒吧玩飞镖,附近的陌生人说他(她)是专业的飞镖选手,那么一开始你很可能会假设这个人在开玩笑。你对这个陌生人一无所知,但你知道遇到一个真正的专业飞镖选手的几率很小。假如他扔了一只飞镖正中靶心,你可能还是不会相信他的说法,因为这可能只是走运的成分。但如果他连续十次都击中靶心,你会更倾向于接受他是专业人士的说法。因为随着新证据的积累,你之前的认知被超越。贝叶斯定理再次起到作用。

现在,贝叶斯推理支撑着广泛的人类调查领域,从癌症筛查到全球变暖,从遗传学到货币政策等等等等。例如,贝叶斯推理是风险评估和保险行业的基础。每次飓风或洪水袭击一个地区时,保险费都会飞涨。为什么?量化风险是一件非常复杂的事情,而且目前的条件不足以对未来可能发生的灾难提供足够多的信息。因此,保险公司会根据现时情况并结合过往发生的情况来估算风险。

每当自然灾害发生一次时,他们就对该地区的信息进行更新,预计未来索赔的可能性将更大,因此提高保险费。

贝叶斯方法能让我们从模糊的数据中提取准确的信息,从无限可能性的范围中找出更有针对性的解决方案。这也是阿兰·图灵当年破解德国恩尼格码的核心,它加速了二战的结束,挽救了数百万人的生命,对全世界都意义非凡。

若是要在无数的潜在翻译下进行搜索是不可能破译一组加密的德文信息的,尤其是恩尼格码通过不同的转子设置每天变化。图灵关键的贝叶斯洞察力是一些特定信息比其他信息更有可能,这些可能的解决方案都是基于以前的成功破译的信息和符合逻辑的期望。例如,德国的U型潜艇的信息可能包含与天气或盟军航运相关的短语。

类似这样的先验信息极大地缩小了可能需要评估的翻译数量,使得图灵的密码破译机能以超过日常变化的速度快速破解恩尼格码。

为什么我们对贝叶斯方法如此感兴趣?在大多数科学领域中,比如进化生物学,贝叶斯方法扮演着越来越重要的角色。通过预测气候变化所带来的影响,来分析传染病的传播,生物学家通常从广泛的可能性中寻找一些合理的解决方案。

在进化生物学的研究中,主要涉及重建生命的历史和演化过程,这些方法可以帮助我们从数十亿种可能的分支模式中找到的正确进化树。无论在工作还是日常生活中,贝叶斯方法可以帮助我们从巨大的干草堆中找到一枚小针头。

当然,如果先验信息被错误地应用在贝叶斯推理上,那么问题就产生了。在法庭上,这可能导致严重的审判不公。英国就曾发生过这样一个著名的案例,萨莉·克拉克在1999年被误判为是她谋杀了她的两个孩子。

公诉人认为,两个婴儿都自然死亡的可能性是极低的(仅7300万分之1),因此断定是她杀死了他们。但是他们没有考虑到一个母亲杀死自己的孩子的可能性也是非常低的。因此,她完全无辜的可能性与是双重凶手的可能性比公诉人起先认为得要更相近。克拉克在后来的上诉中,上诉法院的法官批评在原审中所用到的统计学。这突出说明了对贝叶斯定理缺乏理解会产生多么深远的影响。

但是,在具备正当合理的先验条件下,贝叶斯方法可以提供从其他渠道中无法获得的见解。

UUID: ff553a44-1690-4255-8a17-bfcfc155683c

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/原理公众号-pdf2txt/2017年/2017-05-19_贝叶斯定理:我们几乎每天都在使用的数学工具.txt

是否为广告: 否

处理费用: 0.0057 元