从赌场里的赌博机器到下周天气的预测,我们周围的世界都受到看似随机的事件影响。那么,数学家是如何理解随机事件的?对随机事物的“预测”又意味着什么?在《数学家是如何描述生活中的随机事件的?》一文中,我们提到了随机性是一个我们熟悉、却又难以给出正式定义的概念;但我们有一套用概率论在数学上描述随机性的明确方法。而今天我们要探讨的是,在理解概率时的两个指导原则:对称性和普遍性。
对称性在概率论中能起到以下作用:如果不同的结果是等价的,那它们应该具有相同的概率。这两个结果可能看起来并不一样(比如硬币是正面着陆还是背面着陆),但产生结果的过程(硬币旋转的机制)丝毫不关心哪一面落地的问题。这种对称性让我们可以判断出硬币正面着陆的概率应该与背面着陆的概率相同——都为1/2。与之相似的还有骰子,投掷出骰子上六个数字中的任何一个的概率都应相同,即得到每个数字的概率皆为1/6。
对称性是概率论中的一个强有力的指导原则,如同它在数学中的许多领域一样。但是,在将它应用于现实世界中的概率时,就需要更加谨慎了,即便是在简单的情况下。例如,想象你有两个信封。它们各自包含了一张支票,其中一张的金额比另一张高出两倍。你选择其中一个信封,并将其打开,得知了里面所含的金额。现在你有一次机会决定是否保留这些钱,又或者换另成一个信封。你会怎么做?
我们先假设你选中的信封中所含金额数为x,那么这意味着另一个信封中装的金额要么是2x,要么是x/2,这两种金额的概率都是1/2。所以如果换掉信封的话,你所得金额的期望值为。由于这个结果比一开始的x更大,所以应该换。但如果你在看信封之前就被要求做出选择呢?你就会发现自己会不断地改变想法,最终被困在一个无限循环的交换过程中。这就是概率论中著名的双信封悖论。
一旦你意识到不同的结果是不对称的,你就会发现这并不是什么悖论。如果在你的第一个信封中的支票是10万,那么你就会选择保留,因为冒着失去5万的代价太大。但如果你看到的是5块钱,那你就会很乐意赌一把。更重要的是,你还需要将对提供这两个信封的人愿意给出多少金钱的先验概率考虑在内。对称性表明,所有可能的数额都具有相同的可能性——这不仅完全不现实,还会造成不适定(ill-posed)的概率模型。
上述情况没有足够的信息来构建完整的模型。这个例子阐明了一个非常重要的论点——即盲目地遵循对称性原则可能导致错误的数学模型的使用,或者诱使你错误地认为你有足够的信息来创建一个这样的模型。而使用错误的数学模型可能会造成非常严重的后果。1999年,Sally Clark被控谋杀了她的两个孩子并被法庭审判。辩方的辩词为,两名孩童都死于婴儿猝死综合症(SIDS)。
而检方的一位专家证人认为,两个孩子都死于SIDS的概率是一个孩子发生猝死事件概率的平方,也就是说在一个家庭中出现两个SIDS事件的概率为7千3百万分之一。但是,这个论点基于的是假定这两次死亡事件是各自独立的,却忽视了未知的环境或遗传因素可能导致一个家庭更易患上SIDS,使二次死亡的几率变大。这种不正确的数学模型,连同呈上的统计证据里的基本错误,导致Clark被判监禁。
虽然她的罪名最终在上诉中被推翻,但却给Clark和她的家人带来了难以承受的可怕经历。而这个事件也是使用有缺陷的统计论证之所以危险的一个示例。在将概率应用于现实世界中的情况时,我们必须非常小心谨慎,无论情况看上去有多么简单。但是概率论确实可以让我们在不具有完整知识的条件下对情况进行分析和描述。将这些数学与真实事件联系起来可能会造成问题,但试图了解这种现实世界的情况刺激着数学的发展。
随机性的数学描述能让我们更深入地了解周围的世界。普遍性是理解概率的第二个指导原则,它比对称性更为微妙。普遍性的思路是,如果一个结果是由许多不同随机来源造成的,那么根本机制的细节应该不重要。在更大的尺度范围内这个概念来自于理论物理。例如,流体有着大致相同的行为,即使组成它们的分子有着非常不同的形状和特性。如果用显微镜观察两种不同流体中的分子,就会发现它们看起来很不同。
但是,如果只是在宏观尺度下观察这两种不同的流体,就会看到非常相似的行为。所有流体的行为都可以用一个相同的数学模型——纳维-斯托克斯方程——来描述,它只涉及到少数的几个参数。概率论也是这样一个相似的故事。在宏观尺度下,信息被汇总、聚集,并且在有的时候,相同的数学可用来描述有着不同基础过程的结果。在数学中,中心极限定理就是能体现这一概念的一个例子。
它说的是,如果将许多随机量混合在一起,那么结果将始终遵循“钟形曲线”——即正态分布的形状。中心极限定理是具有普遍性的。它描述的是,测量某一性质的大量平均值会遵循正态分布,即便这一性质本身的分布并非正态。例如,多次抛掷硬币的分布是均匀的——正面朝上与背面朝上的次数几乎各占一半。
但是如果将硬币抛掷100次,正面朝上记为0,反面朝上记为1,取其平均值;再掷一100次硬币,并再取其平均值,循环往复,直到得到很多平均值……那么这些平均值将呈正态分布,且它们的均值为0.5。与流体动力学的情况类似,基本属性分布的微观细节可以忽略不计,因为平均分布的宏观景象总是正态的。布朗运动的发现是普遍性中最著名、也最令人惊喜的例子。
1827年,苏格兰植物学家罗伯特·布朗在显微镜下观察悬浮在水中的花粉粒。他观察到花粉粒所释放的微观粒子表现出高度不规则的运动,使他非常困惑。在巨大的好奇心被激发之后,他继续进行了多项实验,排除了周围环境或实验设置中任何能导致这种抖动的外部因素,以及因为粒子是有机的这种内部原因。(他在无机颗粒——煤尘中也观察到了同样的运动。
)到了1905年,爱因斯坦和Marian Smoluchowski分别独立的对这种抖动的运动作出了解释:流体中振动的流体分子会对微观粒子施加微小的作用力,因而这许多的独立的微小作用力积聚起来与微观粒子对抗。由此而产生的布朗运动是随机的,你无法确切地预测其中一颗微粒从某一时刻到另一时刻的位置变化。但是你可以指定一个描述粒子可能移动到哪个位置的概率分布。
爱因斯坦和Smoluchowski意识到,用来描述这种概率分布随着时间推移而发生变化的数学,与描述热量流经物体的数学(即热传导方程式)是一样的。1908年,让·佩兰通过实验验证对这一理论进行了定量预测,这不仅证实了布朗运动的描述,并且解决了当时对于原子存在的争论。布朗运动是普遍的。无论所涉及的粒子和流体分子有着怎样的特定形状、以及基础细节,我们在许多微粒的随机运动中都能观察到布朗运动。
但这种普遍性能进一步延伸。其实早在1900年,法国数学家路易·巴舍利耶在研究金融系统时,就首次用数学描述了布朗运动。Bachelier将股票价格的演变描述为由于无数交易的发生导致的价格微小波动的积累。与花粉微粒的运动一样,股票价格的演变不可能被准确的预测。但是,却可以用一个概率分布来描述股票价格在价值上的变化,并且描述这个概率分布演变的还是热传导方程,这是一个奠定了金融数学基础的发现。
布朗运动的发现以及它的普遍性的故事,说明了数学用概率描述复杂事件的能力。它还彰显出数学和物理学可以用意想不到却富有成效的方式互通有无。普遍性原则证明了在试图理解更复杂的系统时研究简化的“玩具”模型的必要性,并强调了看似不同的系统之间的联系。