保罗·列维的“黑天鹅”:离群值的物理学

作者: David D. Nolte

来源: 集智俱乐部

发布日期: 2023-08-14 09:25:15

本文探讨了保罗·列维的“黑天鹅”理论,即离群值的物理学,介绍了列维分布在自然现象中的常见性,以及列维飞行在动物觅食、股票价格波动等现象中的应用。文章还分析了华尔街的完美对冲理论及其失败的原因,以及稳定分布在概率论中的重要性。

保罗·列维的“黑天鹅”:离群值的物理学

David D. Nolte

返朴

2023-08-14 09:25:15

转自公众号:集智俱乐部

http://mp.weixin.qq.com/s?

__biz=MzIzMjQyNzQ5MA==&mid=2247670165&idx=1&sn=5b6db5cd18905ffa074a8fb8239f64a1

加星标,才能不错过每日推送!方法见文末动图

导起概率分布,高斯分布和泊松分布似乎是我们知道的一切,然而,列维分布实际上在自然现象中十分常见。一种被称为“列维飞行”(Lévy flight)的随机游走,可以很好地模拟动物觅食、股票价格波动、地震和湍流等现象。

黑天鹅是罗马诗人尤韦纳尔(Juvenal)发明的一种神兽,用来比喻稀少到只能想象的事物,他的原文是“土地上的稀有鸟类,非常像黑天鹅”。可以想象,1697年荷兰探险家威廉·德·弗拉明(Willem de Vlamingh)第一次在澳大利亚看到黑天鹅时的震惊。这个比喻演变成一种新的用法,指当一个广泛持有的信念(黑天鹅的不可能性)被新的观察结果驳倒。

黑天鹅是指在一系列数据点中出现的异常测量。

在黑天鹅事件发生前,数据点表现正常,遵循我们所期望的常规统计,可能是高斯分布,也可能是主导大多数变量现象的其他指数形式。但黑天鹅出现了,它的数值出乎意料,与其他所有测量结果都不一样,以至于人们常常认为它是错误的,甚至可能将其丢弃,因为它破坏了原本不错的统计数据,这一数据点以不可忽略的方式扭曲了平均值和标准差。

对于这种令人心烦的事件,人们的反应是获取更多数据,让平均值再次稳定下来……直到另一个黑天鹅出现,再次偏离平均值。然而,这种异常值(outlier)往往不是虚假的测量结果,却是测量过程的自然组成部分,在不影响研究统计完整性的情况下,不应该也不可能将其剔除。

2007年,作家塔勒布(Nassim Nicholas Taleb)在其极具影响力的著作《黑天鹅:极不可能事件的影响》(The Black Swan: The Impact of the Highly Improbable)中指出,无论是商业、新技术开发、选举还是金融市场行为,离群值现象几乎是现代生活方方面面的核心部分。

华尔街的完美对冲费舍尔·布莱克(1938-1995年)是博士生导师的噩梦。

他1959年本科毕业于哈佛大学物理系,但在研究生阶段转学数学,后来又转学计算机,再后来又转学人工智能,之后他因严重缺乏专注力而被哈佛大学研究生项目开除。于是,他加入兰德公司,在那里他有时间发挥自己的想法,最终找到麻省理工学院的马文·明斯基(Marvin Minsky),在后者的帮助指导下,写出一片可接受的论文并被允许提交给哈佛大学应用数学博士项目。之后,他进入金融市场工作。

他对金融理论的著名贡献是1973年与拜伦·斯科尔斯合著的论文《期权和公司负债的定价》。套期保值是华尔街的古老传统,指经纪人卖出期权(在以后以给定的价格购买股票),假定股票会贬值(卖空),然后买入一定数量相同资产的股票(买多),作为价格上涨的保险。如果经纪人在足够多的多头股票和足够多的空头期权之间取得平衡,那么投资组合的价值就不会受到标的资产价值每日波动的影响。

这种投资组合就是叫做金融衍生产品(derivative)的一种金融工具。之所以叫衍生产品,是因为投资组合的价值来源于相关资产价值,其面临的挑战,是在到期前随时找到其“真实”价值。如果经纪人知道衍生品的“真实”价值,那么买卖衍生品就不会有风险。要做到无风险,衍生品的价值就必须不受波动影响。这乍看起来是个难题,因为波动是随机的,无法预测。

但实际上,解决方法恰恰依赖于这种随机性条件,如果股票价格的随机波动等同于平均收益率上叠加随机游走,那么就可以肆无忌惮地构建完美对冲。

稳定分布:黑天鹅是常态当保罗·列维(Paul Lévy)(1886-1971年)于1919年应邀在巴黎综合理工学院发表三场关于随机变量的演讲时,概率论的数学理论还只是一种原理和证明的松散集合。

从这些讲座中产生的,是他一生对这一领域的研究,如今这一领域已发展成为数学的主要分支之一,尽管二战期间他在维希法国的反犹主义环境中艰难前行,但在职业生涯中成就卓著,硕果累累。他的论文导师是著名的雅克·哈达玛(Jacques Hadamard),他的学生之一是著名的贝努瓦·曼德布洛特(Benoit Mandelbrot)。

列维撰写了多本具有影响力的教科书,奠定了概率论的基础,他的名字几乎成为这一领域的代名词,其中一本著作是关于随机变量的加法理论,他在书中扩展了稳定分布(stable distribution)的概念。

概率论中,如果来自一个分布的两个独立随机变量之和具有相同的分布,那么这类分布就被称为稳定分布。正态分布(高斯分布)显然具有这一特性,因为两个正态分布的独立变量之和也是正态分布,方差和均值可能不同,但函数形式仍然是高斯分布。

列维分布最重要的特点是在大数值时具有幂律尾部。例如,α=1时列维分布的特例是正值x的柯西分布,其公式为在大多数情况下会随着x-(α+1)而下降。

柯西分布是可归一化的(概率积分为一),其特征尺度由γ设定,但它的均值是发散的,违反了中心极限定理。对于满足中心极限定理的分布,增加分布的样本数可使均值收敛于一个有限值,然而,对于柯西分布来说,增加样本数会增加出现黑天鹅的几率,黑天鹅会使均值偏斜,在样本数无限多的情况下,均值会发散到无穷大。这就是为什么说柯西分布有一个“沉重的尾部”,它包含罕见但振幅较大的离群事件,这些事件会不断移动平均值。

下图显示了在α=1(柯西分布)和α=2(高斯分布)之间的列维稳定概率分布函数示例。即使在非常接近高斯分布的α=1.99的情况下,也可以看到严重的重尾现象。图中显示了α=1、α=1.4和α=2的二维列维随机游走的例子。在高斯分布的情况下,均方位移表现良好且有限,然而,所有其他情况下,均方位移都是发散的,这是因为当α接近1时,路径长度变大的可能性增大。

列维随机游走

随机游走是统计物理学的基石之一,也是布朗运动的基础。爱因斯坦利用布朗运动推导出著名的扩散统计力学方程,证明分子物质的存在;让·佩林(Jean Perrin)因其对爱因斯坦理论的实验证明而获得诺贝尔奖;朗之万(Paul Langevin)利用布朗运动将随机微分方程引入统计物理学;而列维则利用布朗运动来说明数学概率论的应用,并写下了他最后一本颇具影响力的著作。

对随机游走的大多数研究都假定步长或速率为高斯或泊松统计,但当步长取自列维分布时,就会出现一种特殊形式的随机游走。这就是列维随机游走,贝努瓦·曼德布洛特(Benoit Mandelbrot)(列维的学生)将其命名为“列维飞行”(Lévy Flight),并对其分形特征进行研究。

列维随机游走最初是作为理想数学模型来研究的,但近年来对其有许多发现,在动物觅食行为中观察到列维随机游走,甚至在细菌的奔跑和翻滚行为中也观察到列维随机游走,据推测,这种觅食策略能让动物对随机分布的食物来源进行最佳采样。有证据表明,分子在细胞内运输中存在列维行走,这可能源于拥挤的细胞内邻域内的随机运动。

人们还观察到一种中间状态,即细胞内的细胞器和囊泡在沿着细胞骨架附着、迁移和脱离驱动它们的分子马达时,可能具有列维行走的特征。

UUID: c93de9b0-51ac-4c8e-8e1f-74257e152ea3

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/返朴公众号-pdf2txt/2023/返朴_2023-08-14「转」_保罗·列维的“黑天鹅”:离群值的物理学.txt

是否为广告: 否

处理费用: 0.0103 元