三年新冠大流行,给全世界上了一堂关于流行病传播规律的课,基本传染数R0这一概念在大流行的预测模型中随处可见,普通人也知道要通过切断传染途径来遏制病毒的传播。
但是,你知道吗,关于新冠大流行的预测,数学的作用巨大。关于流行病传播的观点,遵循着所有数学预测的基本原理:今天发生的事,明天还会发生。
为何这么说?请看数学家、美国威斯康辛大学麦迪逊分校教授乔丹·爱伦伯格的解读。本章是我在新型冠状病毒感染疫情暴发后写的,当时它已经在全世界肆虐了好几个月,但没有人确切地知道这种疾病的传播过程。它不是一个数学问题,但它与数学有关:何时何地会有多少人被传染?
于是,全世界都开始上关于疾病传播的数学速成课。这个披着现代外衣的话题,让我们想起了本书第3章提及的“蚊人”罗纳德·罗斯。在1904年圣路易斯世界博览会上,英国医生罗斯发表了关于蚊子随机游走问题的演讲,该课题是一个大型研究项目的一部分,旨在将疾病纳入量化领域。
在历史上,瘟疫就像彗星一样突如其来,令人胆战心惊,然后消失不见,没有固定的时间表。牛顿和哈雷“驯服”了彗星,通过运动定律将其“绑缚”到固定的椭圆轨道上。既然如此,为什么流行病就不能遵循普遍规律呢?
罗斯的演讲并不成功。他后来写道:“我本想开启关于病理学的全面讨论,但有人告诉我可以自选主题,于是我宣读了那篇数学论文……这令在场的数百名医生大失所望,因为他们一个字也听不懂!”这番话也适用于描述他本人。
罗斯一心想将数学观点引入医学领域,而非得到同行的赞誉。《英国医学杂志》的编辑写道:“这位杰出的实验方法倡导者热衷于将定量分析过程应用于流行病学和病理学的问题,当他的一些同行发现这一点时,他们在吃惊之余可能还会感到些许遗憾。”
他也有点儿自以为是。英国《皇家医学会杂志》上的一篇评论指出:罗纳德·罗斯爵士给人留下了自负、爱生气和贪图名利的印象。
在某种程度上,他具备上述所有特点,但这些并不是他仅有的或最主要的特点。例如,他以慷慨地支持年轻科学家而闻名。在任何层级组织中,你都会发现有的人对地位等于或高于自己的人很友好,而对地位低于自己的人则不屑一顾;你还会发现,有的人把公认的大人物视为对手和敌人,而对新人却表现得很友善。罗斯属于后者,总的来说,这种类型的人更受欢迎。
在1900年前后的数年时间里,针对疟疾研究方面的重大突破的荣誉归属问题,罗斯与意大利寄生虫学家乔瓦尼·格拉西展开了激烈的学术论战。即使在罗斯获得了诺贝尔奖而格拉西一无所获后,罗斯似乎仍未觉得自己得到了应有的认可,他与格拉西的争论也演变为对支持格拉西的意大利人的普遍不满。
他在圣路易斯世界博览会上的演讲险些泡汤,因为当罗斯得知他的座谈小组成员包括罗马医生安吉洛·切利时,他立即取消了行程,直到经电报确认切利已被说服退出座谈小组,罗斯才回心转意。
罗斯受封为爵士,也当上了以其名字命名的科研机构的负责人,但即使有一项又一项的荣誉加身,也永远填不上那个“洞”。尽管没有什么财务压力,但他花了数年时间四处活动,呼吁议会为他颁发奖金,表彰他为公共卫生事业做出的贡献。1807年爱德华·詹纳因为研发天花疫苗而获得一笔奖金,罗斯觉得他也应该得到这样的奖励。
暴脾气伴随了他一生,这可能是因为他潜意识里认为自己的人生道路偏离了原本的方向。
令人惊讶的是,作为一名如此杰出的医生,罗斯却说他进入医疗行业“仅仅是责任感使然”,而他真正向往的两个追求被搁置了。其中一个追求是诗歌,他在整个职业生涯中一直坚持写诗。为他的疟疾理论找到相关的实验证明后,罗斯即兴创作的诗句(“伴着泪水和艰难的呼吸/我找到了狡猾的种子/谋杀了百万生命的死神啊”)成为当时有关他的传说中众所周知的一部分。
20年后,他又写了一首个性十足的诗《周年纪念日》,抱怨自己没有得到充分的认可(“我们创造的无数奇迹/平庸的世人却不屑一顾……”)。罗斯的另一个追求是数学。他在回忆自己早期受过的几何学教育时说:“在数学方面,欧几里得几何对我来说实在难以理解,直到我遇见了令我茅塞顿开的《几何原本》第一卷的命题36。此后,我再也不觉得几何学难了,还取得了优异的成绩。我喜欢解题,有一天凌晨我甚至在睡梦中解出了一道题。
”当时还是马德拉斯的一名年轻医生的罗斯,从书架上取下一本关于天体力学的书。这本他从学生时代开始从未看过的书,让他经历了一场“大灾难”——突然陷入了对数学的痴迷状态。他购买了当地书店在售的所有数学书,并且在一个月内就把它们读完了:“虽然我在校期间没学过二次方程,但这一次我甚至学习了变分法。”
他吃惊地发现,自此一切都变得非常容易,他将其归因于没有人强迫他做这件事。
“教育必须主要依靠自主学习,无论是在校期间还是放学后,否则就永远不会有成效。”所有数学老师都会认同这一点——我希望我在黑板前的讲解权威而清晰,我对材料的理解高效而直接,这样一来,学生们在与我一起度过的50分钟里,就能完全掌握课堂内容。但教育并非如此,而是像罗斯理解的那样,教育依靠的是自主学习。作为老师,我们的工作是授业解惑,但也是市场营销。
我们必须向学生兜售一种理念:为了真正掌握这些数学知识而花些课余时间是值得的。实现这个目标的最好方法是,让我们在举手投足间流露出对数学的热情。
1910年前后,罗斯准备认真解决他在马德拉斯时突然想到的问题:就像牛顿建立了天体力学理论一样,他也要为流行病建立一种数学理论。事实上,罗斯还有更雄伟的抱负,他想构建一种理论来支撑任意条件变化在人群中的定量传播研究,包括宗教信仰的转变、专业团体的选举、征兵,当然还有传染病暴发。他称之为“发生理论”(The Theory of Happenings)。
1911年,罗斯在给他的门生安德森·麦肯德里克的信中写道:“我们终将建立一门新科学。不过你和我要先打开这扇门,然后喜欢它的人就可以走进去了。”尽管他对自己的能力评价很高,也甘当一名业余爱好者,但为了打开那扇门,他付出了最大的努力。他雇用了一位真正的数学家来帮助他,她的名字叫希尔达·哈德森,当时哈德森的数学造诣远高于罗斯。
在哈德森发表的第一篇文章中,通过巧妙地将正方形分解成更小的几何图形,她给出了关于欧几里得几何命题的简短新证法。那一年,她才10岁。(她的父母也都是数学家,这对她大有帮助。)
哈德森的专业领域叫作代数几何,顾名思义就是几何学和代数的混合领域。哈德森是二体和三体克雷莫纳变换领域的领军人物,并在1912年成为第一位在国际数学家大会上演讲的女性。
1916年,在她开始与罗斯合作的时候,哈德森出版了一本欧几里得几何风格的尺规作图书。亚伯拉罕·林肯曾试图利用尺规作图解决化圆为方的问题,但费了一番工夫还是失败了。哈德森的几何直觉如此强烈,以至于她的论述有时会因为缺乏证明而遭到批评。虽然有些东西对她来说显而易见,但对那些不善于想象几何图形的人来说,还是需要做出文字说明的。
尽管罗斯热爱几何,但没有证据表明他对哈德森在纯粹数学方面的研究产生过兴趣或进行过交流。也许这是一件好事,因为代数几何领域挤满了意大利人。
在罗斯与哈德森合作发表的第一篇论文中,开头部分罗列了罗斯的上一篇论文中出现的大量错误。罗斯把这些错误归咎于他的论文校样送来校对时他在国外,真是太不凑巧了。我喜欢想象这样的情景:他们俩的合作刚一开始,哈德森就立刻温和地告知罗斯他之前的研究中存在不少错误。
有关他们俩之间交流的记录非常少——罗斯在他的回忆录中只提到过哈德森一次,但想象这两位截然不同的科学家之间的关系,是一件很有趣的事。罗斯有无限的雄心抱负,而哈德森有深厚的数学造诣和技能。罗斯拥有多个头衔,得过不少奖,而在那个教授全是男性的时代,哈德森就只是一名讲师。即使罗斯对宗教有感情,他也不会把它看得太重,而哈德森是虔诚的基督徒,宗教信仰在她的生活中占据了核心地位。
她于1925年发表的文章《数学与永生》(Mathematics and Eternity)是一篇引人注目的文献,在她文中的那个知识世界里,信仰和科学都觉得有必要向对方证明自己。她写道:“我们在代数课上练习与神同在,效果比在劳伦斯弟兄的厨房里更好。我们在人迹罕至的角落里独自做研究,效果比在山顶上更好。
”每位数学家,无论是否信仰宗教,都会明白她在这句本应广为流传的格言中表达的意思:纯粹数学的思想是真的,而不是近似的或可疑的。它可能不是上帝最有趣或最重要的思想,但它是我们确切知道的唯一思想。
罗斯关于流行病传播的观点遵循一个基本原理,事实上,它也是所有数学预测的基本原理:今天发生的事,明天还会发生。所有令人不悦的琐事的源头都在于,弄清楚该原理在实践中意味着什么。
举个最简单的例子。
假设一个携带传染性病毒的人在传染期(10天)内平均会传染2人,如果一开始有1000名感染者,那么10天后,大约又会有2000人被传染。最初的1000人现在已经康复,不再具有传染性,但这2000名新感染者将在10天内将病毒传播给另外4000人。之后再过10天,又约有8000人被传染。所以第30天的感染人数是:第0天:1000人,第10天:2000人,第20天:4000人,第30天:8000人。
这种数列被称为几何数列(等比数列),尽管它与几何学之间的联系有点儿模糊。这个名称的由来是:这种数列的每一项都是其前一项和后一项的几何平均数。
平均数是什么意思?几何平均数又是什么意思?平均数不止一种。我们熟悉的平均数是通过在数轴上的两个数正中间画一个点得到的。1和9的平均数是5,因为5和1之间的距离是4,5和9之间的距离也是4。这种平均数叫作算术平均数,我猜想原因在于它是通过加减法的算术运算得到的。如果数列中的每一项都是其前一项和后一项的算术平均数,这个数列就是一个算术数列(等差数列)。
几何平均数不同于算术平均数。要求1和9的几何平均数,你需要画一个宽和长分别为1和9的长方形,几何平均数是与这个长方形面积相等的那个正方形的边长。几何平均数是柏拉图的心爱之物,据说他认为几何平均数是最真实的平均数。图中的长方形的面积为1×9=9,如果某个正方形的面积也是9,它的边长的平方就等于9,简言之,它的边长为3。所以,3是1和9的几何平均数,(1, 3, 9)是一个几何数列。
今天,我们更倾向于用一种不同但等价的方式来定义几何平均数。如果y是x和z的几何平均数,那么y/x=z/y。病毒以几何数列模式传播,并不是因为它们喜欢计算长方形的面积,也不是因为它们读过柏拉图的著作,而是因为病毒传播机制要求第一个传染期与第二个传染期的感染人数之比和第二个感染期与第三个传染期的感染人数之比相同。
今天发生的事明天还会发生,在我们的例子中,每过10天新发病例数量就会增加一倍,我们称这样的数量增长方式为“指数增长”。人们经常用“指数增长”作为“增长迅速”的同义词,但前者更具体一些。
每个数学老师都渴望找到一个例子,让学生真正明白指数增长是怎么一回事。不幸的是,此时我们手边就有一个。我们的“工厂标准”的直觉很难理解指数增长。
我们已经习惯了物体以大致恒定的速度运动,如果以每小时60英里的速度开车,那么每过一小时的行驶距离依次为:60英里,120英里,180英里,240英里……这是一个算术数列,它的连续项之差保持不变,从前到后各项以恒定的速度增长。而几何数列则是另外一回事。我们的思维将其理解为先缓慢、稳定、可控地增长,随后增速急剧飙升。但从几何意义上讲,几何数列的增速从未改变。
第二个感染期的增速跟第一个感染期差不多,但其糟糕程度是第一个感染期的2倍。这场灾难是完全可以预测的,我们却未能充分预料到它的发生。
看看约翰·阿什贝利是怎么说的,他可能是唯一提及这个问题的美国诗人。
他在1966年发表的诗《最快的治愈》中写道:犹如几何数列友好的开端不让人放心……在新冠感染疫情暴发初期,意大利是受影响最严重的国家之一,不到一个月疫情就夺走了1000人的生命;随后4天,又有1000人死亡。2020年3月9日,这种疾病已经开始在全世界范围内传播,美国领导人却无所不用其极地淡化它的威胁,将其与每年导致数千名美国人死亡的流感相提并论:“目前有546例确诊病例,其中有22人死亡。
你们想想吧!”一周后,每天都有22名美国人死于新冠感染。又过了一周,这个数字几乎增长了10倍。
伴随几何数列而来的有好事也有坏事。假设一个携带某种传染性病毒的人在传染期内(10天)平均会传染0.8人而非2人,感染者数量的几何数列就是这样的:第0天:1000人,第10天:800人,第20天:640人,第30天:512人,接下来的4个数字就更小了:第40天:410人,第50天:328人,第60天:262人,第70天:210人。这种趋势叫作“指数式衰减”,是被我们战胜的流行病的一个数学特征。
几何数列的连续项之比意义重大。当它大于1时,病毒就会迅速传播,相当大比例的人口都会遭殃。当它小于1时,疫情则会逐渐消亡。在流行病学界,它被称为R0(基本传染数)。1918年春西班牙流感暴发时,R0约为1.5。2015—2016年,由蚊子传播的寨卡病毒的R0约为2。20世纪60年代,在加纳暴发的麻疹疫情的R0高达14.5!
R0较低的流行病的传播情况如图所示:大多数感染者即使有传染性,也只会传染一个人,所以感染链通常在疾病发生大面积传播之前就消亡了。
当R0略大于1时,你会看到图上有“树枝”萌生出来。当R0远大于1时,你会看到快速的指数增长,新的“分枝”不断地从图上萌生出来,疫情传播至更大面积的人群。
如果人们感染这种疾病后会产生免疫力,那些“分枝”就不会回过头来依附到已经患病的人身上,因此这种流行病的传播网络是我们在前文中见过的一种几何图形——树状图。基本阈值R0=1是罗斯的流行病思想的核心。罗斯发现蚊子会传播疟疾,这是一个巨大的进步,但也造成了一定的悲观情绪。灭蚊很容易,消灭所有的蚊子却很难,你可能会据此认为人类根本无法阻止疟疾的传播。然而,罗斯坚决否定了这种观点。
只要有按蚊四处飞行,其中一些就会叮咬疟疾感染者,然后飞到别处去叮咬其他没有感染疟疾的人。因此,疟疾会持续传播。但如果蚊子的密度足够低,R0这个神奇的数字就会降至1以下,这意味着每周的新发病例数量会越来越少,疫情呈指数式衰减直至消亡。所以,我们不需要阻止疾病的所有传播,而只需要阻止足够多的传播。这就是罗斯在1904年圣路易斯世界博览会上宣扬的理念。
他的随机游走理论意在表明,一个地区的蚊子数量减少后,需要经过相当长一段时间,才会有足够多的蚊子进入该地区,并将其密度推升至流行病的暴发阈值。这也是抗击新冠感染疫情的一个关键理念。
我们无须阻止这种疾病的所有传播,更何况这也是不可能做到的。流行病防控不必追求完美。
2020年春新冠感染疫情在美国暴发之初,明显呈现出人们不希望看到的几何级数增长态势。新发病例数量每天增长7%左右,这意味着当周的病例数量是上一周的(1.07)^7倍,增幅超过60%。按照这种发展态势,如果3月底每天有2万例确诊病例,到4月的第一周就会变成每天3.2万例,到5月中旬则会变成每天42万例。100天后,即到7月初,每天会有1700万例新发病例。
现在,你看出问题了吗?
疫情的传播不可能保持每天1700万例新发病例的速度,否则不到3周,美国的累计感染人数就会比美国人口还多。正是这种太过随意的推理过程,导致美国疾病控制与预防中心的马丁·梅尔泽建模团队在2001年做出预测:如果在美国境内故意释放天花病毒,那么一年内将会有77万亿人被感染。(一位同行评论道:“梅尔泽博士的计算机时不时就会失去控制。”)由此可见,我们提出的流行病几何数列传播模式出问题了。
让我们回到神奇数字R0,它衡量的是每个感染者造成的新发病例数量。R0是一个自然常数,它既取决于特定传染病的生物学特征(菌株不同,生物学特征就可能会不同),也取决于每个感染者在传染期内遇到的人数(传染期的时长不同,遇到的人数就可能会不同。我们能否通过适当的治疗缩短传染期呢?),还取决于感染者与其他人相遇时发生了什么(他们是彼此站得很近,还是像现行指导方针建议的那样相距6英尺以上?有没有戴口罩?
是在户外还是在通风不良的建筑物内?)。
但是,即使疾病和我们的行为都没有改变,R0也会随时间而改变。这仅仅是因为,病毒逐渐找不到新的感染者了。假设有10%的人口已经感染了,漫不经心的无症状感染者过着像往常一样的生活,他可能还会对着同样数量的人咳嗽,但其中有1/10的人已经感染或康复,从而对再感染产生了部分抵抗力。所以,平均来说,他在传染期内并没有传染2个人,而是只传染2×90%=1.8人。
当30%的人口已经感染时,R0就会降至0.7×2=1.4人。当60%的人口已经感染时,R0就会变成0.4×2=0.8人,这意味着我们越过了临界线。此时,R0不是比1稍大,而是比1稍小,几何数列也随之由坏变好。
事实上,感染者的比例甚至可能达不到60%。不管这个比例(我们称之为P)是多少,新的R0均为:(1−P)×2。当R0=1时,疫情开始呈现出指数式衰减的态势。
换句话说,当P=1/2时,就会出现这种情况。因此,一旦有50%的人口感染,R0为2的流行病就会开始消退,这被称作“群体免疫”。只要有足够多的人能抵御疾病,流行病就会难以为继。但“足够多”的具体数量取决于R0,如果它是14(比如麻疹),就需要让1−P=1/14,这意味着必须有接近93%的人口免疫。这也是即使只有少数小孩子不注射麻疹疫苗,也会造成严重的麻疹疫情的原因。
对于R0为更温和的1.5的疾病,在感染者比例达到33%时就会产生群体免疫。我认为新冠感染疫情的R0是2~3,如果这种估计是正确的,当全世界有1/2~2/3的人口已经感染了这种病毒时,疫情就会开始消退。但这也意味着会有很多人生病或死亡。所以,尽管全世界的流行病学家在很多具体细节上意见不一,但他们几乎一致认为我们不应该对新冠感染疫情放任不管。