2018年3月5日,美国加利福尼亚州的汉福德镇爆发了一起传染病。最初只有几个人生病,但在接下来的一个月里,有一百多人相继生病,症状为呕吐和伴随高烧的颤抖,通过血液检查证实这些人都患有伤寒。后来才发现,这些病人是在同一天接触到病原体的。根据疾病报告的记录,在3月17日的教堂午宴和晚宴上,他们都食用了由女性X夫人制作的食物。尽管据她所知,她从未出现过任何相应症状,但调查人员发现,她是伤寒的携带者。
从某种角度来说,这只是另一例让流行病学家记录在册的关于无症状携带者会如何传播疾病的案例,就像20世纪初纽约那起臭名昭着的“伤寒玛丽”事件一样。但这也让我们开始思考另一个有趣的问题:如果这些市民是在同一时间接触到病原体,那为何不同患者发现不适的时间点却如此不同?这个问题在探讨疾病潜伏期的医学文献里已存在很长时间。
1950年,流行病学家Philip Sartwell搜集了包括1914年伤寒暴发报告在内的许多文献,指出像小儿麻痹症、疟疾和水痘在内的许多疾病的潜伏期,似乎都具有相似的模式。他们并不遵循正态分布,也就是说若造成差异的原因能有规律地分布在整体种群中的话,则应出现预期中的钟型曲线。相反,在分布图中可以看到一条长尾出现在右边,表明许多患者往往需要很长的时间才会发病。
此外,分布往往呈对数正态分布,这可以发生在例如所绘制的数据是乘法过程的结果,而非加法过程的情况下。对于在生物学上几乎毫无关联的不同疾病来说,这种共同点似乎很是奇怪。从表面上看,这或许与个体间免疫系统差异有关。通常来说引发喉咙发痒或流鼻涕等症状的是免疫系统中正与入侵病原体相对抗的分子,而不是病原体本身。
而且每个人接触到的病原体剂量也各不相同,例如从门把手的碰触与被喷嚏侵袭所造成的病原体接触就可能很不一样。但这些都只是定性解释,不一定能产生观察到的这种分布。如果我们能明白为什么会出现这种情况,或许就能领先于疾病的发生。现在,有两名研究人员对致病细胞是如何占领健康群体网络的动力学产生了兴趣,并且他们发现了一种依赖于几何和几率过程的数学模型,可以产生这样的分布。
这一模型并不是从感染出发,而是从思考肿瘤细胞的扩散方式开始,他们认为这种思路或许能激发人们对出现这种情况的原因产生新的思考。将这一模型应用于感染或许有点勉强:它的细节与许多病原体生物学并不非常相符;另一方面,他们的研究表明目前关于潜伏期分布的想法从数学检验角度来说并不总是成立。
美国克利夫兰诊所的辐射肿瘤学家和数学生物学家Jacob Scott是新论文的作者之一,他和论文中的另外两位共同作者最初考虑的都是癌症是如何通过生物组织传播的。对于那些癌症发展的触发为已知的实验中,症状出现的时间长度不沿钟型曲线下降,而呈对数正态分布。他们想是否能从生物组织结构的几何形状中获取线索。Scott说:“从空间角度研究肿瘤非常困难,我们才刚开始触及到如何用合理的方式研究这个问题的表面。
”因此,他们创建了一个模型来探索这个问题。为了了解他们的模型,我们可以想象数百个结合在一起的细胞。每个细胞都会碰触到与其相邻的细胞,相邻细胞也和与自身相邻的细胞相连……以此类推,从而形成一个网络。当某一细胞死亡时,与其相邻细胞中的其中之一就会通过自我复制来填补这个空缺。现在想象一下入侵细胞已抵达“战场”,随着宿主细胞的死亡,相邻的宿主细胞和入侵细胞会通过自我复制来争相填补新增的空缺。
入侵细胞征服整个网络需要的时长取决于它们自身的“战斗力”(以及少数其他参数)。如果将此场景反复运行,并绘制出完成这一过程所需的时间,就能得到一条与对数正态分布非常相似的曲线。出现这种分布的原因有几个。
当入侵细胞比宿主细胞强大很多时,例如癌症,入侵细胞能很快地侵占健康的领地,但也会很快遇到瓶颈:它们最后剩下的相邻细胞往往也是入侵细胞,而不是宿主细胞——剩下的宿主细胞非常少,因此入侵细胞的传播速度会急剧下降。之后,它们可能需要花相当长的时间才能找出最后一个宿主细胞,从而产生在分布右侧的长尾。
即便宿主细胞和侵入细胞的实力旗鼓相当,对空间的竞争也是随机的,但研究人员还是发现有时最终占上风的仍是入侵细胞。然后,完成的时间也会沿着接近对数正态分布的曲线下降。研究人员的模型结果表明,这种分布可能源于非常简单和普遍的事物,即细胞彼此存在于空间中的事实,并且入侵者必须在传播过程中努力应对这种安排。在项目进行的过程中,研究人员开始意识到他们正在开发的癌症模型或许具有更广的相关性。
当他们发现Sartwell的那篇关于潜伏时间的旧论文时,便建立了传染病的联系。传染性生物体可能不能取代宿主细胞,但它们的传播可能会受到组织中未被感染的细胞的可用性限制。疾病症状或许只能在入侵细胞已占领了一定数量的组织网络后才会显现,而这一时间会由于个体间差异而有所不同。
论文的另外两位作者是康奈尔大学的数学家Steven Strogatz和研究生的Bertrand Ottino-Loffler,Strogatz说:“这些疾病过程是如此不同。然而,在抽象、定性的层面上,这些形状看起来相同的原因可能是因为它们都是关于健康或正常细胞被侵入的网络。”但是,熟悉传染病的生物学家可能会指出,这一模型的某些具体细节在自然界中并不容易相关。
让宿主细胞死亡来为入侵细胞腾出空间的过程对于某些癌症来说是合理的。或许对肠道受细菌感染的情况也合理,即局部微生物会被杀死或受到入侵者的排挤,但也或许不合理。但正如Scott,Strogatz和Ottino-Loffler所表示的那样,它并不能反映病毒感染是如何传播的,病毒会在受感染的细胞内部累积自己的拷贝,然后向外爆发以便一次感染大量的相邻细胞。
美国埃默里大学里研究病毒种群动态的理论生态学家Katia Koelle教授认为,这是很令人失望的,因为许多病毒感染的潜伏时间似乎都呈对数正态分布。她说:“有了这些未解决的无处不在的模式,采用数学途径是一个非常有趣且值得的努力的尝试。”然而,这个模型与病毒生物学的不相似,使得它并不尽如人意。该模型的作者并不回避它在生物逼真性上的缺点。
但他们认为,免疫学上对感染的不同潜伏时间的解释不能导致我们看到的分布。Strogatz说:“如果你认为宿主群体的唯一变异性是在症状出现的阈值内的正态分布,这意味着人们有不同的免疫系统,那么这样的模型会产生左偏分布。这种预测则与Sartwell看到的相反。
”据华盛顿贝尔维尤的疾病模型研究所的计算流行病学家Benjamin Althouse所述,当需要解释为什么疾病的潜伏期会呈现对数正态分布时,许多研究人员都会引用Sartwell在1950年的论文。为什么会出现这种情况?在他看来,似乎没有人为此做出太多解释。他说:“知道为什么它们都呈对数正态分布是非常重要的。如果知道是什么决定了潜伏期,就可以采取干预措施。
”美国波士顿东北大学网络科学研究所的计算流行病学家Sam Scarpino经常与Althouse合作,他补充说:“例如对于流感病毒来说,可让我们用来采用抗病毒药物以获得显著效果的时机非常狭窄。”如果由于这些潜伏期的影响,导致这种时机在个人之间的差异很大,那么理解它们发生的原因就至关重要。不同疾病的相似潜伏分布可能有多种由巧合汇聚的解释。
正如Scott等人在论文中指出的那样,如果一种病原体呈指数增长,并且某一种群受到的暴露程度也呈统计学正态分布,那么就会导致一个对数正态分布的潜伏时间。细胞在组织中的排列将变得无关紧要。对于科罗拉多大学研究网络动态的计算机科学家Aaron Clauset来说,他想知道的是在什么情况下这些结果更可能发生,以及还可能涉及到的其他因素有哪些。
Clauset说:“我非常喜欢这种研究风格,因为它提醒着我让物理学在20世纪变得如此强大是什么——是理论学家和实验者之间的分工合作,我希望有人会继续这一研究,并最终找出答案。”Scott,Strogatz和Ottino-Loffler则希望有在传染病领域具有更多专业知识的专家们能看到这篇论文,并对这些曲线产生兴趣。之前他们在一本物理学期刊上发表过这一课题的相关工作。
这一次,他们选择将论文提交给备受好评的生物学期刊eLife,是抱着能有免疫学家、流行病学家和其他人能对其产生兴趣的希望,从而测试这一模型是否切实符合实际数据,提出更好的解释。