因为这个数学悖论,美国曾不允许宣传吸烟导致肺癌

作者: 七君

来源: 把科学带回家

发布日期: 2020-02-13

本文探讨了因辛普森悖论,美国政府曾不允许宣传吸烟导致肺癌的历史背景和科学依据。文章详细解释了出生体重悖论和幸存者偏差,并讨论了在科学研究和日常生活中分辨因果关系的困难。最终,通过大量研究证据和统计模型,确立了吸烟和肺癌之间的因果链。

现在大部分人都知道吸烟会导致肺癌,对孕妇和胎儿也有害。但是在50年前,一些著名科学家曾经认为,吸烟对某些胎儿有好处,而美国政府甚至在1984年之前不允许宣传“吸烟导致肺癌”。这到底是怎么回事呢?

事情要从50年前说起。在20世纪50年代的时候,有不少证据指出,吸烟会导致肺癌。可是在60年代的时候,一些研究发现,如果孩子生下来的时侯体重过轻,那么母亲吸烟对孩子反而是件好事,这就是经典的出生体重悖论。

对我们来说这个现象显然违背基本常识,但要注意,我们的“常识”建立在科学界的共识上。在当时,科学界针对这个诡异的现象,站成了两派。加州大学伯克利分校的生物统计学家Jacob Yerushalmy就是赞同吸烟对体重过轻的婴儿有好处的那一派。

1959年,Jacob Yerushalmy主持了一项大型的长期研究,他收集了超过1.5万名旧金山湾区儿童的数据,包括他们出生体重、他们的母亲是否吸烟等。当时科学家们已经知道,吸烟的母亲生下的孩子的体重比不吸烟的母亲要低。而美国的一项全国性研究也发现,低出生体重(LBW)的婴儿在人生头年的死亡率是正常体重婴儿的20倍。

所以,我们很容易得出这样的因果逻辑链:母亲吸烟——>婴儿出生体重偏低——>婴儿死亡。但是,数据给出的结果却出乎许多人的意料:吸烟母亲生下的LBW婴儿的死亡率要比不吸烟的母亲生下的LBW婴儿低。换句话说,如果只看LBW婴儿,我们就会得出这样一个结论:母亲吸烟反而有好处。

在报告这个悖论时,Yerushalmy写道:“这个悖论的发现驳斥了吸烟有害胎儿健康的观点。”如果吸烟真的对胎儿有害,那要怎么解释这个令人困惑现象呢?出生体重悖论在近50年的时间里难倒了许多生物学家和统计学家,许多人甚至把它看成出生体重特有的矛盾。

在2001年发表在International Journal of Epidemiology上的一项研究中,美国国立环境卫生研究所生殖流行病学小组组长、流行病学家Allen J Wilcox指出,后来越来越多的证据驳斥了Yerushalmy的观点,证明吸烟对母婴是有害的,比如吸烟会影响氧气通过胎盘的传输,出生时体重较轻的人日后患有哮喘、高血压,或者智商更低的可能性也更高。

因为出生体重能预测婴儿未来身心健康的许多方面,因此在美国,增加出生体重就成为减少婴儿死亡率的一大举措。但是,出生体重悖论却一直没有被解决。直到2006年,波士顿大学和美国国家儿童健康和人类发育研究所的研究者发表在《美国流行病学杂志》上的一项研究才提出了令人信服的解释。

原来,吸烟的确会导致LBW,但是LBW的成因并不只有母亲吸烟一个。许多更严重的疾病也会造成LBW,比如基因缺陷或者营养不良。这样一对比,在所有LBW的原因中,吸烟算是伤害点比较小的那个了。反过来说,如果LBW的孩子母亲不吸烟,那么造成LBW的原因往往比吸烟更严重,因此孩子的死亡可能性也更高。

话说回来,类似的悖论在生活中层出不穷。再举个例子,医学研究发现,酒精成瘾和肝癌都会造成血液中的转氨酶升高。转氨酶是肝脏的一种重要蛋白质,如果肝脏受损,那么血液中转氨酶的浓度就会上升。但奇怪的是,在转氨酶比较高的患者中,酒精成瘾的人的短期死亡率反而比不喝酒的人要要低。

这个悖论的解法也是一样的:如果你不喝酒,那么如果你转氨酶升高,更可能的原因就是肝癌。这些悖论告诉我们,分辨因果关系是多么困难的一件事,哪怕是常年和数据打交道的科学家们也无法轻易下结论。

幸存者偏差出生体重悖论和酒精成瘾悖论让许多人感到不寒而栗:用日常生活中的现象得出的经验啊、因果关系啊会不会都是假象呢,我们有什么办法能够辨明真相呢?想要获得真相,也就是真正的因果关系,就必须要先来了解一下对撞因子偏误。

实际上,出生体重悖论是对撞因子偏误的完美案例。对撞因子是啥玩意儿?简单来说,假设我们观察到了现象X和Y,我们想要确认它们之间有没有因果链,那么对撞因子就是能被X和Y影响的另一个因素。对撞因子画成图就是这样的——很多时候,我们觉得X好像是Y的原因,但实际上两者可能没有关系,真正的幕后推手是隐藏的对撞因子。

举个最著名的例子——幸存者偏差。二战期间,盟军从战区飞回来的飞机中,机翼上的弹痕最多,机尾和引擎最少。许多人据此得出结论:应该加强机翼,因为你看机翼的弹孔最多嘛。但是匈牙利数学家、美国哥伦比亚大学教授沃德·亚伯拉罕却认为,要加强机尾和引擎,因为这些部位被打中的飞机根本飞不回来。事实证明果然如他所料。

在这个例子里,X就是“中弹部位”,Y是“中弹数量”,“幸存”就是对撞因子。在飞回来的飞机里,中弹部位和中弹数量的确有相关性,因为你看机翼中弹多,机尾和引擎少嘛。但实际上中弹部位和中弹数量没有因果关联,你看电影里打飞机的时候大家都是一顿乱射嘛,只不过它们都可以决定飞机是否能幸存,因而出现了虚假的相关性。

亚伯拉罕明白,所有上过战场的飞机各处弹孔数量是随机的,为什么单单飞回来的飞机都是打在机翼上呢?显然没能飞回来的都打在其他部位了嘛。在科学研究和日常生活中,幸存者偏差层出不穷,所以如果只看那些没死的病人、有钱人、成绩好的人有什么什么特点,很容易就得出错误的结论。

当然,破坏X和Y之间因果链的不止对撞因子,还有干扰因子等,它们都属于可爱又迷人的反派、贯彻爱与真实的邪恶的潜变量,我们在介绍辛普森悖论的时候就简单提到过,有兴趣的可以再回顾一下。

如何证明吸烟导致肺癌?有趣的是,正是潜变量的可能存在,美国政府到了1984年才出台了Comprehensive Smoking Education Act(全面烟草教育法案),开始允许宣传“吸烟导致肺癌”。1984年的全面烟草教育法案出台后,美国售卖的香烟上出现了美国卫生部医务总监的警告:吸烟导致肺癌、心脏病、慢性阻塞性肺疾病、妊娠并发症。

这背后的逻辑其实和出生体重悖论,以及幸存者悖论是一样一样的。既然有一个潜变量致使不能简单地推导出“吸烟导致婴儿死亡”这个说法,那么,是否也存在一个潜变量能够完美拆解“吸烟导致肺癌”这个因果链呢?你想啊,要是存在某个基因,它让你容易烟草上瘾,也让你容易患肺癌,那么吸烟导致肺癌这个说法就站不住脚了啊,是你爸妈没有把你生好才是本质。

烟草公司当然希望把锅丢给你的基因,或者其他什么潜变量。而著名的统计学家、现代统计学的奠基者之一罗纳德·艾尔默·费希尔也是这种看法的坚定支持者。为此,费希尔还在1957年写信给宣传吸烟导致肺癌的《英国医学杂志》,声称这是统计文盲在制造恐慌。

因为统计学大佬亲自为烟草站台,所以当时科学界也在这个问题上抓耳挠腮,争论了数十年。有人可能会说,要是科学研究都可以被潜变量解释,那岂不是所有研究结果都要存疑了?是这样子,但是我们也有建立因果逻辑链的简单粗暴的方法,那就是随机双盲实验。比如,用丢硬币的方式,让某人吸烟或者不吸烟,然后过一段时间观察他们的死亡率,“吸烟导致肺癌”这个问题就可以被轻松证明或证伪。

但问题在于,让人类去当小白鼠是不道德的,所以研究者不能做这样的实验,拿不到直接的证据,只能根据自然的吸烟者和不吸烟者的差别进行研究。这也是为什么,美国要花这么长时间才允许宣传吸烟有害。你可能会问,既然不能拿人类做实验,那么最后是怎么确认这个因果链的呢?

实际上,吸烟和肺癌之间的因果链的确认,靠的是大量研究证据,以及敏感度分析等新一代的统计模型。大量的实验研究逐一推翻了不可能的潜变量,最终说服和绝大部分科学家和政策制定者,确立了吸烟和肺癌之间的因果链。“吸烟导致肺癌”只有6个字,但是这6个字的证明过程却这么复杂,没想到吧!

UUID: 4ee5e036-c328-4be4-bfd7-0368d69cb63d

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/把科学带回家公众号-pdf2txt/2019-2020/2020-02-13_因为这个数学悖论,美国曾不允许宣传吸烟导致肺癌.txt

是否为广告: 否

处理费用: 0.0075 元