同性恋是由基因决定的?因为这篇文章,两个团队在 Science 直接干架

作者: 协和小卒

来源: 丁香学术

发布日期: 2021-04-02

2021年3月26日,Science刊发了一篇关于同性恋遗传学特征的评论性文章,引发了科学界的广泛讨论和争议。文章探讨了全基因组关联分析在同性恋研究中的应用,指出了现有研究方法的局限性和争议点,包括表型判断标准的科学性和研究结论的可靠性。

2021年3月26日,国际顶尖学术期刊 Science 刊发了一篇题为 Comment on 「Large-scale GWAS reveals insights into the genetic architecture of same-sex sexual behavior」的评论性文章,再次将「全基因组关联分析」和「同性恋的遗传学特征」这两个话题推到了风口浪尖。

文章从科学严谨的角度,重新探讨同性恋遗传特性该怎样研究,直言不讳地指出全基因组关联分析研究一直被诟病的问题。

这篇评论性文章剑指2019年发表在 Science 的研究性文章,题为「Large-scale GWAS reveals insights into the genetic architecture of same-sex sexual behavior」。该研究通过大规模的全基因组关联分析以揭示与同性恋相关的遗传特征,文章发表之后,引起了科学界和大众媒体的广泛关注。

针对这篇评论性文章,原作者在第一时间做出回应,并同期刊发在 Science。原作者针对评论性文章中的质疑做出了详细说明,阐明了全基因组关联分析研究中的「痛点」。接下来,我们就细细解读这场辩论。

人类的性行为是复杂和多变的,尽管它在生物学和社会上都很重要,但其潜在的发展路径和性行为个体差异的来源至今都还没有被很好地理解。随着研究的不断深入,大多数科学家们都认识到:生物学、心理学和文化、环境因素等共同影响着性行为和性身份的形成。

同性恋的相关研究是比较敏感和特殊的,不仅具有生物学意义,而且相关结果也会产生社会层面的影响,因此,之前的研究都较为局限。全基因组关联分析技术的成熟极大的推动了此类研究。

2019年8月30日,来自麻省总医院基因组医学中心的科学家们,联合昆士兰大学心理与进化中心等单位的研究人员,在 Science 刊发了这项关于同性性行为的全基因组关联研究。研究人员对来自英国生物样本库和 23andMe 公司,共计约48万人的全基因组学数据进行关联分析,共鉴定出5个与同性恋相关的基因位点,并在其他三个较小的人群研究中进行了验证。

Hamer等人的评论文章直击该研究的「命门」,对其应用的表型形状的认定标准产生了严重的质疑。要知道,表型信息在全基因组关联分析研究中是至关重要的,它是研究开展的前提,也是希望通过关联分析拟解决的科学问题,如果对表型的认定标准产生质疑,那么这也就基本等同于对该研究的全盘否定。

评论性文章指出:对于表型认定,原始研究中使用的是一个自我报告的二分测量方法,也就是说被研究人员的主要表型是由一个问题确定,即「你是否曾与同性发生过性行为?」回答「否」的被归为「异性恋者」,回答「是」的被归为「非异性恋者」。

质疑者认为,Ganna等人选择这种二分法仅仅是为了方便统计,但它的科学性却存在很大的问题。

另外,这种方法太过于极端和绝对,即在「异性恋者」和「非异性恋者」之间并没有设定一个有效的阈值,而这本可以通过一些基本的问题来辨别。更为荒谬的是,Ganna等人使用的二分法没有经过任何可靠性或有效性的测试。质疑者指出:在绝大多数科学文献中几乎没有见过这种生硬的评判标准,因为它几乎没有体现关于人类性行为多样性的信息。

「炮轰」表型判断标准之后,质疑者随后对其产生的结论也产生质疑。他们认为,Ganna等人在这项研究中检测到了与同性恋相关的5个遗传位点,尽管其中3个在其他数据集中得到了验证。然而,在完全同性行为的参与者中,这些变量都没有表现出统计学显著的升高,也没有与对应于同性相对于异性伴侣的比例的变量显著相关。

此外,尽管原始研究中对这5个基因进行了文献支持和讨论,但质疑者指出,这些基因可以作为同性性行为相关的候选基因(如性激素和嗅觉),但实际上它们中没有一个与人们通常理解的同性恋有关。

质疑者们也对这5个鉴定出来的基因位点抛出了一种合理的解释:他们与人类性行为的分类没有任何关系,而是与个性特征有关,或许仅仅只是好奇心驱使的性体验。

最后,质疑者重申:所有复杂性状的遗传学研究都需要精确有效的表型测量,考虑到性行为的社会、政治和个人影响,这一点尤其重要。

针对质疑,原始研究人员也迅速做出回应。针对表型判断的标准,Ganna等人首先指出,由于缺乏足够大的样本,先前的基因组关联分析研究无法检测出具有复杂特征的变异,这也是对性行为的遗传学研究受到限制的原因。因此,为了产生最大的有效样本量,他们选择了这个简单易懂的变量。

另外,在数十万人群的这种大规模基因组学研究中,势必会受到现有表型数据的限制,这是因为那些表型数据并不是为了某一研究而收集的。比如说,英国生物样本库(UK Biobank)包含了大部分可用基因组数据,但不包括性吸引力或性身份等详细信息,其唯一与性行为相关的问题是:参与者是否有过同性伴侣。因此,也只有基于二分类项的变量,才能使绝对样本容量最大化。

Ganna等人也承认,原始研究中的这一变量的确没有包含性行为的多样性和复杂性,不过他们也没有声称用这个变量来衡量性取向或性吸引力。同时,在原始研究中,后续深入的分析与数据的子集以及独立数据集均能验证研究结论,这与质疑者们提到的「结论不可靠」是不符合的,之所以认为不可靠,是因为Hamer等人忽略了原始研究的这些后续分析。

最后,原始研究人员提到:「尽管我们更希望大规模的基于生物样本库的样本具有我们感兴趣的主题的深度、详细表型,但这种性质的数据目前还无法获得。」这句话也戳中了全基因组关联分析研究的痛点:表型深度和样本量大小之间的权衡!

科学发现被质疑才会「越辩越明」,同时这也正体现了其多面性及包容性。在任何科学研究中,均有其局限性,合理利用现有条件、现有数据推动该领域的发展,认识到他人所无法看到的深度信息,这才是科学研究的追求方向。

UUID: e57f6268-9574-4c5a-b8e3-a02704c6cb0a

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/学术头条公众号-pdf2txt/学术头条2021年/2021-04-02_同性恋是由基因决定的?因为这篇文章,两个团队在Science直接干架.txt

是否为广告: 否

处理费用: 0.0064 元