2021年11月5日,《自然-通讯》在线发表了中国科学院上海营养与健康研究所/复旦大学徐书华团队的研究论文。该工作提出了基于隐马尔科夫模型的计算分析新方法ArchaicSeeker 2.0。相比之前的方法,新方法能更有效地检测和量化近缘种的基因交流,并在更精细尺度上重构复杂的基因交流历史;该方法也适用于非人类物种的遗传数据分析。
研究团队应用新方法分析了公共开放数据库中的人群基因组数据,重塑了欧亚大陆以及大洋洲现代人类史前与远古人类的基因交流模型并重构了现代人类的史前演化历史。
近年来的研究发现,现代人类的祖先在“走出非洲”、向全球探索的征途中,可能与先期抵达的古人类接触并共存了相当长的时期,在此期间产生了基因交流。虽然这些古人类作为物种在3万年前均走向灭绝,但他们的基因片段却散布在包括我们自己在内的现存人类的基因组中。
基于此,研究团队在前期研究基础上提出了新方法ArchaicSeeker 2.0,并利用该方法分析和探讨了东亚、南亚、欧洲及大洋洲的现代人群与尼安德特人、丹尼索瓦人之间基因渐渗、共同演化的历史重构等系列问题。
曾经发生在史前的基因交流可视为远古人类对现代人类的基因渗入或遗传渐渗。
研究团队为此设计出一种寻找远古人类基因渗入片段,基于渗入片段长度推断远古人类基因渗入历史的方法——ArchaicSeeker 2.0。相比于其他方法,ArchaicSeeker 2.0具有独特优势性能,并在计算机模拟数据和实验数据分析中得到了系统的评估与确证。结果表明,在远古人类基因片段的判定方面,ArchaicSeeker 2.0准确率超过90%,而误判率约为0.14%。
此外,ArchaicSeeker 2.0在遗传混合事件次数、基因渗入比例和遗传交融发生的时间估计上也有良好表现。
ArchaicSeeker 2.0方法基于远古人类渗入基因片段的长度分布来推断渗入历史,该方法不仅能有效估计基因渗入时间,也能对渗入事件发生次数进行更准确地估计。
利用ArchaicSeeker 2.0方法,研究团队对东亚、南亚、欧洲、大洋洲以及现代亚欧人类祖先乌斯特-伊斯姆人与尼安德特人、丹尼索瓦人的混合时间、次数进行估计。结合考古学证据,研究人员从时空尺度上重构了现代人类和远古人类的遗传交融历史。
基于ArchaicSeeker 2.0对古人类基因渗入片段精准高效地评估,研究还分析了全球近300个现代人群中远古人类基因渗入序列功能及其分布特点,发现它们富集于免疫、体重、心肺功能、紫外线响应和碳水化合物的代谢等相关功能基因区域。除去这些远古人类渗入片段富集区域,研究团队还检测到了84个完全缺乏古人类基因片段的“渐渗沙漠”区域。
这些发现为揭示远古人类基因序列渗入对现代人类影响提供了线索,并为进一步研究渗入基因片段的生物学功能以及远古人类遗传渐渗对现代人类进化的影响提供了候选基因和研究靶标。