每个⼈身上都有22对常染色体和⼀对性染色体。就性染色体⽽⾔,⼥性是XX,男性是XY。染色体中包含着我们的遗传密码。因此,科学家⼀直不懈努⼒探索着其中的细节。上世纪90年代,⼈类基因组计划(HGP)启动。它的⽬标是确定我们⼈类染色体中DNA碱基的顺序,揭示⼈类基因的蓝图。到了21世纪初,第⼀份⼈类基因组⼯作草图发布。但实际上那份基因图谱并不完整,碍于技术限制,草图中还有⼤量缺口,并且不包含性染色体。
直到2022-2023年,科学家才得到了⼈类完整的性染色体序列。近⽇,⼀组国际合作团队⼜完成了另⼀项壮举。他们得到了5个类⼈猿物种和⼀个较⼩的猿类物种的性染色体(X和Y)的完整序列。通过⽐较X和Y染色体之间的区别,以及物种间的差异,研究⼈员更细致地了解到了有关它们进化的故事。他们的研究结果展现了类⼈猿物种之间雄性特有的Y染色体的极速变化,并揭示了性染色体的进化过程。性染色体携带着重要信息。
Y染色体对个体的性器官发育和⽣育能⼒⾮常重要,⽽X染色体上的基因则对⽣殖、认知和免疫⾄关重要。但是,测序性染色体⼀直是种挑战,尤其是Y染色体——由于⼤量重复序列存在,想要精准地确认所有基因的排序并不简单。这项新研究涉及了⿊猩猩、倭⿊猩猩、⼤猩猩、婆罗洲猩猩和苏⻔答腊猩猩这5种类⼈猿,以及⼀种较⼩的猿类合趾猿。
先前的研究得到过其中⼀些物种的不完整的性染色体序列,⽽对于婆罗洲猩猩和合趾猿,这是第⼀次解码它们的性染色体序列。借助最新技术,研究⼈员得到了这6个物种完整的性染色体参照序列。此外,他们还研究了129只⼤猩猩和⿊猩猩个体的性染色体,以便更好地了解每个物种内部的遗传变异,并寻找⾃然选择和其他进化⼒量对它们的影响。
团队发现,与X染色体相⽐,Y染色体在不同猿类物种之间差异⾮常明显,包含着许多物种特有的序列。⽐如,从染色体⼤⼩上来说,在所研究的这6种猿类中,X染色体的⼤⼩范围⼤约从1.54亿个碱基对(⿊猩猩和⼈类)到1.78亿个碱基对(⼤猩猩)不等。相⽐之下,Y染色体的⼤⼩则从3000万个碱基对(合趾猿)到6800万个碱基对(苏⻔答腊猩猩)不等。
此外,⼈类和⿊猩猩之间约98%的X染色体排列⼀致,但对Y染色体⽽⾔却只有约三分之⼀。这在⼀定程度上是因为,Y染色体更有可能被重复排列,或者部分遗传物质被复制。⽽Y染色体上的重复序列占⽐同样差异明显。根据物种的不同,重复元素占X染色体的62%到66%,⽽Y染色体上则有71%到85%不等。研究发现,猿类的Y染色体正在“缩⽔”,积累了许多突变和重复,并丢失了⼀些基因。⼀些假说认为,Y染色体或许会消失。
那么,为什么Y染色体没有消失呢?科学家认为,Y染色体仍然受到净化自然选择的影响,这种自然选择通过清除有害突变来保护遗传信息,保持基因序列的完整性。在净化选择的作⽤下,Y染色体上仍有许多基因在进化,其中很多对精⼦的形成⾮常重要。这意味着Y染色体不可能在短时间⾥消失。研究还发现,Y染色体上的许多基因似乎采⽤了两种“⽣存策略”。第⼀种是利⽤基因冗余,也就是染色体上存在着同⼀基因的多个拷⻉。
这样⼀来,基因的完整拷⻉就能补偿可能发⽣突变的拷⻉。第⼆种⽣存策略是利⽤回⽂序列,也就是⼀段序列之后会跟着相同但顺序颠倒的⽚段,⽐如ACTG后⾯紧接着GTCA。猿类Y染色体上的回⽂序列特别多,⽽且特别⻓。基因可以从回⽂序列中纠正突变的差错。Y染色体可以在两个回⽂染色体臂的重复序列之间与⾃身交换遗传信息,在这两个回⽂的臂折叠之后,颠倒的序列就会对⻬。
当同⼀基因的两个拷⻉位于回⽂序列内,其中⼀个拷⻉发⽣突变时,还可以与另⼀个拷⻉进⾏基因交换来纠正“错误”。科学家表示,这项研究能将⽣物信息学技术和进化分析有⼒地结合在⼀起,使我们能够更好地解释我们的近亲类⼈猿性染色体的进化过程。此外,研究得到的参照基因组也有助于未来对灵⻓类进化和⼈类疾病的研究。这些被研究的类⼈猿物种不少都濒临灭绝。
获得它们完整的性染色体序列,也能理解它们在野外的性别特异性分布,还有那些对繁殖和⽣育的重要基因。