这种生物的基因组堪称真正的“屎山”,它们还在不断往里面塞垃圾

来源: 环球科学

发布日期: 2024-08-31 07:02:21

肺鱼拥有巨大的基因组,其中包含大量重复序列和转座子,这些基因组中的“垃圾”使得肺鱼的基因组扩增速度极快。尽管基因组庞大,但肺鱼似乎并未因此遭受生存困境,其基因表达水平和基因长度之间没有明显相关性。肺鱼的基因组变化也揭示了四足动物祖先从水到陆的演化过程,包括肺的形成、四肢的支撑能力以及对空气生活的适应。

在8月非洲的小水潭里,一条黑色的大鱼一跃而起,探出水面。它张大嘴巴,随着一阵风箱一样的声音,它吞下了足够的空气,又钻回了水下。这是一条肺鱼。肺鱼和其他鱼一样有鳃,但它们还拥有一个非常原始的肺,肺的内表面甚至也覆盖着大量蜂窝状空腔,它刚刚吞下的空气会在这里发生交换,保证它在旱季也能生存下去。

在我们的印象中,肺似乎是独属于陆生动物的结构。

也难怪在20世纪80年代前,人们曾一度认为肺鱼就是包括人类在内所有四足动物的祖先。但我们现在已经知道,我们的祖先或许曾一度和肺鱼共享同样的栖息地,但肺鱼并不是我们的直接祖先。4.2亿年前,两种鱼类分道扬镳。其中一支登上了陆地,经过漫长的演化诞生了人类,另一支却几乎没有变化。

目前已知最早的肺鱼化石发现于4亿年前早泥盆世的地层,然而到4亿年后的今天,现生的澳大利亚肺鱼(Neoceratodus forsteri)和化石长得堪称一模一样。现在,这些被称为“活化石”的生物只剩下了6个物种,其中一种在澳大利亚,一种在南美洲,另外4种则生活在非洲。

身体形态几乎没变,并不意味着肺鱼在漫长的演化中什么都没有得到——它们得到了一个巨大的基因组。

南美肺鱼(Lepidosiren paradoxa)的DNA拥有超过910亿个碱基对,是迄今所有已测序物种中最大的。而在南美肺鱼的基因组得到测序之前,这个纪录的保持者是澳大利亚肺鱼和非洲肺鱼(Protopterus annectens),它们的基因组有约400亿个碱基对。作为对比,人类的基因组只有30亿个碱基对。在南美肺鱼的19条染色体中,其中18条单独拿出来,都要大于人类的整个基因组。

如此巨大的基因组,当然会给研究带来极大的困难。基因组测序的过程有一点像拼拼图,曾经的测序技术每次只能读取很短的一段基因序列,这就像是固定了每一块拼图的大小。当整个拼图变得非常巨大,拼图的片数也会骤增。但随着近年来长读长测序(long-read sequencing)技术的发展,研究者可以一次性读取含有上千,甚至上万个碱基的序列,让我们有机会看到这些巨大基因组的全貌。

基因组大并不代表有效信息多。在记录人类遗传信息的30亿个碱基对中,只有大约2万个传统意义上的基因,或者说编码蛋白质的DNA片段。其余的部分,则一度被认为是没有意义的“垃圾DNA”。而作为对比,南美肺鱼的基因组大小是人类的30倍以上,却也只有大约2万段是真正编码蛋白质的序列。这意味着它们基因组中的“垃圾”甚至更多。事实上,研究者意识到,南美肺鱼超过90%的基因都是一些重复的序列。

这90%的“垃圾”有另一个名字——转座子,或者说跳跃基因,这是一些可以在基因中跳来跳去的DNA片段。问题在于,其中的大部分除了在基因中“跳跃”,还可以将自己“复印”出大量的拷贝,再分别插入基因组中。而这些“新生”的片段,依然可以继续自我复制,从而像病毒一样,在基因中大量“繁殖”。正是通过这样的方式,转座子在肺鱼的基因中不断繁殖,将它们的基因撑到了如此庞大的地步。

这样的特性让转座子一度被称为“自私的基因”,或是“基因寄生虫”。显然,如果转座子大规模活跃,甚至插入重要的基因中,将会给“宿主”带来严重的后果。所以在大部分情况下,我们可以看到生物也演化出了一整套防御机制。例如,KRAB型锌指蛋白可以通过识别特定的DNA序列,结合到转座子上,从而在表观遗传学层面沉默转座子。在生殖细胞中,piRNA则通过靶向转座子,形成双链RNA,抵御转座子的侵入。

然而,肺鱼似乎缺少了这种功能。研究者发现,相比于人类和其他肺鱼,南美肺鱼基因组中与piRNA和KRAB型锌指蛋白相关的基因大幅减少(人类和其他肺鱼有大约300个拷贝,而南美肺鱼只有23个)。或许正是因为失去了牵制转座子的能力,才让南美肺鱼拥有了巨大的基因组。

最终结果就是,我们看到南美肺鱼基因组的扩增速度是已知物种中最快的:平均而言,每过一千万年,南美肺鱼的基因组就可以增长出一个人类基因组的大小,而这个增长速度它们已经维持了至少一亿年。“而且它还在继续增长,”迈耶说,“我们有证据表明,现在南美肺鱼基因中的转座子仍然活跃。”

这让我们不禁问出一个问题,巨大的基因组会带来怎样的生存代价?在另一种同样拥有庞大基因组的生物——蝾螈——中,我们可以清晰地看到这种代价。不同蝾螈物种的基因组大小的变化很大,最少的“只有”100亿个碱基对,而多的可达1200亿个,同样塞满了转座子。这些基因组中的“累赘”,让许多蝾螈长成了“巨婴”:就像纽斯河泥螈一样,长着幼嫩的鳃、软弱的四肢和极为简洁的大脑,终生也无法完全完成变态过程。

肺鱼似乎没有遭受类似的困境。2021年,在一项发表于《细胞》(Cell)的研究中,西北工业大学、华南农业大学、中国科学院水生生物研究所和中国农科院深圳农业基因组研究所、华大基因研究院等单位联合解析了非洲肺鱼首个完整且高质量的超大基因组。结果显示,非洲肺鱼的内含子同样非常长,整个基因组中近16Gb都是内含子。

非洲肺鱼中最长的基因为18 Mb,比墨西哥钝口螈(6.7 Mb)和人类(2.5 Mb)都要长得多。通过检查转录组数据,研究者发现基因表达水平和基因长度之间没有明显的相关性,即使是长度大于1 Mb的基因,也表现出与其他较短基因相似的表达水平。换句话说,基因长度的变化对非洲肺鱼的基因表达似乎没什么影响。“这些结果表明,”论文中写道,“为了保持基因表达的平衡,肺鱼中超长基因的转录效率可能有所提高。”

当我们仔细了解肺鱼的基因组变化时,也能看到四足动物祖先在从水到陆的中间阶段,经历了怎样的演化过程。这个过程需要生命在一系列方面的创新:用肺呼吸、有支撑能力的四肢、能应对干燥的皮肤、截然不同的运动姿势……肺鱼不仅拥有了原始的肺,它们编码肺表面活性蛋白B的基因也已经大大增加,这是一种复杂的脂蛋白,可以维持肺泡大小的相对稳定。肺鱼中相关基因的数量是硬骨鱼和软骨鱼的2~3倍,与四足动物的典型数量一致。

同时,肺鱼中参与嗅觉的基因也出现了扩增——这是一种对在空气中生活的预适应。

另一个重要的变化发生在四肢。肺鱼和拉蒂迈鱼同属于肉鳍鱼类,它们的鳍中已经有了初步的骨骼,带来了一定的支撑能力。基因组序列也补全了这段故事:研究者在肺鱼的基因组中,看到了四足动物中与四肢发育相关的基因,此前这样的模式从未在其他鱼类中看到过。这说明,“早期肉鳍鱼类已经产生了类似四肢的基因表达,为之后的四足适应做好了准备。”

研究者甚至看到了一些意想不到的发现。在2021年发表于《细胞》的研究中,研究者注意到,和抗焦虑密切相关的蛋白神经肽S及其受体在肺鱼和四足动物的祖先中曾共同出现。与此相吻合的是,大脑的杏仁核也是从肺鱼和四足动物的祖先开始,具备了相对成熟的多分区结构。研究人员推测,肺鱼和四足动物的祖先在焦虑处理能力方面可能更强,以适应空气呼吸和陆地生活等完全不同的环境干扰。

UUID: 4049bdb8-b3fd-461b-bdb1-77d76413ea7e

原始文件名: /home/andie/dev/tudou/annot/微推助手/科学大院/科学大院_2024-08-31「转」_这种生物的基因组堪称真正的“屎山”,它们还在不断往里面塞垃圾.html

是否为广告: 否

处理费用: 0.0075 元