2010年,当辛西娅(Synthia)顶着“人造生命”的光环进入人们的视野时,世界沸腾了。分子克隆技术问世40年后,科学家们仿佛终于扮演了一回上帝的角色,构造出从未存在过的生命形式。辛西娅既无法欣赏自己的名字,也意识不到自己给人类带来了多大的震撼——它是一种细菌。
六年前,克雷格·文特尔(Craig Venter)和他的团队以丝状支原体(Mycoplasma mycoides)的基因组作为模板,化学合成出一整套支原体的基因组,并将它移植到除去了DNA的山羊支原体(Mycoplasma capricolum)细胞内。这套人工合成的基因组最终指导它所在的细胞活了下来,喜出望外的研究者给了它一个必将被铭记的名字:辛西娅。
尽管被当成扮演上帝的人,但作为生物学家的文特尔,看待自己的创造并不带任何神学色彩。在他看来,生物的基因组就好比一份系统软件,基因测序技术的发展使人们能够“阅读”生命在亿万年的时间演化出的种种“代码”。而辛西娅的出现,证明了人类也可以自己码一套能用的系统软件。但这只是刚刚开始。文特尔真正希望做到的,是透过无数个版本的代码看到软件运行的本质——在基因组中抽丝剥茧,提炼出生命之所以能成为生命的基石。
为此,辛西娅不能止步于辛西娅。从诞生的那一刻起,它便只是“辛西娅1.0”。生来便是为了向辛西娅2.0迈进。
辛西娅1.0的诞生并不容易。它的基因组有901个基因,超过100万个碱基对(bp),没有办法一次合成。以当时的技术,文特尔和同事只能选择分段分步合成。
利用大肠杆菌和酿酒酵母这两种常见的模式生物作为宿主,他们将合成了1078条大约1000bp的DNA片段,然后组装成辛西娅的基因组(Syn1.0)。在能自主复制的细胞中,身为支原体的辛西娅已经有着很小的基因组。为了在不同环境中活下来,细菌通常会携带很多具备不同功能的基因来应对环境变化,走哪打哪的大肠杆菌就有大约4000个基因。
相比之下,在动物宿主体内吃饱穿暖的支原体,则在漫长的演化年月里丢弃了那些在稳定环境中派不上用场的基因。早在20年前,文特尔就知道在所有可自我复制的细胞中,已知最小的基因组来自生殖支原体(Mycoplasma genitalium)——仅仅包括525个基因。20年后,辛西娅的基因组能不能精简到比它更小?
带着这样的问题,文特尔和生物化学家克莱德•赫钦森(Clyde A. Hutchison III)等人开始了简化辛西娅“代码”的旅程。目标只有一个:得到一个能够支持辛西娅完成生存的最小基因组(minimal genome)。怎么做?把辛西娅体内那些被删了也不会致死的基因删掉,把删了就活不下去的基因留下。完事。听起来很简单明了,可是,哪些基因是可以删的呢?
文特尔等人设计了这样一个实验:随机往Syn1.0上的基因插入转座子(一类DNA序列),使原来的基因失活——原本的“代码”被打乱。之后,他们将处理后的辛西娅菌株培养40代,最终收集得到的菌落,分别进行测序。此时,辛西娅的基因被分为以下三种情况:必需基因、非必需基因、半必需基因。
按照这样的分类,在Syn1.0上的必需基因有240个,非必需基因有432个,半必需基因有219个。
好了,你也许会想,把这240个留下,其他统统干掉,不就大功告成了吗?可惜,事情并没有那么简单。在细菌中,存在这样一种情况:比如细胞携带两个基因,A和B,它们都可以合成糖分。无论缺失了A或B,尚存另外一个同伴都会完成“逝去者”的任务——在这种情况下,A或B很容易被各自当成无关紧要的基因。但当A和B同时不在时,糖分的生产可就成了大问题了。而在一些情况下,这些问题是会致命的。
为了解决这一难题,文特尔等人做了这样的设计:他首先将Syn1.0分割成8段(标记为Syn1.0 1-8),按照上面的数据删除这个片段上几乎所有的非必需基因,得到另外一组精简过的基因组(标记为RGD1.0 1-8)。然后,依次用RGD版的基因组片段置换对应的Syn版,检查是否能够得到具有稳定遗传功能的基因组。
他们最终发现,RGD1.0的2,6,7,8号基因序列和Syn1.0的1,3,4,5这8段基因拼合回一起,能够得到可用的基因组。由于Syn1.0和RGD1.0的序列都是已知的,经过比较,研究者很快找到RGD1.0的1,3,4,5中有哪些基因是被误删的必需基因。按照这样的思路,研究人员很快得到了RGD2.0版基因组。
随着一层一层的优化,研究人员最终得到了Syn2.0——它是由RGD2.0的7段基因片段,和Syn1.0的1段基因片段组成的基因组。把Syn2.0移植到山羊支原体的细胞中,辛西娅2.0能够在培养基中存活和繁殖。
看回Syn2.0的基因组的大小,研究者发现它跟Syn1.0比起来“精简”了几乎一半。再看基因数目,这个长为576kbp的基因组中携带的基因只有512个,比生殖支原体的基因组还小!
至此,“人造生命”辛西娅2.0成为了拥有最小基因组的、可以自行繁殖的细胞。文特尔和他的同事并没满足于Syn2.0取得的成果。在得到稳定繁殖的Syn2.0后,他们又开始用之前建立的做更进一步的精简——在这一步的筛选中,曾经被分类为“半必需”的基因在新的遗传背景下成为了非必需基因。最终,他们成功得到了一个仅仅含有473个基因,基因组大小为531kbp的JCVI-syn3.0(以下简称Syn3.0)。
相比于Syn1.0,在Syn3.0中,所有可动遗传因子(一般用于细菌间的DNA交换)和用以分解酰基甘油产生营养的代谢酶“全军覆没”,相对不那么重要的脂蛋白以及用于非糖类代谢和运输的元件也被删掉了大半。而与DNA保存复制和蛋白质合成等相对关键的基因则几乎被全数保留了下来。
而与Syn1.0相比,由于缺乏了与生长相关的基因,Syn3.0的复制相对较慢——大约三个小时才能完成一次分裂,是Syn1.0的三倍。目前来说,Syn3.0是最接近文特尔苦苦追寻的“生命基石”的基因组。
在这个基因组中,48%的基因与基因组信息的维持与表达有关;35%的基因与细胞膜及细胞代谢有关;而有17%的基因,人们目前并不清楚它们所归属的功能大类——如果要明确到具体功能,难以说清的基因则多达149个(约占基因组的31%)。
此外,Syn3.0的形态与Syn1.0也有较大的差别:在显微镜下,Syn1.0单独分布,而Syn3.0则聚集成团。构成这种差异的原因也还是个谜。
“即使辛西娅没有任何其他用途,能让我们知道自己缺了这三分之一的重要知识,也已经是非常关键的成果。”文特尔说。尽管现在的辛西娅还显得粗糙,还藏着太多谜团,但我们应当对此抱以期待。像承载着城堡、跑车和机器人的乐高积木底板一样,这个小小的支原体也将承载起生物学家奇幻而瑰丽的想象力。在遥远的未来,人们也许会构建出新的菌落、新的植物、新的动物——还有更新的未来。
不管你喜不喜欢,这扇通向未来的门已经悄无声息地打开了。而探索的人,正一步不停地向门的另一头走去。