荣获诺贝尔奖的古基因组学可以回答两个问题:我们是谁?我们从哪儿来?
我们会不由自主地回想,在过去,曾经存在什么样的人类?我今天讲的是“万年前人类基因的记忆”。我做的工作是什么呢?我通过古DNA了解我们的过去,了解我们从何处来。那么大家知不知道DNA在哪里呢?相信很多人都很清楚,它就是在这样的染色体结构下。染色体内部可以看到非常明显的DNA双螺旋结构,而DNA本身的复制就是通过两条链分开,然后分别通过碱基互补来实现。
在复制的过程之中,也就是产生新生代的过程中会产生一些突变,而这些突变就使得不同的人会有不一样的地方。我相信很多人都很好奇,人类跟黑猩猩有多大的不一样呢?人类和黑猩猩在DNA水平大概有百分之一的不一样,但是人和人之间大概有千分之一的不一样。这种不一样虽然比例上很少,但是数量巨大,为什么这么讲呢?因为我们总共有23对染色体,能达到30亿个碱基对,可以想到即使是千分之一,它的含量是非常高的。
在23对染色体中,其中有一个非常特殊的染色体,这个染色体就是一对性染色体。这个性染色体就决定了我们的性别,也就是说当受精卵形成的那一瞬间其实性别就确定了,因为性染色体已经决定了。除了染色体以外,其实在我们身上细胞内部还有一些别的遗传物质,比如说线粒体。
我今天主要讲的是核基因组,主要原因是核染色体中的DNA在重组传给下一代之前,在父母双方的体内会发生重组,而线粒体只来自母亲,并且不发生重组。
所以相对来说核基因组能够呈现跟我们祖先更多的相关信息,即使是一个个体也会有很多信息。我们会不由自主地回想,在过去曾经存在什么样的人类?通过图片可以感受到当时人生存的艰难,即使几万年前,人类除了基本的生存,也有自己的精神文明。上图中所有的物质,包括古笛、岩画甚至雕塑,都是几万年前的人类生产的。由此可以想象,当时的人是非常有意思的,那么当时的人是什么样子的呢?
大家可以通过这两个骨架猜测一下,哪一个是跟现代人一样,哪一个是不一样的个体呢?其实右边是现代人,左边是尼安德特人。大家可以明显看到,左边的尼安德特人的整个肋骨情况跟现代人是不一样的。
现在我们仅仅能看到这些信息,如果我们能获得相关的古DNA,那么我们就能够了解更多人类的过去。古DNA可以来自于考古或历史遗存生物,或是灭绝生物的死亡组织降解的DNA。古DNA是什么呢?很多人有这样的疑问。
古DNA研究对象并不局限,它可以是骨骼,甚至可以是土壤。但是古DNA本身非常有特殊性:如上世纪90年代时,就已经有很多人研究古DNA了。但是当时的研究出了很多想不到的问题。比如琥珀、恐龙蛋,当时都认为从中发现了相关的遗传物质,甚至是认为是属于它们本身的,但是后来研究发现,它们都来自于污染。
为什么会这样?为什么研究琥珀和恐龙蛋本身,而得到的DNA竟然是污染呢?主要是因为古DNA和现在DNA不一样。
如下图中上部分就是现代DNA,如果我们获得是血液,这个血液中获得的DNA大多数属于这个个体,而且含量非常高。但是对古DNA来讲,即使拿到的是这个个体的骨骼,但是内部由于埋藏环境的影响,会有非常多的微生物DNA。图中看到的绿色就可能是微生物的DNA,只有非常少量的内源DNA,也就是红色DNA,甚至这些红色的DNA有时候看不到。
如果这时候研究对象是人类,大家可以想象一下,当发现这些骨骼的时候,很容易在我们现在的人用手触摸的过程中被污染。在这种情况下,对于现在的DNA,如果有少量的污染影响并不大;但是对古DNA来讲,跟内源DNA相比它的影响非常大,这给古DNA研究造成了困难。这些特点也就使得古DNA在上世纪相对发展比较缓慢。
但是在近十几年,古DNA可以说发展非常迅速,因为我们可以利用高通量的数据结合很多古DNA技术,使得我们可以评估,同时又能够获得非常可靠的数据。回到今天的主题,就是关于人类演化本身的一些问题。相信很多人已经非常了解人类演化的背景。我们都知道人类的祖先最早出现在非洲,虽然现在在东亚有很多争议。
这种争议并不是针对人类的祖先,主要针对现代人最后走出非洲的那拨人的后代,还是说,当时的现代人由本土人演化而来的。不管怎样,这两方都认为人类的祖先最早是在180万年前走出了非洲。而且几十万年以来,不仅非洲有古人类,欧亚也有,如尼安德特人也曾经存在过,在东亚也曾经存在过我们非常耳熟能详的古人类,像北京人、大荔人、马坝人等,唯一获得基因组的灭绝古人类目前是丹尼索沃人。
在这个过程中我们就非常好奇,相关的现代人在这个过程中,对古人类的影响是什么?可以说2010年以前,几乎所有人都认为现代人对于当时的古人类是完全取代的关系,没有任何相互的交流。一直到2010年,人们才通过尼安德特人的基因组草图,了解到尼安德特人其实对于我们现代人的欧亚人群都有1%到2%的贡献。另外一点,丹尼索沃人很有意思。
丹尼索沃人并没有像尼安德特人那样,对那么多的人群有影响,更多的影响是对于大洋洲的人群,对他们有4%到6%的遗传贡献。
通过一系列的研究,大家可能会不由地去畅想,在过去几万年阶段里,曾经的人类,尤其是我们现代人的祖先,在不同阶段形成什么样的特点?什么时候才有东亚人?什么时候才出现所谓的欧洲人?还有在不同的阶段人群是不是有相互的影响?此外,还有一个更重要的影响。
当时的现代人——也就是我们现在的祖先——他们曾经跟这些灭绝的古人类,比如尼安德特人、丹尼索沃人,他们在共存的时间里面发生过什么?接下来我会通过两方面向大家介绍我们的研究,一个是现代人自己的一些特点,还有一个是灭绝古人类和现代人共存的关系。这张图主要是想让大家看到,关于过去4.5万年到将近7千多年的人群,我们获得了非常多的基因组。
这一时间段非常特殊,因为这是末次冰期前后,尤其在这个阶段里,还经历了末次冰期里最寒冷的阶段,就是末次冰盛期。
在末次盛冰期阶段里,人类的很多生存环境,如图中看到的灰色区域已经被冰盖覆盖了。可以想象当时的环境是非常恶劣的大概1万多年前的时候,也就是末次冰期快结束的时候,猛犸象、披毛犀都灭绝了。在这样严峻的环境下,人类何去何从?人类本身又是怎样变化的?
之前并不是那么清楚,但是通过古DNA,我们能够抓取一些非常重要的片断。比如,我们知道了4万年到4.5万年,曾经存在过还没有成为欧洲人或者亚洲人的人群。以其中一个个体为例,这里的西伯利亚的Ust’-Ishim个体,这个个体至今4.5万年,可以说他是目前除了非洲和近东以外,有最古老的直接测年的早期现代人。
通过对这个个体的线粒体、Y染色体和核基因组的分析,都发现他没有出现和现在欧洲人、亚洲人更相近的情况,所以只能说他是一个欧亚大陆人。
这个结果说明了一个非常重要的问题,现在很多争议是针对所谓的相关人群从南线进入到亚洲。人类走出非洲的南线迁徙早期主要是针对大洋洲,晚期才进入到东亚。如果我们这个个体历史上也是南线进入东亚,我们应该看到他会跟东亚的人群更近,跟大洋洲人群会远一些。
但是我们的研究并没有发现这一点,这至少告诉我们,当时的早期现代人其实是一个辐射性的,并不是一个单一路径的迁徙。此外,欧洲人有什么样的特点呢?在3.7万年前的欧洲人,到1.4万年的欧洲人,在这整个时间段里,整个人群并没有受到外来人群的影响,更多的是内部人群相互融合迁移。其中有一个非常重要的现象,就是关于在比利时发现的一个3.5万年前的欧洲人。
这个欧洲人并没有直接对紧随他之后的人群产生很大的影响,反而沉寂到了1.9万年前,对1.9万年到1.4万年前的人群有影响。如果大家对这个时间节点稍微有点概念,1.9万年年是末次盛冰期刚结束的时候。所以大家可以看到一旦环境相对适宜人类生存的时候,就会有很多未知的人群,甚至很古老的人群,对后期的人群有影响。
除此之外,我们还研究发现在1.4万年之后的欧洲人和1.4万年之前的欧洲人是不一样的,不一样主要体现在哪里?1.4万年之后的欧洲人和外部人群,比如近东人群有很大的联系。而且更有意思的是,1.4万年以后的欧洲人才出现了我们现在都知道的蓝色的眼睛。也就是说,欧洲人在1.4万年以前并不是蓝色的眼睛,是深色的眼睛,甚至是深色的皮肤。
而在1.4万年之后,虽然他们是蓝色的眼睛,但是皮肤还是深色的,真正的淡色的皮肤出现的比蓝眼睛的颜色还要晚。在这个情况下大家就会有疑问,说了这么多欧洲人、北亚人,关于我们东亚人是什么样子的呢?非常幸运,在过去三个月里,我们获得了中国自己的古基因组。
这个是距今大概四万年前,在北京的田园洞。这个个体非常有意义在于,我们第一点要了解他到底是不是东亚人。有人会好奇,认为既然在北京就应该是东亚人,那不一定。
我们举一个实例,在欧洲就发现过4万年前的个体,但他遗传上还不是欧洲人,所以即使这个个体在北京田园洞被发现了,也并不意味着遗传上他就是东亚人。后来我们通过研究明确了,他遗传上确实是东亚人。虽然他是东亚人,但他跟现在的东亚人还有一些地方不一样。这些不一样在哪里呢?首先,他跟古欧洲人的某些人群有联系,这种联系我们目前分析不能明确到底是远古成分的影响,还是因为他与欧洲人和亚洲人的联系。
不管怎么样,我们都看到了他们之间的关系。此外,我们还看到非常重要的信号,虽然在不同人群中他跟东亚人更近,但是东亚人内部里面,有没有谁跟田园洞人更近呢?我们并没有看到这样的关系。但是当我们看美洲土著人的时候,我们会发现美洲土著人内部有一些人群,相对别的美洲人群相对来说,跟田园洞人更近,这个人群就是亚马逊人群。很大程度上这些现象都让我们知道,当时的东亚、亚洲,相对来说有非常复杂的遗传历史。
仅仅是这样一个研究,就能告诉我们这么多信息,这也就使得我们不由地去期待,当我们有更多的数据进行研究、分析的时候,我们就能了解更多的画面。这是关于我们现代人自己的演化历史。
第二个问题,相信大家都很期待,就是我们现代人和曾经存在过的古人类,也就是灭绝的古人类有没有过共存的关系?有没有可能通过当时一些现代人的DNA捕获到图片中这一幕?有可能的。现在所有的欧洲人和亚洲人都有1%、2%的尼安德特人成分。
大家只要不是非洲人,就肯定有尼安德特的成分,但是东亚人会比欧洲人的尼安德特成分高一些。此外,当我们看丹尼索沃人的时候,非常有意思,大家可以看到图片里,这些人从遗传的成分来讲是非常相似的,都是大洋洲人群。但是在这些相似的人群中,并不是每个个体都有丹尼索沃人遗传成分。我们以此为鉴,所有的相关人群其实只有这一边的人群有丹尼索沃人成分,另一边是没有丹尼索沃人成分。
这也就让我们知道,古人类对我们现代人的影响是非常多元、复杂的。
举一个古人类对当时现代人的影响的例子,这个例子非常有意思,而且这个研究本身可以说是人类历史上的一个幸运。为什么这么讲?最主要的一个因素,就是当时的现代人的DNA,相对比我们现在的DNA,他跟当时发生的事件更近。举一个非常简单的示意图。
我们看到上图中,如果我们有一个尼安德特人和一个现代人作为父亲和母亲的时候,产生下一代过程中,其中有一半染色体的整个染色体长度来自尼安德特人。随着不断的繁衍,尼安德特人片段由于重组关系不断地被打断、不断地变小。在这个过程中,如果我们还原尼安德特人片段,通过片段长度,我们就能反过来计算当时尼安德特人和现代人发生基因交流的时间。在这个前提下,我来介绍一个个体。
这个个体很特别,上图中是4.5万年到7000年甚至到现在,整个尼安德特人在现代人的尼安德特成分的变化。其中有一个个体非常突出,他既不是年代最早的,但是他的尼安德特成分最高,能达到10%左右。当我们把这个个体放在地图上,他到底是谁呢?他是罗马尼亚的一个个体,距今大概四万年,比我们刚刚说到4.5万年前的人还要晚一些。
这个个体我们只取非常少的骨粉,大概只有30毫克,非常小的一个洞,对他整个形态的影响非常小。在这种情况下,我们了解到尼安德特的成分在这个现代人中是非常不一样的。上图中现在看到的这些有颜色的这些片段,其实都是尼安德特在现代人基因组中的体现。其中可以看到有一个叫做Ust’-Ishim的黄色条带就是刚刚提到的是4.5万年前的人,他的条带长度比现在的人长很多。
但是这个4万年前的个体基因组中,有一个绿色条带占有染色体非常长的区域,能够达到染色体的一半,大概能到60Mb这样一个程度。这是什么概念呢?结合我刚刚给大家介绍的原理,就是重组把片段不断打断,大家很快反应过来,这个人的祖系上很有可能在很近的时候和尼安德特发生基因交流。这只是一个染色体,从整个常染色体的情况来看,从1号染色体到22号染色体,除了刚刚看到的12号染色体之外,其他的染色体中都有长的片段。
我们利用这些长片段的分布,模拟这些片段产生的长度可能性,同时利用位点相关的差异和关联性。我们可以计算出,对这个个体来讲,大概4到6代以前,他的祖先和尼安德特人发生了基因交流。当我们把这个个体的关系放到家谱树中,就能了解到如果用尼安德特的含量来说,大概能估算出2到4代、2到5代之前。如果用刚才说的片段本身的分布和一系列的算法计算,我们得到的结果大概在4到6代之前。
大家可能对4到6代的概念不太清晰,用俗称的语言就是说,这个个体的曾曾曾祖父母中有一个尼安德特人。我们确实找到了一个明确的实例,告诉我们当时的古人类和当时的现代人,他们确实发生了这种基因交流。不仅如此,它还告诉我们另外一个信息,是什么呢?考虑到这个结果,同时结合之前提到的尼安德特人对现在现代人的影响,整个欧亚大陆人群都受到尼安德特人的影响,除了非洲人以外。
大家会想到,这种基因交流很有可能在欧亚人群分离之前发生。通过相关的研究,我们认为发生的地点时间很有可能是图中的圆圈位置,就是近东区域。而且通过不管是现在的DNA,还是当时早期现代人DNA,我们大概计算出来,它是距今5到6万年前发生的。但是,这个个体,就是刚刚提到在欧洲的罗马尼亚,时间是4万年,而且是在4到6代之前不到200年以内发生这样的事件。
这就不由地让我们明确了,这个事件应该不是一次的,至少不是最开始我们推测的对我们现代人影响只有唯一的一次,很有可能有多次。而且发生的地点不仅在中东,在欧洲等其他的地方也可能发生过。这一系列的问题只是开了一个窗口,让我们了解到远古历史,我们跟灭绝古人类的联系。这仅仅是开始,我们会继续努力探究我们是谁、我们从哪里来。