追溯祖先,寻找罪犯……DNA能告诉我们多少信息?一块几百年前、几千年前甚至几十万年前的骨头,会告诉我们什么?几万年前的古人类跟我们的关系是什么?通过骨头中的DNA,我们能够回到过去,把“过去”直接拿来跟“现在”进行比较,从而知道我们是谁,我们从哪里来?厦门大学人类学研究所所长、教授、博士生导师王传超将和大家分享《让DNA来回答:我们的祖先是谁?从哪里来,又要到哪里去?》。
我是王传超,来自于厦门大学人类学研究所。我主要的研究方向是通过DNA来回答:我们的祖先是谁,从哪里来,又要到哪里去?也许每个人小时候都问过父母,我是从哪里来的?我想大家也得到过非常多的答案,比如是从石头缝里面蹦出来的,从街边捡过来的,从垃圾桶里面捡回来的……但是随着我们逐渐长大,会不满足于父母的答案,会自己探索“我们究竟是谁”“从哪里来”这样的问题。
于是,我们就会去求助科学家——也就造成了我在办公室里从来不敢装座机,甚至电话也不太敢接。因为有很多人会来电话找我,问我能不能帮他测一下DNA,告诉他是不是李世民或者赵匡胤等人的后代。之所以现在会遇到这么多问题,是因为我在十年前干了一件非常神经的事情:我们向全国发出了一个寻人启事,去找曹操的后代。
曹操是三国时期的人,距我们有1800多年。
那么,我们如何在现在中国的10多亿人里判断谁可能是曹操后代呢?我们研究的工具就是男性所特有的一种Y染色体,它只能从父亲传给儿子。也就是说,只要不改姓、不收养、不红杏出墙,Y染色体就会永远跟着男性的姓氏传递下去。如此,我们就可以在现代姓曹的人里边试图寻找共同的特征,而这些特征同时又能够跟1800年前的曹操联系起来。
但是在实际操作中,我们又遇到了更大的困难:“曹”这个姓氏在中国现在有700多万人,都筛一遍不太现实。所以我们又增加了一个新的坐标——家谱。
家谱在中国有非常悠久的文化传统。我们翻遍了全国的曹姓家谱,拜访了所有跟曹操相关的家族。从北方一直到南方,一共调查了79个曹姓家族,取了几百份样本。我们为什么觉得曹操的身世之谜如此有趣?首先,曹操非常有名,看过《三国演义》的人都知道他。其次,曹操的身世存在争议。
曹操的爷爷是一个太监,所以不可能拥有自己亲生的后代。因此在当时,曹操的身世就为大家所诟病。曹操怎么介绍他的身世?他说自己是汉丞相曹参的后代(“汉相国参之后”),这里的“参”指的是“萧规曹随”里的曹参。在三国的年代,一个人的出身就很可能会决定了他的政治生涯。曹操说是曹参的后代,就为他辅佐汉室江山提供了一个非常正当的理由。但是曹操的一些敌人怎么说?
袁绍当时攻打曹操,他说曹操的父亲曹嵩其实是街边的乞丐抱养过来的(“父嵩,乞丐携养”)。东吴人也是曹操的敌人,写《曹瞒传》,说曹操的父亲曹嵩是夏侯氏之子,曹操和夏侯惇是堂兄弟(“太祖与惇为从兄弟”)。
我们的DNA结果后来发现,在家谱上说是曹操后代的这些人,他们有一种非常高频率出现的Y染色体类型(O2,图中用五角星标注);我们也调查了自称是曹参后代、但不是曹操后代的那些人,他们有另外一种Y染色体类型(O3)。O2跟O3虽然只是一个数字的差别,但它们中间岔开了2万多年。所以,当时曹操可能是自己杜撰了曹参后代的身份。为了进一步揭开曹操究竟是谁,我们又跑到了曹操的老家——安徽亳州。
安徽亳州是曹操爷爷发迹的地方,那里有他们家方圆几公里的一个墓葬群。我们从里面选取了一个有确切身份记载(曹操的叔爷爷曹鼎)的墓葬,然后在墓葬主人的一颗牙上钻小孔、取粉末来提取DNA。结果发现,曹操叔爷爷的Y染色体类型跟曹操现在的后代是一样的。也就是说,曹操其实与叔爷爷来自于同一家,而不是街头乞丐抱养的后代;同时,他也不是夏侯的后代。
这说明当时的袁绍跟东吴人说曹操身份来源不明都是在诟病他,而我们的研究在一定程度上为曹操正名了。
我们还可以跨越五六千年,去研究全体中国人的祖先。我们发现,有将近一半的中国人都可以追溯到5400~6800年前的三个老祖宗,就是图上这三个最末端的α、β、γ分支。可以想象为:远古时代有三个非常强大的父系部落,这些部落里的人娶了很多老婆、生了很多孩子,如此一代一代传承下去,就奠定了整个中国的遗传基础。
我们用同样的方法,还判断了清朝皇族爱新觉罗家的Y染色体类型,发现属于C3b下面的一个小分支。有趣的是,C3b下面另外一个分支在蒙古族里边频率特别高,有可能是成吉思汗(或者和成吉思汗有关的部落)的Y染色体类型。我们还可以把时间从清朝推到元朝,甚至再推到七八千年前——因为我们发现中国东北地区和俄罗斯远东地区的古人Y染色体类型也属于C3b。
所以,我们可以通过男性相传的Y染色体,重构出延续8000年的父系血脉。
看过金庸小说的人都想知道乾隆跟陈家洛有没有关系。如果你现在拿起手机去搜索关键词,可能会看到一些消息,说DNA研究已经给出了答案——乾隆跟陈家洛是一家的。这个消息来自于新垣平写的一本书,《剑桥简明金庸武侠史》。
在书中第27~28页,新先生言之凿凿地说,复旦大学人类学实验室的李辉、严实和王传超写了一篇论文,发现清高宗后裔的Y染色体跟其他清朝的皇室都不一样,反而跟海宁陈家是完全吻合的。并且哪一年发表在什么期刊上都写得清清楚楚。大家信吗?全是假的,我们根本就没有做过这个研究,更没有写过这篇论文。神勇的新博士还有广大的网民朋友帮我们杜撰了这篇论文,并且把这个故事讲得有声有色。
所以大家可以理解为什么有这么多人会打电话找我,就因为想知道自己是不是乾隆的后代,跟陈家洛有没有关系。
其实作为科学家,我们更关注人类整体。如今,我们已经可以从古人类的身上直接提取DNA,比较与几千年前、几万年前人的关系。十多年积累的数据,几乎重写了人类起源、迁徙和演化的历史。我们的祖先都可以追溯到30多万年前的非洲。
大约5万多年前,他们离开非洲,到达了中东和近东,碰到了尼安德特人——尼安德特人是在23万年前就出现在欧洲的一种古人类,不过在3万年前突然灭绝了。我们的祖先跟他们在欧洲可能共存了有1万多年的时间。这么长时间的共存,那么有没有发生点什么事情?还真的发生了。通过与尼安德特人的DNA比较,我们发现我们都带有2%-3%的尼安德特人血统。
我们的祖先在和尼安德特人混血之后,一个分支走向欧洲,变成现在的欧洲人;另外一个分支继续向东,沿着海岸线走到了亚洲。可能是在中国南方或者东南亚,又分出两个分支:一个分支继续北上变成了我们的祖先;另外一个分支继续南下。在南下的过程中,他们又碰到了另外一种古人类丹尼索瓦人——丹尼索瓦人跟尼安德特人生活在同一个时代,最后也灭绝了。
经过和丹尼索瓦人混血,现在的巴布亚人、新几内亚人甚至澳大利亚人身上都带有5%到6%的丹尼索瓦人的DNA,所以他们的体貌特征看起来和我们很不一样。
我们的祖先继续走向亚洲,经过了几万年的时间,到了9000年左右,在黄河流域和长江流域独立发展出了农业,开始了非常稳定的定居的生活,就出现了人口的增长。随后,黄河流域的祖先就开始了长途跋涉的人群迁徙,去开辟更多的领地。
一批人群走上了青藏高原等地,和那里的土著人群混合,逐渐变成了现在的藏族、彝族和纳西族。另外一个分支走向东边和南边,逐渐变成了汉族人群。同样,长江流域的人群的迁徙到了中国东南,跨过台湾海峡到达台湾,然后再由台湾到东南亚,最远可以到达非洲的马达加斯加。另外一个分支走向了中国西南地区,逐渐演化成了现在的壮族、侗族和水族。
人口的迁徙和混合存在一个普遍的演化规律:人群之间的差异会逐渐减小。
如果把8000年前生活在东北地区和中国南方的古人进行比较的话,他们之间的差距约等于现在中国人跟法国人之间遗传的差距;而如今仅仅有我们跟法国人差异的1/100。同样还有另外一个分支,他们继续北上到达了西伯利亚,跟在贝加尔湖旁边2万多年前的一批来自于欧洲的古人群又发生了混合,我们的祖先贡献了60%,来自欧洲的2万多年前古人贡献了40%的DNA。
两者融合以后,跨过白令海峡到达了美洲,变成了现在美洲的印第安人。大家可能会在微信朋友圈看到,为什么印第安人叫“印第安”?是因为他们跟中国的商朝有关系。商朝被周朝打败以后,商朝的移民就流亡到了美洲,见面后会互相问候“殷地安否”。其实无论从DNA还是从考古学上去看的话,这些传说都是无稽之谈。
大家可能会觉得,我的研究非常有趣,但是有什么用呢?
如果只是去揭示一个普通人的祖先是谁,来自于哪里,可能没有什么用;但是如果用它来破解犯罪分子的身份,推测犯罪现场的嫌疑人可能来自于什么地方,就会对破案有很大的帮助。我们可以通过犯罪现场所遗留的DNA来判断嫌疑人是男是女,可能来自于什么地方,面部特征(如头发颜色、眼睛颜色、单眼皮还是双眼皮)是什么?都可以勾画一个大致的轮廓出来。
如果这些信息还不足以让公安来破案,我们还有更厉害的手段——理论上讲,只要有2%的成年人在数据库提交自己的DNA信息,我们就可以追踪到任何人的远亲,进而揭露他们的身份。2016年,警方破获了一起30多年的陈年旧案——甘肃白银连环杀人案。犯罪分子的一个远房亲戚行贿,被公安机关取了DNA样本,然后顺藤摸瓜追溯到了他本人。另外还有个例子,就是去年刚破获的美国金州杀人案。
警方把当年犯罪嫌疑人的DNA上传到公共的数据库,伪装成了一个基因检测的用户。后来匹配到了他的一个远房亲戚,让沉寂40年的案件有了进展。最后把犯罪分子抓获的时候,他已经将近70岁了。
除了法医学之外,我也很难再想到追溯祖先有什么用途。但是对于培养孩子来讲,我觉得我们去尊重他们的兴趣也是一种进步和用途。在我读书的那个年代,很难讲因为感兴趣要去学这个专业。
但是我现在发现,有很多来自全国各地的学生,即使还没有入学,甚至都没有通过考试,也愿意自己租房子到实验室里来做项目。他们告诉我很感兴趣,想去做这件事情。我觉得“感兴趣”也是一件值得被尊重、推广和重视的事情。希望我们每个人都能做一个有趣的人,做一些有趣的事情,谢谢大家。