2014年,在危地马拉,骨骼遗骸并不是从万人冢里搜集的唯一生物材料。在我和我的田野学校同学挖掘圣马科斯山坡上尚无标记的坟墓的时候,同在现场的另外一处,危地马拉法医人类学基金会(FAFG)的社会人类学家们,正在采集活人的DNA样本。他们搭设了一个大帐篷,用口腔拭子采集当地公民的唾液。
帐篷下面色彩纷呈:不同的语言交织在一起;当地女性穿着的传统裙子熠熠生辉;干净的白色实验服,收集信息的白纸,清洁的橡胶检查手套,也在不协调地闪烁。所有提供DNA的当地人,都有亲戚或爱人在长达36年的内战里失踪。他们为FAFG的DNA数据库提供DNA样本,则意味着如果发现血亲的骨头,就能发现部分的DNA匹配。
后来,其中一位文化人类学家向我解释了这项任务所遇到的挑战。尽管西班牙语是官方语言,但这个国家有22个不同的族裔,许多住在乡下的人只会说本地语。虽然人类学家与居民之间的藩篱能够请翻译人员来解决,但仍然存在着误解。这些人生活贫困,常常因为缺钱而辍学,很多人不完全明白DNA是什么。当他们听说捐赠自己的DNA可能有助于寻找失踪的亲人时,他们有时会忽略掉其他信息。
DNA匹配要得以存在,失踪的家庭成员必须跟捐献者有血亲关系——母亲、父亲、儿子、女儿、表亲。绝望的妻子们捐献她们的DNA,希望能帮助找出失踪的丈夫;还有些人错误地认为,如果他们多次提供血液样本,将增加找到失踪亲人的机会。实际上,这些误解只会消耗基金会的时间和金钱。
这里的每个人都积极配合,但这种合作精神并没有使工作变得更容易一些。
回到FAFG总部,一位DNA分析师向我们介绍如何准备骨骼样本进行分析:DNA降解在生物体死亡后立刻就会开始;加之,样本所源于的那些骨头,已被掩埋在地下至少30年了。我们从已经清理过的股骨上取了一块样本,但是它被污染的可能性很高。骨样本用液氮冷冻,然后被碎成粉状。之后,它们将被酶分解,送入机器加以分析。
2014年我在危地马拉的时候,实验室所使用的法医DNA分析试剂盒,会分析15个短串联重复序列(STR)位点,也就是一个人DNA的15个“部分”。在这15个部分,所有人都有“重复模式”,但具体模式因人而异。因为DNA是从父母处遗传的,所以我们的STR模式,也是继承而来的;因此,基于计算所得的、两个无血缘关系的人具有相似STR模式的概率,我们可以用亲属的DNA,来识别未知的DNA“供体”。
美国采用13个STR位点的组合来识别,而中国采用15个。截至2013年,中国和美国拥有世界上最大的两个法医DNA数据库。FAFG的DNA数据库要小得多,但对于该组织的使命来说——确认内战受害者并将其遗体归还家人——是极其重要的。
为了与从犯罪现场搜集到的DNA进行比较,建立一个已知的/鉴定过的DNA图谱数据库,这可能是法医DNA分析面临的最大挑战。如果未知人的DNA与数据库中任何已知的DNA图谱都匹配不上,那么无论罪犯留下了多少DNA“证据”,都没法识别出他是谁。在创建DNA数据库时,就像语音分析(“法医语言学”)一样,不仅是两个样本之间的相似性很重要。典型性——图谱与相关人群中的其他人相比,独特性如何——也很重要。
FAFG的科学家在21世纪初开始建立他们的DNA数据库;更具体地说,他们的“STR人口等位基因频率数据库”,也被称为“失踪者及其亲属国家遗传数据库”。FAFG的科学家将其与“大规模死亡身份识别系统”(M-FISys)结合使用——该软件创建于2001年,用来帮助确定当时纽约世贸中心的遇难者。这个国家的每个家庭,都在某种程度上受到了内战的影响,甚至有几位FAFG的科学家也在内战中失去了亲人。
即使失踪人员的亲属出面提供DNA样本,DNA分析也只能提供一个可能性,而不是100%的确定性。当考虑所有可能的STR组合时,从理论上说,DNA图谱匹配的概率,在575万亿分之一到1万亿分之一(1x10^18)之间。但是,将DNA样本与亲属的DNA进行比较时,这一概率将变得更加复杂。
FAFG在2008年到2009年研究的一个案例,涉及了3个血缘相关家族组成的复杂家谱,其中包括42个人的DNA图谱。根据从两姐妹和三个儿子(受害者1)、一位母亲和四姐妹(受害者2)、两姐妹(受害者3)处收集到的DNA,FAFG的科学家们最终确定了这个家庭中14名失踪人员里的3位。
“我们在FAFG法医遗传学系使用的标准程序并不算新颖;事实上,它们大量依赖于其他实验室验证过的方法,尤其是波斯尼亚的ICMP,”DNA分析师艾玛·约翰斯顿在2014年向我解释说,“非常重要的是,科学界已经建立并接受了这些技术,只有这样,才能在法庭上站得住脚。”约翰斯顿还分享说,实验室也有计划更新他们的DNA分析方法:从分析15个STR的标准程序,升级到分析21个STR的新程序。
“引入新试剂盒的想法是,有了更多的STR,我们能够计算出的配对统计概率,应该会更高;就是说,配对的确定性会更高,”约翰斯顿解释说,“如果样品降解,导致没有太多的遗传信息可用,这一新程序可能会起到帮助。”
然而,在实验室开始使用新软件之前,他们需要从DNA数据库中收集信息,用来确定新试剂盒所分析的额外的6个STR在当地人群中出现的频率——这些额外数据,在2014年并不存在。
在危地马拉,确定内战时期的大部分“罪犯”,并不困难。在内战最严重的时候,曾担任军官和危地马拉总统的里奥斯·蒙特,于2013年被判犯有种族灭绝罪和反人类罪。不过10天后,定罪就被推翻了;同时,该国总检察长因推进开庭而收到了死亡威胁。我们在发掘万人冢时,里奥斯·蒙特正等待着再审。截至2017年11月,再审还在进行中。关于另外五名危地马拉退役军官的反人类罪行,将于2018年3月开始审判。
新方法:DNA表型预测
寻找失踪亲属的人,可能会渴望将他们的DNA捐献给DNA数据库,但是罪犯显然不会。目前,美国的DNA图谱数据库——综合DNA指数系统(CODIS)——包含超过1650万个DNA图谱,包括罪犯、被捕者、“法医图谱”,但这仅占美国总人口的5%。除非有过犯罪记录,以至于数据库中已经存在其DNA图谱,否则可能找不到匹配。
一种相对较新的、使用DNA预测身体特征的方法到来了,它被称为“法医DNA表型预测”。随着科学家从基础遗传学研究中获得新知,了解到哪些基因决定我们身体外貌的哪些部分,我们正变得有可能对某些特征做出高可靠度、高精度的预测。这样就绕开了建立一个覆盖所有人群的DNA图谱数据库来比对来自未知个体DNA的做法。
1990年代中期,已经有研究识别出那些决定眼睛颜色的基因;在1996年,科学家发现了第一个基因OCA2,接着在1997年,发现了第二个基因HERC2——它们被认为是决定眼睛颜色最重要的基因。人们对于遗传学最大的误解之一,是认为一个基因控制一个性状。实际上,很少这样。即使是眼睛的颜色,也有总共六个基因被认为起了作用。自2010年以来,已经有方法来协助精准预测眼睛和头发颜色了。
决定发色和肤色的基因,是下一步要研究确定的。不过大多数早期的研究都集中在欧洲人群,因为蓝眼睛和红头发是最容易准确预测的。它们(蓝眼睛和红头发)都是已知基因突变的结果。
曼弗雷德·凯泽博士是荷兰伊拉斯姆斯大学医学中心基因鉴定系的创始主任,人类外貌特征遗传学的领军人物之一。他解释说:“所有外观特征都是高度可遗传的。即使是身高,可遗传性也高达80%。目前还不了解除了色素沉着之外的外表特征遗传,问题在于它们太复杂了。未来能否解决这一问题,主要取决于研究经费。”凯泽在人类外貌特征遗传和DNA预测方面的很多研究,是与中国科学院北京基因组研究所的刘凡教授密切合作完成的。
2017年,人类长寿公司和J·克雷格·文特尔研究所的科学家试图用DNA分析来预测身高、体重、BMI指数、肤色,甚至年龄、声音和脸形等。虽然他们的研究对象很少,大约只有一千人,但是这些人的背景跟之前的研究相比,更为多样化,包括了非洲、欧洲、拉丁裔、亚裔。最终,研究显示,许多特征的预测准确性是极其有限的。
新方法:21个STR
2015年,危地马拉FAFG的法医DNA实验室开始使用能够分析21个STR基因位点的新试剂盒,也就是分析师艾玛·约翰斯顿在2014年告诉我的那个。他们需要大约100个DNA图谱来建立一个数据库,这样就能够得到足够的、有关当地人口的信息,以确保该试剂盒有效可用,他们这样做了。但是,这并没有完全取代旧的方法。
“对于需要纳入更多位点以达到有效鉴定门槛的案子,我们已经在使用(新试剂盒)了。”FAFG法医遗传学负责人米歇尔·史蒂芬森解释说,“我们不会在所有样本中常规化使用PP21(新试剂盒),因为我们的大部分数据库都是用Identifiler(旧试剂盒)构建的,同时也因为成本问题,PP21对我们来说更加昂贵。”
从很多方面来说,史蒂芬森和凯泽正分别站在法医DNA分析流程的两端。凯泽致力于法医DNA分析的“前沿”,识别与身体特征相关的基因,并创造新的法医方法,来协助调查人员的工作。史蒂芬森则负责一个法医DNA实验室,使用已经很完善的方法来确认失踪人员,而不是研究新的方法。但他们都面临着同样的挑战:没有足够的时间和金钱。
“我们对于遗传疾病的遗传学了解,要比外表遗传学更多。为什么呢?”凯泽问道,“因为资助寻找疾病相关基因的基金,要比资助研究外表相关基因的多得多。”
在荷兰——曼弗雷德·凯泽生活和工作的地方——政府分别在2012年和2017年,批准了法医工作中可以对眼睛颜色和发色进行DNA表型预测。预测结果并不能在法庭上使用,但在调查过程中,可以用来缩小潜在嫌疑人的范围。最终的身份确定,使用的还是“传统”方法,即STR基因位点,只是现在是作用于那些体貌特征与DNA表型预测相符的少数个体。“DNA表型预测可以用于确定大规模灾难的受害者,包括战争。
”凯泽补充道,“然而,预测出的性状是否有用,还取决于人群中的差异化程度。如果人群中可能与案例相关的每一个人都有相同的特征,那么用DNA预测这个特征就是无用的。”FAFG实验室还计划启用别的DNA分析方法,包括X染色体分析和线粒体DNA分析。不幸的是,尽管在世界其他地方的法医案例中,DNA表型预测已经被证明是有效的,但对于确定危地马拉的内战受害者来说,并不是特别有用。
尽管科学进步帮助了一些人,但并不是总能帮助到所有人。
从实验室到坟墓
到此,故事又回到了起点,回到了山坡上的万人冢。站在帐篷下面的人们都在等待着捐献他们的DNA,希望能找到失踪的亲人。
到目前为止,FAFG已经发掘出5500多位身份不明者,并确定了将近2200人。尽管拥挤在帐篷底下的人很可能并不知道这些确切的数字,但他们知道,自己还有可能找到亲人。这个“还有可能”,就是他们的动力。
每年,发掘出的骨架数量总是超出该组织所能够分析和确认的数量。尽管如此,法医人类学家们仍在继续发掘万人冢,因为尸体需要被找回。家人们仍继续前来捐赠他们的DNA,以数字和字母的形式将他们的希望添加到数据库中。
在位于危地马拉城的FAFG总部,灯光明亮、人头攒动的实验室上面,有一个宽大、黑暗的房间。黑暗里,有几十个货架。货架上,有几百个箱子。箱子里,都是人的骨头。
我不确定,那些在山坡上的万人冢现场提供DNA的家人们是否知道FAFG的科学家们所面对的这些积压的工作。包括准备样本,DNA提取和加工,DNA扩增和检测,以及单次DNA测试可能就需要24小时到72小时才能完成。实验室的机器昼夜不停地运转着,但时间和金钱是有限的。人的能力也是有限的。有一些信息,DNA分析也永远无法提供,比如,他们所爱的人到底是怎样死去的。
尽管这几百个箱子都经过了精心编号、被贴上了标签,但实验室上方的存储空间,看起来却好像是另一个万人冢。在箱子里,人们等待被识别。等待着再次为人。