我知道“绑架者”是你

那是1983年，那名八岁的女孩正待在她最喜欢的地方：书店。女孩没有太多钱，但是她把生日和节日里收到的红包都存了起来，刚刚够买一本书。她的爸爸告诉她五分钟后在书店的前面碰面，然后就放她自由活动，看她自己想看的书。书店里的灯光让事物看起来要么太闪亮，要么有点褪色。不能说这完全是个好地方，但有了那些灯光和人群，这里至少来说是一个可以让她安全独处的地方。

她正在读一本画书，讲的是一只橙白相间的小猫的历险故事，就在这个时候，一只男人的手从她脑后伸过来，捂住她的嘴。她能够感到他的身体离她很近，就在她后面。她能够听到身体上方传来的粗重呼吸声。“你跟我来，小女孩。”男人低声说道。但是……他的声音……听起来有点熟悉……

罪案每天都在发生，每处都在发生，是的，也许某一天你也会身陷其中。也许你认识的某个人会偷窃你的东西，或是诈骗你。

一个被抛弃的情人可能勒索你；一名政客可能许诺你一门好生意来交换你的一次非法徇私行为。这很诱人，不是吗？你的两名员工可能合谋从你的公司窃取钱财。与此同时，你的女儿可能从书店里被诱拐。正像科学帮助我们揭示宇宙的奥秘那样，它也帮我们理解更多世俗的谜题。毕竟，有些时候那些更世俗的谜题对我们的日常生活来讲要重要得多。

尽管了解宇宙的年龄在科学上是存在价值的，但你可能更愿意选择找出杀害你妹妹的凶手，以便正义得以伸张。法国人埃德蒙•罗卡（1877-1966）曾说，“每一次接触，都会留下踪迹”，很多人把他当作“现代法医学之父”。这一组六篇文章，想要探索这些踪迹是什么，科学家如何分析它们，法庭如何使用（有时是误用）它们，以及法医学的科学方法和技术正在发生的改变。

计划中的一些话题对于罗卡来说可能是熟悉的，但其他一些，比如我们的第一个话题“司法语言学”，则不在此列。

我知道“绑架者”是你。“司法语言学”这个术语在1968年之前是不存在的。司法语言学有多个不同的侧面，包括商标纠纷、声音比对与分析、作者鉴定，以及演说分析。尽管不是每个人都同意，但许多学者还将法律语言的研究以及法律文本的翻译当作司法语言学的问题。

实际上，领域中的一些人认为司法语音比对也不属于司法语言学的一部分。“基本上，我所处理的是讲话中的声学特点，而司法语言学一般更多关注语言的意义或内容。”杰弗里·斯图尔特·莫里森博士解释说。他是一名独立法医顾问，专注于声音比对分析以及法医学中的统计建模。

通常的情境是这个样子的：某人被指控犯有某项罪名并被捕，警方录了一段此人讲话的录音。往往，这是一段警察问讯的录音。

在寻找证据的过程中，一段跟该案有关的录音被发现。它常常是一段两人或多人的电话录音，但也有可能是其他任何内容。录音中一个未知的声音听起来像是嫌疑人的声音，但是嫌疑人声称录音中的声音并不是他的。这两段录音——已知的和未知的——必须经比对来断定未知的说话者与被捕者是否为同一人。在他/她进行声音分析的时候，科学家究竟是在做什么呢？嗯，这取决于你向谁发问。不同国家不同执法部门使用不同的识别方法。

但是首先……我们应该谈一谈录音质量的问题。

“如果你说了些话，我把你的话录下来，随后，我立即尝试录下你以完全相同的方式说完全相同的话，然后我对比两段录音，我们几乎必然地会发现一些可察觉的不同。”莫里森解释说，“也许警察的问讯发生在一个墙壁坚硬的小房间里，那录音里就有回音。也许空调开着，那录音里就有额外的杂音。还可能发生其他一些事情，比如某人把文件存为了MP3格式的。

MP3格式的文件之所以能相对较小，是因为它们实际上丢掉了某些信息。”手机和其他电子设备常常也会删除某些数据信息，因为更少的数据意味着更快的速度。所有这些因素都会造成不匹配。不是说已知和未知声音的完全不匹配，而是说绝对的确定性录音质量的不匹配。所以，一定不存在“百分之百匹配”的两段不同的录音，即便它们都出于同一个说话者之口。即不存在绝对的确定性。

鉴别出未知说话者的声音与已知说话者有多大的相似性当然是重要的。但同等重要的是，鉴定未知说话者的声音相较于拥有相似背景的人——比如相关人群——的声音而言，具有多大的典型性。

然而还有一个地方有可能出错。想象一下，警方拿到了一段录音，其中一名未知的说话者生活在北京，但他的普通话中带有福建口音。警方找到并拘留了某个住在北京且说话操福建口音的人。他们将问讯录了下来。

现在，一名司法声音分析师对两段录音进行比对。即使两段录音中的说话者是不同的人，他们仍然是相似的，因为他们都生活在北京并带有福建口音。在不清楚就相关人群而言这些计量具有多大典型性的情况下，分析师并不能真正确定相似性具有多大意义。那么，专家使用什么样的声音样本数据库来鉴定未知说话者声音的典型性呢？相关人群又是什么？数据库应该包含具有相同性别、相似年龄、居住在北京，并且说普通话时带有福建口音的人。

如果专家使用的数据库包含了全国各地的说话者，那么这将使鉴别结果向着“说话者为同一人”发生偏斜。

“专家可能会得到一个较大的可能性比率值，但这可能并不相干。”莫里森说，“回答了什么问题？如果你不知道问题是什么，那你就不会真正理解答案。反之，如果相关样本人群拥有相同的口音，你得到的数值会小一点，但它回答了一个更加相关的问题。

”国际刑警组织在2016年对世界范围内100家执法部门所做的调查显示，有六种不同的常用方法被用于说话者鉴定：听觉、声谱、听觉声学语音学、声学语音统计、人为监督式自动，以及全自动。大部分当前使用的方法都依赖于某种程度的人工分析，这就容易让错误和偏见趁虚而入。所有回应调查的执法部门中，只有少于半数拥有用于分析录音的实验室。在他们中，少于一半拥有录音数据库。

在这些拥有数据库的部门中，又有少于一半拥有人群样本录音数据库。

莫里森认为司法语音比对领域正在发展出更加可靠的分析方法，但变化是缓慢的。“那么……我们在看到领域内的进展吗？”“Yes。”“我会很快看到最终结果吗？”“No。”与此同时，美国杜肯大学计算机科学教授帕特里克·尤奥拉正在采用与莫里森类似的统计方法来分析书面文档的内容，而非录音的声学特性。

他在文本分析、安全、法医学和文体测定学方面是一位国际知名专家。“对于文体测定学，大概有两个常见的大误会。第一个是，人们根本不知道这件事是可以做到的。”尤奥拉说，“但第二个是，一旦人们知道你可以做到，他们会对你所能达到的准确程度产生不切实际的想法。”

第二个误解与一种叫做“CSI效应”（Crime Scene Investigation，犯罪现场调查，一部美剧）的现象有关。

这得感谢以一部同名电视剧为代表的科学探案类电视剧集在美国的流行。所有这类电视剧都有一个共同点：在45分钟的节目结束之前，法医专家总是能快速得到结果，并且得到百分之百的匹配以抓住坏人。“总体来说，法医学没有那么强大。”尤奥拉说道。你无法达到这种难以置信的确定性，而且你可能没法在广告时间之后就那么快地得到结果。这对很多律师来说是个真正的问题。

在没有DNA证据或者因为真实的法医工作无法发现令人惊讶的高比率结果的时候，陪审团成员会出于缺乏证据的考虑而拒绝宣告有罪。

一些研究显示CSI效应是真实存在的，而另一些研究则暗示它并不存在。莫里森更加关心的是相反的问题。“很多人对数学表现出恐惧。所以，简单的答案是：‘是的，就是他。相信我，我是专家。’然后陪审团成员想说‘好的，我们相信你。’审理不公就是这么出现的。”并非所有的文体测定都是用于罪案的。

2013年，尤奥拉发现自己和自己的工作处在了国际聚光灯下。当时，他开发的文本分析软件检测到一个名叫罗伯特·加尔布雷斯（Robert Galbraith）的新晋且没有名气的作家的处女作，与著名的哈利·波特系列的作者J·K·罗琳的作品具有显著相似性。

那款名叫JGAAP（The Java Graphical Authorship Attribution Program，Java图形作者资格归属）的软件所分析的特点中包括了某些常见功能词（指“的”或“这”这样的词）、单词长度分布，以及重复出现的单词组合。

在尤奥拉的发现被公开之后，罗琳确认了那些流言是真实的。她真的使用了罗伯特·加尔布雷斯这个笔名。文体测定分析也被用于一些中文名著。

上学的时候你是不是学到《红楼梦》的后40章并非曹雪芹所著？但是有人跟你解释过这个结论是怎么得到的吗？曹雪芹在小说出版之前就去世了，所以对小说结尾的争论自它1791年面世以来就出现了。小说最早的出版人是高鹗和程伟元。在第一版的前言中，程伟元声称他根据曹雪芹创作的手稿“抄成全部”。但是，“抄成全部”的意思是程伟元和高鹗仅仅编辑了曹雪芹所写的后40章的粗稿吗？

或者，“抄成全部”意味着程伟元实际上亲自写了这些章节？

过去三十年里司法语言学的发展几乎总能从对这部小说的分析中找到踪迹。看起来，一有新的分析方法出现，学者们就会尝试用它来回答《红楼梦》结尾作者身份的问题。在1980年代，学者们采用人工积分的方式研究了小说的语言学风格，对比了前80回和后40回中的功能词、短语和篇名。也是在1980年代，还有学者对小说的词汇进行了（非计算机的）统计分析。

然而，这些早期的分析工作中所缺少的，是基于数学算法所进行的计算机分析。2014年，也就是帕特里克·尤奥拉和同事发现了罗伯特·加尔布雷斯的真实身份的后一年，数学家胡显峰（音）、王洋（音）和吴强（音）发表了一份基于算法的对《红楼梦》的新分析结果，测试了他们称之为“慢性分裂”的小说风格。他们的发现确认了早先的分析结果：“前80回和后40回系两个不同的作者所写”。

他们的研究看起来只是再次确证了人们的常识，但他们也发现了一点新的东西：他们的分析还显示第67回也并非曹雪芹的写作风格。

尽管对于当代作家韩寒第一部小说的作者身份的争议已经平息，也仍然有可能用类似于分析《红楼梦》的方法来对存疑的作者身份进行分析。与声音比对的工作一样，这种分析可能并不像一些人想象的那样简单。仅仅把韩寒的第一部小说《三重门》与其父亲的小说做对比是并不充分的。

甚至于，分析中仅仅把韩寒和其父当作两名已知的作者来分析，也是不够的。理想状态下，分析需要包含多个已知作者的作品以及多个存疑的作品。就像尤奥拉在他的白皮书《测量风格：文件分析与司法文体测定》中发现真实作者所言：“如果你只有来自一名无争议作者的作品样本，那么这名作者看起来跟任何人都很接近。

因此，必须有一批足够多的所谓干扰项作者，这些作者要么是其他一些说得过去的嫌疑人，要么至少是跟实际的嫌疑人足够相似——他们的作品能够支撑有用的和有意义的检测。”

文档的质量也必须足够高，因为就像声音比对那样，错误匹配的情况是会发生的。所以，如果你要分析《三重门》的作者身份，那么作为对比你就需要韩寒的另一部小说——不是博客文章、个人信件等。你还需要把其他已知作者的小说拿来做对比。

但是，你如何证明韩寒写了你拿来当作已知文档的那部小说？你能做到的最佳结果可能是：1号作品跟2号作品最为相似。但如果你不能够确定第二部小说的作者身份，那么你能说的也只是“它们最为相似”。你仍然不能够确定谁写了它们。噢，那名在书店里被绑架的八岁女孩？还记得她吗？她确实跟着那个男人走了。我知道，是因为我就是那个女孩。

在被手捂住嘴之后，我一动不动地站在那里。看，我认识那个声音。

那个男人的手一从我的嘴上拿开，我就说：“爸爸，我知道是你。”他把我转过去面向他。“如果有人绑架你，你应该叫喊。”他斥责我说，“你为什么不叫呢？你为什么不挣扎呢？”“我说了，我知道是你。”我又重复了一遍。“你怎么会知道是我呢？”他问道。他以前就做过这种事。每一次，他都会质疑我的反应，总是告诉我说，他是训练我应对真实的绑架事件。他希望我喊叫和挣扎，而我的消极响应总是令他失望。

“你每次都是以完全相同的方式说完全相同的话。”我说。这在法庭上当然是不可采信的，但这就是事实。在那之后，我去书店的时候会背对墙角站立，这样就不会有人溜到我的身后了。