2000年4月,《麻醉与镇痛(Anesthesia & Analgesia)》杂志刊发了一封致编辑函,彼得·克兰克(Peter Kranke)与2位同事所写的这封信里满含讽刺。这3位麻醉学者把矛头指向了一篇日本同行发表的文章,作者是藤井善隆(Yoshitaka Fujii)。他们认为,藤井所发文章中有关一种手术后恶心呕吐预防药物的数据“好看得不可思议(incredibly nice)”。
在科学行话里,说研究结果“好看得不可思议”可不是一种赞赏——这等于指责研究者漫不经心,甚至是伪造结果,可是《麻醉与镇痛》杂志没注意到其中的警告意味,而是采取了放任不管的态度。在致编者函之后,《麻醉与镇痛》杂志附上了藤井的解释;他问道:“究竟什么样的证明才能算充分证据?”换句话说就是:“你们不信我?那就不信好了。”此后,《麻醉与镇痛》杂志还继续发表了藤井的其他11份论文。
德国维尔茨堡大学(University of Würzburg)的克里斯蒂安·阿普费尔(Christian Apfel)是致编者函的作者之一。他曾前往美国食品药品监督管理局(FDA),提请该机构注意他与同事发现的问题。不过,他从来没得到任何回复。也许是认识到自己的好运气来源于审核的宽松,藤井自2005年前后就几乎不再发表麻醉学文献。他转向了眼科学和耳鼻喉学。
在这些领域里,他的那些侥幸之作不太会引起别人的注意。截至2011年,他已经发表了200多项研究成果,这对于他所在的领域算得上是多产了。2011年12月,《麻醉学杂志》(Journal of Anesthesia)发表了藤井的一篇论文,这是他的最后一篇论文。
在接下来的两年中,一个事实变得日趋明显,藤井的许多(实际上是绝大多数)研究成果是伪造的。他是当今单个作者被撤稿记录的保持者,总数高达惊人的183篇,约占1980年至2011年间全部撤稿数的7%。藤井不仅是个从声名卓著到声名狼藉的典型,他的经历还开启了学术出版的新纪元:一个属于检测学术欺诈的统计工具,以及乐意使用这些工具的学术“警察”的时代。
在从2009年起担任《麻醉》(Anaesthesia)期刊的总编辑前,史蒂夫·延蒂斯(Steve Yentis)就有着相当深厚的科研伦理背景。他担任过一个麻醉学学术委员会的委员及主席,甚至利用业余时间取得了医学伦理学硕士学位。此外,延蒂斯还为出版伦理委员会(Committee on Publication Ethics,COPE,一个位于英国的国际组织,致力于修订学术出版标准)工作。
但他在履新后还是没有“预感到天快要塌下来了”。与十年前的《麻醉与镇痛》杂志一样,《麻醉》在2010年刊登了一篇关于藤井论文的编辑意见。意见作者们不相信藤井研究成果的真实性,号召全学科对藤井所发论文进行审核并,清除造假的结果。
后来,延蒂斯在一篇题为《谎言、弥天大谎和统计学》的文章中说,这篇由他约稿发表的编辑意见引来了洪水般的来信,其中一位来信读者表示“为这种研究者在论文中歪曲证据基础的情况感到惋惜”,并强烈要求麻醉学期刊杂志编辑对此有所行动。这封信的作者是英国麻醉医生约翰·卡莱尔(John Carlisle)。在某种意义上,这篇编辑意见的刊发恰逢其时。在此之前,麻醉学领域接连了遭受两次重大打击,刚开始慢慢恢复。
第一次打击来自一名美国马萨诸塞州(Massachusetts)的疼痛医师斯科特·鲁本(Scott Reuben),他伪造了临床试验数据。不到一年之后,一位多产的德国研究人员乔基姆·博尔特(Joachim Boldt)就制造了第二次打击:人们发现他篡改了研究论文,并且还有其他违反学术伦理的行为,这些不端行为总共导致博尔特被撤稿90篇。如果事情看起来好得让人难以置信,那么数学会告诉你真相。
《麻醉》发表过博尔特的6篇论文,这使延蒂斯感觉有些难堪。因此,当看到卡莱尔的来信后,他发现了机会。延蒂斯明确告诉卡莱尔,他不能只当键盘侠, “我反过来要求写信人对藤井的研究进行分析。” 卡莱尔承认自己当时既没有统计学专长,也不是特别有名的麻醉学家,说的话在同行中间也没有什么分量。但他的结论十分简单,也无法忽视:藤井的研究数据基本上不可能是从一组真实实验中获得的。
临床医学中的最佳证据来自随机对照试验,本质上来说,就是靠统计学把“偶然的随机反应”和“药物或其他治疗手段的真实效果”区分开来。卡莱尔解释说:“通常来说,实验里有治疗组和安慰剂组,分析的是接受治疗后和接受安慰剂后的两组数据;而我所做的不寻常之事就是分析在接受治疗之前或给予安慰剂之前,这两组变量之间的差异(比如说体重),并计算出这些差异小于,而不是大于观察结果的概率有多大。”
藤井善隆在1991年至2011年间曾进行过 168次满足“黄金标准”的临床试验(这使得他每年发表的论文数达到令人瞩目的8篇)。卡莱尔将藤井的实验结果与其他研究人员先前取得的数据,以及随机因素可能造成的影响进行了比较,并查看了从研究开始时病人的身高、血压,到藤井所测试的药物发生副作用的频率等各项因素。
利用这些方法,卡莱尔在他2012年发表于《麻醉》杂志的论文中得出结论,藤井善隆在实验中获得这些研究结果的概率约在10-33这个数量级,一个小得可怜的数字。在这篇论文中,卡莱尔用晦涩的术语解释道,藤井的数据中存在“不正常的模式”,说明“这些数据偏离随机样本的程度足以将它们排除在证据基础外”换句话说就是:如果事情看起来好得难以置信,那么数学可能会告诉你那确实不可置信。
卡莱尔的结论与那些在2000年呼吁对藤井进行审核的麻醉学家所持观点很像——只是这次得到了人们的关注。卡莱尔的研究结果发表后不久,日本的一项研究结论显示,藤井善隆发表的212篇论文中仅有3篇包含明确可靠的数据,38篇论文无法被确定是否为欺诈,171篇论文最终被认定完全伪造。这份日本调查报告总结道:“这就像是他坐在书桌前,写了一部关于自己的研究假说的小说。”
卡莱尔的统计学分析方法不仅适用于麻醉,甚至不仅适用于和人有关的科学。卡莱尔说:“我用的方法可应用于任何事物、植物、动物或矿物等。它只要求把人、植物或事物随机分成不同的组。”这对于其他学术刊物来说也“相当容易”实行。至少有一位期刊编辑同意卡莱尔的说法。
斯坦福大学麻醉学家、《麻醉与镇痛》现任总编辑史蒂文·谢弗(Steven Shafer)说:“虽然它还在发展,但是约翰·卡莱尔的基本方法已经被作为一种检测研究欺诈的工具推广开来。”谢弗、延蒂斯以及其他人都在为此而努力。卡莱尔计划最近发表一种改进后的方法。谢弗表示,他们的目标之一就是使这个过程自动化。
谢弗表示,他曾经亲自运用卡莱尔的方法鉴别出一篇2012年投给《麻醉与镇痛》的欺诈性论文。谢弗拒收了此论文,后来得知它被投递给了其他期刊。谢弗说:“同一篇论文,数据重新编过了!我在拒稿信中暗示那是一篇欺诈性论文,论文作者看到之后就编造了新的数据。”谢弗与同事向该论文作者所在院系负责人写了一封提示信,对方回复说:“这些人以后不会再搞研究了。”
而且,这种方法也不仅可以用于鉴别欺诈者。卡莱尔表示,科克伦协作组织(Cochrane Collaboration,一家开展医学文献审核与元分析的英国组织)等团体可以利用此技术检查任意合作成果的可靠性。这类元分析会把特定干预手段(例如药物或手术等)的许多研究结果汇集起来,因此被视为制定治疗规范的强大循证工具。然而,如果各项研究的数据基础有问题,那结果就是“输入的是垃圾,输出的还是垃圾”,毫无用处。
不过,这种方法要求期刊编辑参与其中——而目前,许多编辑并不愿意。有人认为有理由不对论文进行修正。而作者则从自身利益出发,宣称自己是“莫须有迫害”的牺牲者。更常见的情况是,允许对已发表论文匿名评论的网站(如PubPeer.com)上出现大量批评声音之后,媒体报道跟进,人们才会进一步采取行动。
例如在2009年,布鲁斯·艾姆斯(Bruce Ames)——因名字被用来命名致癌物测试而出名的那位——与同事一起开展了一项与卡莱尔研究类似的分析研究。研究的对象是3篇由帕拉尼纳森·瓦莱拉克什米(Palaninathan Varalakshmi)所领导团队撰写的论文。
与后来卡莱尔的研究成果形成鲜明对比的是,在这次调查中,3位研究者回击了,他们声称,艾姆斯的方法是“不公平的”,是对因果关系和相关性的混用。瓦莱拉克什米的编辑同意他们的看法。直至今天,在发表过这些受指控的研究者的论文的期刊中,还没有任何一家对他们的论文采取任何行动。可悲的是,这种情形才是学术欺诈调查的典型结论。难于对欺诈者追责的部分原因就在于学术出版本身。
延蒂斯认为,学术出版“一直依赖于人,而不是体系;同行评审过程有其自身的优缺点,但欺诈检查真的不是它的强项”。发表的基础是信任,而就算能获取原始数据,同行评审者也往往会匆忙略过。例如《自然》(Nature)执行编辑维罗妮卡·基尔默(Veronique Kiermer)就表示,该杂志要求作者“采用适当的统计学测试,并着重说明数据是否符合统计学测试的假设”。
她认为,编辑“在评价论文时,应当考虑上述要求,而不需要系统地检查论文涉及的全部数据的分布。”类似地,同行评审者也并不被要求检查数据集的统计情况。
去年,《自然》发生了一次惨痛的干细胞论文撤稿事件,并导致一位主要研究人员自杀。但他们依旧认为:“我们和评审者不可能发现那些严重削弱论文质量的问题所在。”该杂志社表示,他们进行了出版后同行评审,以及制度性调查。《自然》刊登的另一篇编辑意见中写道,查得太严会产生真正的问题。期刊杂志社“可能发现自己会仅仅因为要求撤稿这个行为就惹上官司,更别说在撤稿声明中提到学术不端了。”
《自然》或许仍然满足于将繁重的审查工作留给学术机构,但延蒂斯已经得到了教训。虽然在他2010年授权发表的那篇社论中,藤井善隆论文中的问题引起了读者关注,但是他也几乎忽略了那篇社论传达的信息。直到来来往往好几轮通信后(包括最终破案者卡莱尔写给他的信),他才行动起来,直到2012年才刊出了那篇决定性的分析文章。延蒂斯说:“如果现在的编辑意见中出现那样的指控,我绝不会再让它从身边溜走。”