科学界的造假之王:写了200多篇论文,183篇遭撤稿

作者: 亚当·马库斯(Adam Marcus);伊凡·奥兰斯基(Ivan Oransky)

来源: 环球科学

发布日期: 2018-09-19

日本麻醉医生藤井善隆因学术造假被揭发,发表的212篇论文中有183篇遭撤稿,成为学术界的造假之王。这一事件促使学术界开发出用于检测造假的统计学工具,并诞生了“学术警察”。

学术造假已经不再是什么新鲜话题,历史上的学术骗子也是数不胜数。其中骗子之王更是达到前无古人的地步,发表论文数212篇,因涉嫌造假而遭到撤稿的就达到了183篇之多。然而打假的过程并不是一帆风顺,也因此诞生了有名的“学术警察”。

2000年4月,《麻醉与镇痛》杂志刊登了一封致编辑部的信件。

德国维尔茨堡大学的麻醉学家彼得·克兰克与两位同事在信中直讽,日本麻醉医生藤井善隆发表的一篇文章中关于治疗恶心和呕吐的药物数据“完美得不可思议”。在科学界,称实验结果“完美得不可思议”并不是一种赞誉——这相当于质疑作者学术不端甚至造假。但《麻醉与镇痛》杂志并没有特别注意这一警告,而是打了个圆场:在发表致编辑部信函的同时,还发表了来自藤井的解释,藤井反问道:“到底要提供多少证据,才能证实我的证据可信?

”换言之,“不相信我?随你。”在此之后,藤井又先后在该杂志上发表了11篇论文。致编辑部信函的共同作者之一克里斯蒂安·阿普费尔曾赴美国食品与药物管理局提醒他们注意藤井的问题,但并没有收到回复。

或许感到他的好运要受到挑战了,在2005年前后,藤井便差不多终止了在麻醉学领域的文章发表,继而转战眼科和耳鼻喉科学。截至2011年,藤井已发表文章200多篇,在他的研究领域可算非常高产了。

2011年12月,他在《麻醉学期刊》上发表了一篇文章,这成了他所发表的最后一篇文章。随后的两年里,他在大部分研究中造假的事实露馅了。如今他雄踞个人撤稿篇数榜首,遭撤稿的文章有惊人的183篇之多,一个人就占了从1980年到2011年撤稿总篇数的7%。这个爬得高又摔得痛的故事还开启了学术出版的新纪元:诞生了用于搜寻学术造假的统计学工具,以及乐意用它们寻找造假的“学术警察”。

2009年,史蒂夫·伊恩提斯成为《麻醉》杂志的主编。他承认当时“并没有意识到问题已经很严重”。2010年,故事迎来了关键的转折。和10年前的《麻醉与镇痛》一样,《麻醉》杂志发表了一篇由多位作者署名,质疑藤井研究结果的评论,并且呼吁加强论文监管,过滤虚假结果。

这篇评论是由伊恩提斯授权发表的,后来他在“谎言、致命谎言和统计”一文中写到,这篇评论一经发出便收到了洪水般的来信,其中一位读者说“为研究者歪曲证据基础的事感到惋惜”,还督促麻醉学期刊的编辑要有所行动。这封信的作者是英国麻醉学家约翰·卡莱尔。

无独有偶,此时的麻醉学领域正处于两次大型学术不端冲击的恢复阶段。第一次冲击来自塔夫茨大学的疼痛学专家斯科特·鲁本,他在临床实验中数据作假,最终被判入狱。

紧接着在第二年,德国的高产研究者约阿希姆·博尔特被揭发篡改论文,违反学术道德,近90篇论文遭撤稿。《麻醉》发表过6篇博尔特的文章,这让伊恩提斯有些难堪,因此当他读到卡莱尔的来信时,他看到了机遇。他回信直言卡莱尔要有所行动并拿出证据,“我督促相关来信人对藤井的研究进行分析”。卡莱尔坦白他那时并未掌握统计学的专业技术,在麻醉学同行中也不算很出名。

但是他的结论却简单而又令人无法忽略——藤井的数据根本不可能从真实实验中获得。

卡莱尔将藤井从1991~2011年间168篇符合临床实验“金标准”的论文,与其他调查者文章中的数据进行对比。他对比的变量包括患者试验前的身高、血压,以及药物副作用出现的比例等。

通过这种手段,卡莱尔在2012年发表于《麻醉》杂志的文章中得出结论:在藤井的一些文章中,通过其试验得到最终研究结论的概率是10-33——一个低得可怕的数字。卡莱尔解释道:“这些数据偏离随机样本的程度足以说明它们根本不可能成为证据。”换言之:如果一件事好得难以置信,数学便会告诉你,它确实是不可信的。

卡莱尔的结论与2000年揭发藤井的观点很像,不同的是这次受到了人们关注。

在他的研究结果发表后不久,日本一项调查研究显示,藤井所发表的212篇论文中仅有3篇的数据明显可靠,有38篇无法定论是否造假,另外171篇则被认定完全伪造。调查最后总结道:“这相当于一个人坐在书桌前,写了一本关于科研点子的小说。”卡莱尔的统计分析方法不仅适用于麻醉,还还适用于人体科学研究。

他说:“这个方法可以应用于任何随机分组的研究,无论是植物、动物还是矿物研究”这对于其他学术刊物来说也“相当容易”施行。

斯坦福大学麻醉学家,时任《麻醉与镇痛》主编的史蒂文·谢弗说:“约翰·卡莱尔的基本方法已经作为一种检测研究造假的工具开始得到推广,尽管它还在不断完善中。” 谢弗、伊恩提斯以及许多人都在为此努力。谢弗表示,他们的一个目标是使这个过程自动化。

谢弗表示,在2012年,他曾经亲自使用卡莱尔的方法鉴别出一篇投给《麻醉与镇痛》的论文存在造假。谢弗退稿后,又得知它被投递给了其他期刊。他说:“同一篇论文,不同的数据!我在拒稿信中暗示了这是造假论文,论文作者看到之后又编造了新的数据。”他与编辑通知了该论文作者所在机构的负责人,对方回复:“这些人以后不会再进行研究了。”

卡莱尔的方法需要与期刊编辑合作,但许多人并不愿意参与。

有人认为有理由拒绝修订论文,论文作者们则认为他们是“围剿”的受害者。通常在允许匿名评论论文的网站上,如PubPeer.com,一篇论文出现大量批评后媒体会跟进报道,这时才会有人采取行动。例如,因发明了致癌物检测手段(埃姆斯测试)而闻名的布鲁斯•埃姆斯,在2009年与同事共同开展了一项与卡莱尔类似的分析研究。研究对象是三篇印度科学家Palaninathan Varalakshmi团队的论文。

与卡莱尔不同,在这次调查中,三位研究者对他们进行了反击——他们称埃姆斯的方法“不公平”,说它是对因果关系和相关性的混用。这一次,负责Varalakshmi论文的编辑站在了Varalakshmi这一边。在这三位科学家发表过论文的期刊中,至今仍没有一家对他们的问题论文采取行动。

遗憾的是,这才是学术造假调查的典型结果。对造假者追责困难的部分原因在于学术出版本身。

伊恩提斯说,学术出版“一直依赖于人,而不是体系;同行评审过程有其自身的优劣性,而造假鉴别不是它的强项”。出版都建立在信任之上,即使可以获取原始数据,同行评审员通常也会匆匆略过。例如《自然》杂志要求作者“进行适当的统计检验,尤其需要说明数据是否符合统计检验的假设”。

PLOS杂志的执行编辑韦罗妮克•基尔默认为,编辑“会将作者自证的过程作为评审的一部分,但不会系统地检查论文涉及的全部深层数据的统计学分布。”同行评审同样也不要求检查全部数据统计。

2014年,《自然》出现了一起令人心痛的干细胞论文撤稿事件(小保方晴子STAP细胞论文造假事件),小保方晴子的导师笹井芳树随后自杀。但杂志依旧认为:“我们和评审者不能发现论文背后的致命问题。

”《自然》在另一篇评论中提到,抓得太严会造成真的问题,期刊“仅仅宣布撤稿可能就会受到起诉的威胁,更别说在撤稿声明中提到学术不端了。”《自然》或许乐于于将繁重的监管工作留给学术机构,但伊恩提斯已吸取教训。尽管2010年由他授权发表的评论引起了读者对藤井善隆论文造假问题的关注,但他却无视了评论信息。直到看到一堆信件,包括卡莱尔的信,他才行动起来。因此,直到2012年才刊出了那篇决定性的分析报告。

伊恩提斯说:“如果现在评论中出现这样的指控,我不会再放任不管。”

UUID: 57e54d86-187d-49c7-b48e-d2374b02475b

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/环球科学公众号-pdf2txt/2018/2018-09-19_科学界的造假之王:写了200多篇论文,183篇遭撤稿.txt

是否为广告: 否

处理费用: 0.0071 元