同⾏评议,是科学进步的最⼤障碍吗?

作者: Atom Mastroianni

来源: 神经现实

发布日期: 2023-08-28 23:12:49

同⾏评议在过去60年⾥被视为科学进步的关键,但实际效果并不理想。它不仅浪费了⼤量资源和时间,还未能有效提升科学研究的质量。同⾏评议的机制存在诸多问题,如审稿⼈未能有效识别论⽂中的错误,甚⾄⿎励了不严谨的研究。科学家们对同⾏评议的信任度低,实际操作中并不重视其反馈。尽管有⼈尝试改善同⾏评议,但效果甚微。同⾏评议的失败表明,科学需要更⾃由的发表机制,以促进创新和进步。

在过去⼤约60年⾥,科学⾃身在开展⼀项实验。实验设计不怎么样,既没有随机化,也没有对照组。确切地说,没有⼈负责这个实验,实际上也没有⼈进⾏持续测量。然⽽,这是史上规模最⼤的实验,纳⼊了地球上每⼀位科学家。⼤多数⼈甚⾄没有意识到他们身处实验之中,包括我在内的许多⼈在实验开始时尚未出⽣。如果我们曾经注意到会发⽣什么,也许我们会要求做到最基本的科学严谨。

也许⽆⼈反对过这项实验,因为它的假设似乎显然是真的:如果我们找⼈检查每⼀篇论⽂,拒绝发表那些未通过评审的,那么科学就能变得更好。⼈们称之为“同⾏评议”。

这是⼀场规模宏⼤的变⾰。从古⾄今,科学家写信、传播专著,阻⽌他们交流科学发现的主要因素是纸张、邮资或印刷成本,或者在极少数的情况下,是接待天主教会来访的费⽤。

科学期刊出现于17世纪,但当时它们更像是杂志或简报,挑选⽂章的机制也各不相同,从“我们收到什么就印什么”,到“编辑询问他的朋友怎么想的”,再到“全学会投票”。有时,期刊⽆法得到⾜够的⽂章发表,所以编辑需要四处恳求朋友投稿,或者亲⾃上阵。科学发表的⼤杂烩状况维持了数个世纪。

⼆战之后,⼀切都变了。政府投⼊资⾦⽤于研究,同时召集了“同⾏审稿⼈”,以确保他们没有把钱浪费在愚蠢的提案上。

这些资⾦变成了⼤量的论⽂,曾经苦苦挣扎着填满版⾯的期刊如今难以抉择要发表哪些⽂章。在20世纪60年代前,发表论⽂前进⾏评审“⼗分罕⻅”,如今这种现象越来越普遍,最后⻛⾏全球。现在,⼏乎每家期刊都会邀请外部专家来评审论⽂,不讨审稿⼈欢⼼的论⽂会被拒稿。你仍然可以把你的发现写信告诉朋友,但以招聘委员会和资助机构的所作所为看来,仿佛科学仅仅存在于同⾏评审期刊上的论⽂中。这就是我们运⾏了六⼗年的⼤型实验。

同⾏评议失败了。海量资⾦的浪费,同⾏评议是⼀项巨⼤的、昂贵的⼲预⾏动。据估计,科学家群体每年花在评审论⽂上的时间达15000年(每个审稿⼈所⽤时间的总和)。⼀篇论⽂需要花费数⽉或数年才能通过评审系统,当⼈们试图做⼀些诸如治愈癌症、阻⽌⽓候变化之类的事情时,这⽆疑会耽误许多时间。

同时,⼤学要⽀付数百万美元来获得同⾏评议期刊的访问权限,即使⼤多数研究都是纳税⼈资助的,⽽且这些钱⼀分也没有流向作者或审稿⼈。

同⾏评议并没有改善科学。⼏⼗年来,在所有不同的领域,研究⽣产⼒⼀直趋于停滞,甚⾄在⾛下坡路,⽽同⾏评议似乎没有改变这⼀趋势。新的想法没能取代旧的想法。许多经过同⾏评议的发现未能被重复,它们中的⼤多数可能根本就是错误的。

当你让科学家们评价20世纪获得物理学、医学和化学诺⻉尔奖的发现时,他们会说,在同⾏评议前发表的发现和那些在同⾏评议后发表的⼀样好,甚⾄要更好。然⽽事实上,因为从20世纪90年代到21世纪初做出的诺⻉尔奖发现数量太少,你甚⾄没法要求他们对这些发现进⾏评价。

同⾏评议是否做了它应该做的?它是否揪出了差研究,阻⽌它们发表?它没有。

科学家已经做过这样的研究,他们故意在论⽂中添加错误,投递给审稿⼈,统计审稿⼈会揪出多少错误。审稿⼈表现很糟糕。在⼀项研究中,审稿⼈找出了30%的主要缺陷;另⼀项研究中是25%;第三项研究的结论是29%。这些错误都是关键问题,例如“该论⽂声称使⽤了随机化对照试验但实际上没有”,“当你看图表时,很明显没有效应”,以及“作者得出了完全不被数据⽀持的结论”。⼤多数审稿⼈都没有注意到。

同⾏评议的发明甚⾄⿎励了糟糕的研究。如果你试图发表论⽂表明,观看⼩狗视频能让⼈们向慈善机构捐更多的钱,然后2号审稿⼈说“如果这项研究也适⽤于⼩猫视频,我会感到印象深刻”,这时候你就受到了极⼤的压⼒,要证明⼩猫视频也能起作⽤。你可能会篡改数字,或者删掉⼀些极端数据,或者测试⼀系列⼩猫视频,直到筛出⼀个有⽤的,然后闭⼝不提那些没⽤的。

同⾏评议,我们⼏乎都没把你当回事。我们还有另⼀种⽅式来检验同⾏评议是否有效:它真的赢得了科学家们的信任吗?科学家常常说他们⾮常认真地看待同⾏评议。但是,⼈们会说很多⾔不由衷的话,⽐如“很⾼兴认识你”,“亚当,我永远不会离开你”。如果你看看科学家们实际上所做的事情,很明显,他们并⾮发⾃内⼼地重视同⾏评议。

我们能够修复它吗?不,我们做不到。我曾设想种种能够改善同⾏评议的⽅法。审稿⼈应该看数据!

期刊应该确保论⽂都没有造假!想象事情会变好很容易,我的朋友伊桑(Ethan)和我关于此写过⼀篇论⽂,但是让事情变好就没那么容易了。我对于同⾏评议的怨⾔就像是,看着每年美国有⼤约35000⼈死于⻋祸,然后说:“⼈们不应该总是出⻋祸。”这话没错,但怎么做呢?问题并不在于不够努⼒:请记住,我们现在的系统需要每年总和15000年的⼈⼒付出,但它依然很糟糕。

同⾏评议⽐什么都没有还糟糕;或者,情况已经很尴尬了。同⾏评议不奏效,可能也⽆法修复。但有⼀点点审查总⽐没有好,对吧?我会说:不可能。想象⼀下,你发现⻝品药品监督管理局(FDA)“检查”⽜⾁的⽅法是派⼀个⼈(就叫他加⾥吧)去闻⽜⾁的味道,并判断⽜⾁的味道对不对劲,通过了嗅觉测试的⽜⾁会获得⼀张“经FDA检查”的标签。你会⾮常愤怒。没错,加⾥可能会找到⼏批坏的⽜⾁,但显然他会遗漏⼤多数有问题的⾁。

这种极其糟糕的系统⽐没有还差劲,因为它欺骗⼈们,让他们以为⾃⼰是安全的,⽽实际上并不是。

科学必须⾃由。为什么同⾏评议⼀开始看起来如此合理?我认为我们错误地理解了科学运作的⽅式。我们以为科学是⼀个弱连接问题,即进步取决于我们最差的研究的质量。如果你相信弱连接科学,那么你会认为让错误的观点出局是⾮常重要的,最好⼀开始就阻⽌它们发表。你不介意在过程中是否掩埋了少数好的想法,因为埋葬坏想法太重要了。

但科学是⼀个强连接问题:进步取决于我们最好的研究的质量。更好的想法并不总是会⽴刻成功,但它们终将成功,因为它们更有⽤。你不能⽤亚⾥⼠多德的物理学登陆⽉球,你不能⽤⾃然发⽣说把泥巴变成⻘蛙,你也不能⽤燃素制造炸弹。⽜顿的物理学定律依然存在,但他的炼⾦术配⽅不在了。

好耶,我们失败了。没有⼈负责我们的同⾏评议实验,这意味着没有⼈有责任提出结束时间。

既然没有其他⼈了,那么我猜我会这么做:各位,我们结束了!⼤家举起⾹槟!⼲得漂亮,恭喜。我们尝试了同⾏评议,它不奏效。坦⽩说,我松了⼀⼝⽓,这个系统糟透了!等待数⽉,只为听到编辑认为你的论⽂不值得被审稿?阅读来⾃审稿⼈的⻓篇⼤论,⽽他们出于某些原因,把你的论⽂视为宇宙万恶之源?花上⼀整天向期刊发邮件,乞求他们让你⽤“years(年)”,⽽⾮毫⽆理由地总是缩写成“y”(我真碰到过这事)?

我们再也不⽤做任何这样的事情了。

我们现在应该做什么?上个⽉我发表了⼀篇论⽂,我是说我向互联⽹上传了⼀个PDF⽂件。我⽤平常的语⾔写作,所以任何⼈都能理解。我没有隐瞒任何东⻄,我甚⾄承认我忘记了为什么要开展⼀项研究。我在⾥⾯写了笑话,因为没⼈能阻⽌我。我上传了所有的材料、数据和代码,每个⼈都能看到。我想我看起来像个傻⽠,没有⼈会注意到我,但⾄少我很开⼼,并且做了我认为正确的事情。

接下来,我没有告诉任何⼈关于这篇论⽂的信息,就有数以千计的⼈发现了它,给它留⾔评论,在推特上转发。完全陌⽣的⼈给我发邮件,给出经过思考的评论。终身教授们发给我他们的想法。NPR邀请我进⾏访谈。现在,⽐起我上⼀篇发表在权威期刊PNAS上的同⾏评议论⽂,这篇论⽂拥有更⾼的阅读量。同时,我预感更多的⼈会把这篇新论⽂从头读到尾,因为最后⼏段得到了许多评论。所以,我不确定,这⼤概是⼀个发表论⽂的好办法?

我不知道科学的未来会怎么样,也许我们会在元宇宙中创作交互式论⽂,或者把数据集下载到我们的⼤脑中,⼜或者在科技狂欢的舞池中低声⽿语,交流我们的发现。⽆论如何,这都要⽐过去六⼗年我们所做的要好得多。为了实现这⼀天,我们所能做的⼀切就是我们最擅⻓的事情——实验。

UUID: 16ad0ef0-05c6-48bf-9c81-ffe72fd46d80

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/环球科学公众号-pdf2txt/2023/环球科学_2023-08-28「转」_同行评议,是科学进步的最大障碍吗?.txt

是否为广告: 否

处理费用: 0.0139 元