同⾏评议，是科学进步的最⼤障碍吗？

在过去⼤约60年⾥，科学⾃身在开展⼀项实验。实验设计不怎么样，既没有随机化，也没有对照组。确切地说，没有⼈负责这个实验，实际上也没有⼈进⾏持续测量。然⽽，这是史上规模最⼤的实验，纳⼊了地球上每⼀位科学家。⼤多数⼈甚⾄没有意识到他们身处实验之中，包括我在内的许多⼈在实验开始时尚未出⽣。如果我们曾经注意到会发⽣什么，也许我们会要求做到最基本的科学严谨。

也许⽆⼈反对过这项实验，因为它的假设似乎显然是真的：如果我们找⼈检查每⼀篇论⽂，拒绝发表那些未通过评审的，那么科学就能变得更好。⼈们称之为“同⾏评议”。

这是⼀场规模宏⼤的变⾰。从古⾄今，科学家写信、传播专著，阻⽌他们交流科学发现的主要因素是纸张、邮资或印刷成本，或者在极少数的情况下，是接待天主教会来访的费⽤。

科学期刊出现于17世纪，但当时它们更像是杂志或简报，挑选⽂章的机制也各不相同，从“我们收到什么就印什么”，到“编辑询问他的朋友怎么想的”，再到“全学会投票”。有时，期刊⽆法得到⾜够的⽂章发表，所以编辑需要四处恳求朋友投稿，或者亲⾃上阵。科学发表的⼤杂烩状况维持了数个世纪。

⼆战之后，⼀切都变了。政府投⼊资⾦⽤于研究，同时召集了“同⾏审稿⼈”，以确保他们没有把钱浪费在愚蠢的提案上。

这些资⾦变成了⼤量的论⽂，曾经苦苦挣扎着填满版⾯的期刊如今难以抉择要发表哪些⽂章。在20世纪60年代前，发表论⽂前进⾏评审“⼗分罕⻅”，如今这种现象越来越普遍，最后⻛⾏全球。现在，⼏乎每家期刊都会邀请外部专家来评审论⽂，不讨审稿⼈欢⼼的论⽂会被拒稿。你仍然可以把你的发现写信告诉朋友，但以招聘委员会和资助机构的所作所为看来，仿佛科学仅仅存在于同⾏评审期刊上的论⽂中。这就是我们运⾏了六⼗年的⼤型实验。

同⾏评议失败了。海量资⾦的浪费，同⾏评议是⼀项巨⼤的、昂贵的⼲预⾏动。据估计，科学家群体每年花在评审论⽂上的时间达15000年（每个审稿⼈所⽤时间的总和）。⼀篇论⽂需要花费数⽉或数年才能通过评审系统，当⼈们试图做⼀些诸如治愈癌症、阻⽌⽓候变化之类的事情时，这⽆疑会耽误许多时间。

同时，⼤学要⽀付数百万美元来获得同⾏评议期刊的访问权限，即使⼤多数研究都是纳税⼈资助的，⽽且这些钱⼀分也没有流向作者或审稿⼈。

同⾏评议并没有改善科学。⼏⼗年来，在所有不同的领域，研究⽣产⼒⼀直趋于停滞，甚⾄在⾛下坡路，⽽同⾏评议似乎没有改变这⼀趋势。新的想法没能取代旧的想法。许多经过同⾏评议的发现未能被重复，它们中的⼤多数可能根本就是错误的。

当你让科学家们评价20世纪获得物理学、医学和化学诺⻉尔奖的发现时，他们会说，在同⾏评议前发表的发现和那些在同⾏评议后发表的⼀样好，甚⾄要更好。然⽽事实上，因为从20世纪90年代到21世纪初做出的诺⻉尔奖发现数量太少，你甚⾄没法要求他们对这些发现进⾏评价。

同⾏评议是否做了它应该做的？它是否揪出了差研究，阻⽌它们发表？它没有。

科学家已经做过这样的研究，他们故意在论⽂中添加错误，投递给审稿⼈，统计审稿⼈会揪出多少错误。审稿⼈表现很糟糕。在⼀项研究中，审稿⼈找出了30%的主要缺陷；另⼀项研究中是25%；第三项研究的结论是29%。这些错误都是关键问题，例如“该论⽂声称使⽤了随机化对照试验但实际上没有”，“当你看图表时，很明显没有效应”，以及“作者得出了完全不被数据⽀持的结论”。⼤多数审稿⼈都没有注意到。

同⾏评议的发明甚⾄⿎励了糟糕的研究。如果你试图发表论⽂表明，观看⼩狗视频能让⼈们向慈善机构捐更多的钱，然后2号审稿⼈说“如果这项研究也适⽤于⼩猫视频，我会感到印象深刻”，这时候你就受到了极⼤的压⼒，要证明⼩猫视频也能起作⽤。你可能会篡改数字，或者删掉⼀些极端数据，或者测试⼀系列⼩猫视频，直到筛出⼀个有⽤的，然后闭⼝不提那些没⽤的。

同⾏评议，我们⼏乎都没把你当回事。我们还有另⼀种⽅式来检验同⾏评议是否有效：它真的赢得了科学家们的信任吗？科学家常常说他们⾮常认真地看待同⾏评议。但是，⼈们会说很多⾔不由衷的话，⽐如“很⾼兴认识你”，“亚当，我永远不会离开你”。如果你看看科学家们实际上所做的事情，很明显，他们并⾮发⾃内⼼地重视同⾏评议。

我们能够修复它吗？不，我们做不到。我曾设想种种能够改善同⾏评议的⽅法。审稿⼈应该看数据！

期刊应该确保论⽂都没有造假！想象事情会变好很容易，我的朋友伊桑（Ethan）和我关于此写过⼀篇论⽂，但是让事情变好就没那么容易了。我对于同⾏评议的怨⾔就像是，看着每年美国有⼤约35000⼈死于⻋祸，然后说：“⼈们不应该总是出⻋祸。”这话没错，但怎么做呢？问题并不在于不够努⼒：请记住，我们现在的系统需要每年总和15000年的⼈⼒付出，但它依然很糟糕。

同⾏评议⽐什么都没有还糟糕；或者，情况已经很尴尬了。同⾏评议不奏效，可能也⽆法修复。但有⼀点点审查总⽐没有好，对吧？我会说：不可能。想象⼀下，你发现⻝品药品监督管理局（FDA）“检查”⽜⾁的⽅法是派⼀个⼈（就叫他加⾥吧）去闻⽜⾁的味道，并判断⽜⾁的味道对不对劲，通过了嗅觉测试的⽜⾁会获得⼀张“经FDA检查”的标签。你会⾮常愤怒。没错，加⾥可能会找到⼏批坏的⽜⾁，但显然他会遗漏⼤多数有问题的⾁。

这种极其糟糕的系统⽐没有还差劲，因为它欺骗⼈们，让他们以为⾃⼰是安全的，⽽实际上并不是。

科学必须⾃由。为什么同⾏评议⼀开始看起来如此合理？我认为我们错误地理解了科学运作的⽅式。我们以为科学是⼀个弱连接问题，即进步取决于我们最差的研究的质量。如果你相信弱连接科学，那么你会认为让错误的观点出局是⾮常重要的，最好⼀开始就阻⽌它们发表。你不介意在过程中是否掩埋了少数好的想法，因为埋葬坏想法太重要了。

但科学是⼀个强连接问题：进步取决于我们最好的研究的质量。更好的想法并不总是会⽴刻成功，但它们终将成功，因为它们更有⽤。你不能⽤亚⾥⼠多德的物理学登陆⽉球，你不能⽤⾃然发⽣说把泥巴变成⻘蛙，你也不能⽤燃素制造炸弹。⽜顿的物理学定律依然存在，但他的炼⾦术配⽅不在了。

好耶，我们失败了。没有⼈负责我们的同⾏评议实验，这意味着没有⼈有责任提出结束时间。

既然没有其他⼈了，那么我猜我会这么做：各位，我们结束了！⼤家举起⾹槟！⼲得漂亮，恭喜。我们尝试了同⾏评议，它不奏效。坦⽩说，我松了⼀⼝⽓，这个系统糟透了！等待数⽉，只为听到编辑认为你的论⽂不值得被审稿？阅读来⾃审稿⼈的⻓篇⼤论，⽽他们出于某些原因，把你的论⽂视为宇宙万恶之源？花上⼀整天向期刊发邮件，乞求他们让你⽤“years（年）”，⽽⾮毫⽆理由地总是缩写成“y”（我真碰到过这事）？

我们再也不⽤做任何这样的事情了。

我们现在应该做什么？上个⽉我发表了⼀篇论⽂，我是说我向互联⽹上传了⼀个PDF⽂件。我⽤平常的语⾔写作，所以任何⼈都能理解。我没有隐瞒任何东⻄，我甚⾄承认我忘记了为什么要开展⼀项研究。我在⾥⾯写了笑话，因为没⼈能阻⽌我。我上传了所有的材料、数据和代码，每个⼈都能看到。我想我看起来像个傻⽠，没有⼈会注意到我，但⾄少我很开⼼，并且做了我认为正确的事情。

接下来，我没有告诉任何⼈关于这篇论⽂的信息，就有数以千计的⼈发现了它，给它留⾔评论，在推特上转发。完全陌⽣的⼈给我发邮件，给出经过思考的评论。终身教授们发给我他们的想法。NPR邀请我进⾏访谈。现在，⽐起我上⼀篇发表在权威期刊PNAS上的同⾏评议论⽂，这篇论⽂拥有更⾼的阅读量。同时，我预感更多的⼈会把这篇新论⽂从头读到尾，因为最后⼏段得到了许多评论。所以，我不确定，这⼤概是⼀个发表论⽂的好办法？

我不知道科学的未来会怎么样，也许我们会在元宇宙中创作交互式论⽂，或者把数据集下载到我们的⼤脑中，⼜或者在科技狂欢的舞池中低声⽿语，交流我们的发现。⽆论如何，这都要⽐过去六⼗年我们所做的要好得多。为了实现这⼀天，我们所能做的⼀切就是我们最擅⻓的事情——实验。