“不发文就没门”(Publish or perish)是学术研究圈子里流行的一句话。学术论文不仅是科学发展的重要一环,也是如今全世界的学者们要面对的“绩效”指标——发表论文的多少,成了大家关心的话题。不过新的研究表明,论文发表得多并不一定是好事,甚至可能阻碍科学的发展。
在我们的普遍印象里,学术论文往往代表着科学的发展和进步,因此人们可能会产生一种直观的想法:“多即是好”——一个科学领域发表的论文越多,这个领域的进步就越快。
与这一观念相应,科学家似乎也在越来越努力地发表论文:从1800年至21世纪初,全世界每年产出的论文数量呈指数级增长;而美国自然科学基金会(NSF)的报告显示,2008-2018年,若以同行评议的科学和工程类期刊论文和会议论文的发表量计,全世界的科研产出以平均每年约3.8%的速度增长,2018年时“产量”已超过250万篇。
尽管研究者发表成果的迅猛势头有增无减,但真正具有开创性的科学进展却凤毛麟角。在这种怪象之下,不少学者也在思考一个问题:论文发表得越多,科学的发展就越快吗?近日,发表在《美国科学院院刊》(PNAS)上的一项研究,给出了否定的回答。
论文越多,新观点越难出头。这篇文章的两位作者,一位来自美国西北大学凯洛格管理学院,另一位来自美国芝加哥大学社会学系,同时还是该校知识实验室的主任。
他们从Web of Science数据库中,获取了1960-2014年间的文献数据集,共包括超过9000万篇文献和超过18亿条引用记录,而这些文献又可以分为241个学科(领域)。利用这些数据,他们对各个领域的论文被引用的情况进行了分析,并以此评估论文产生的学术影响力。
被引量最高的那些论文获得的引用占比远高于这些论文的数量占比,即少数论文获得了大量引用,导致了这一不平等的状况。
以电气和电子工程领域为例:当每年发表的论文约为1万篇时,被引量排名前0.1%的论文获得了这个领域全部引用量的1.5%,而后50%的论文则能获得43.7%;但随着发文量增加,“强者愈强、弱者愈弱”的马太效应愈发明显;当每年发表的论文达到10万篇时,前0.1%的论文能获得5.7%的引用量,而后50%的论文则只得到了略高于20%的引用量。
更糟糕的是,论文的引用似乎还存在“阶级固化”的现象。一个领域的年发文量越多,前后两年的高被引论文排名相关性就越强,这些论文被引量的衰竭率也越低。换句话说,前一年被大量引用的论文,下一年更可能仍然被大量引用,而且它们的“热度”几乎不会随着时间流逝而下降。这同时也表明,新发表的论文很难挤进前列。
新研究被迫“内卷”。这项研究的另一项有趣发现是,随着一个领域新发表的论文增加,发展、完善已有观点、理论的论文比例也会越来越高,而那些打破常规、提出创新观点的“搅局”论文的比例则会下降——仅从这个角度来看,新研究变得更倾向于在人们已经熟知的框架内深耕,呈现出“内卷”的激烈竞争态势。这也进一步导致新发表的论文很难撼动已有的观点。
对于上述的这些现象,作者提到的两种机制或许可以给出一定解释。首先,如果领域内短时间内有大量论文发表,由于认知系统“过载”,学者在阅读文献时更容易接受那些和已有知识更相关的观点——毕竟,科学家也是人。其次,如果新观点频繁出现,新观点之间的竞争也会导致很难有一种观点成为主流。
难解的困局。对于这样的结果,新研究的作者也表达了忧虑:在那些体量庞大的领域,大量新论文的涌现,会让评审人和其他读者无暇仔细研读文章、领会创新的学术观点、甄别真正有价值的创新成果,从而阻碍领域的更新和进步。尽管学者自己也意识到了论文太多可能并无裨益,但种种现实的因素却让这种困局难以破解。
好在,尽管被引量最高的论文总是那些“常客”,但科学还是在进步。比如,分子生物学领域被引量最高的论文发表于1976年,提出了大名鼎鼎的测定蛋白质浓度的“考马斯亮蓝法”,这一方法至今仍被广泛应用。从1982年至今,这篇论文每一年都雄踞被引量榜首,如今它的被引量已经超过20万次,但并没有阻碍近几十年来分子生物学领域的飞速发展。