arXiv 重塑了科学的大门——将门推得更开——但总有人要被困在门外。
arXiv 上有大量的论文预印本,它们是尚未经过同行评议的论文草稿,或是不打算发表在期刊上的文章。当论文在发表后也能以修订版的形式出现在 arXiv 上。截至 2019 年 10 月,网站上的预印本数量超过 160 万篇,主要集中在硬科学方向:数学、计算机科学、定量生物学、计量金融学、统计学,以及最主要的,物理学。
arXiv 之父物理学家 Paul Ginsparg 于 1991 年创建了 arXiv,当时他只希望收录约 100 篇科研论文。然而随着投稿如洪水般涌来,他只好求助于计算机程序,对文章进行半自动化处理。为了学习编程,他参加了十几场机器学习研讨会。Ginsparg 现在是康奈尔大学物理学与信息科学教授。
arXiv 是 30 多年前的科学家梦寐以求的文库:全库检索、随时随地都可访问、免费发表和阅读、包含几乎所有经典论文。在今天这个我们可以一边在星巴克排队,一边在维基百科上查阅原子理论发展史的科技黄金时代,arXiv 的出现或许会显得稀松平常,然而事实上,这是一场不折不扣的革命。
诚然,arXiv 使学术界受益良多,但鲜为人知的是,它必须回答一个适用于所有学科的棘手哲学问题:哪些文章值得读?
什么是科学?arXiv 出现之前,预印本只在小型学术圈中通过人工或者邮件分发。论文得过上几个月才能正式发表在学术期刊上,而这些期刊只能在大学图书馆找到。arXiv 使这个“竞技场”民主化:无论是顶尖大学德高望重的教授、不知名机构日夜奔忙的博士后,还是发展中国家缺乏资助的学者,你的新想法都可以被其他研究者立即看到。
Paul Ginsparg 于 1991 年创建了 arXiv,那年他 35 岁,是洛斯阿拉莫斯的物理学家。他起初只是想把大约 100 篇论文分享给几百位电子邮件订阅者。但到 1992 年夏天,他收到了 1200 多篇论文投稿,可谓喜忧参半!Ginsparg 并不打算仔细审阅所有论文,但他希望每位读者都能找到最感兴趣的文章。
所以他开始将这些论文分门别类,并且召集到越来越多的审稿人,他们都是为学术界服务的志愿者。
这些是科学吗?arXiv 的宗旨是收录的论文应该“让研究人员感兴趣、与学科相关并且有价值”。随着网站规模和知名度越来越大,arXiv 开始吸引学术圈外的文章,但是这些文章大多不满足要求。它们压根就不是科学,连伪科学也算不上(伪科学尚可被检验并驳倒)——它们高调地宣称推翻了爱因斯坦、牛顿和霍金的理论,发现了物理和超能力、UFO 之间隐蔽的关联,而文章中几乎没有数学推理和实验依据。
arXiv 的默认立场是接收所有文章。Ginsparg 表示,论文也遵循无罪推定原则。但是浏览这些不科学的论文会浪费研究人员的时间。另外,arXiv 的读者中有越来越多的记者和政策制定者,真假论文“共处一室”会引起他们的困惑。因此,审稿人必须对每篇文章做出判断:这些是科学吗?
大多数 arXiv 用户对审稿人的判断感到满意,但也有人抱怨论文被扔在一旁,特别是处在学术边缘的一些研究人员会控诉 arXiv 的审稿人忽视非主流想法。arXiv 审稿人面对的不是个新问题。早在 1959 年,科学哲学家 Thomas Kuhn 就把这个问题概括为“必要的张力”:传统学术界限和自由研究之间的冲突。Kuhn 认为,科学要想前进,两者缺一不可。
但如果新颖的想法常在不同学科的夹缝中产生,无法归类的靠谱论文又是否会被误判为假论文?
arXiv 的审稿人可没那么多时间进行 Kuhn 式的反思。很多读者每天都刷 arXiv,网站希望他们总能看到最新的文章。所以 arXiv 从一开始就强制实行“24 小时更新”原则:每个工作日下午 4 点(美国东部时间,相当于北京时间第二天早上 5 点)前收到的论文一般在当晚 8 点(北京时间第二天上午 9 点)上线。审稿人得在不到一天的时间内决定每篇文章的命运:拒绝还是有待进一步审查。
Ginsparg 注意到了这种忙碌的日常工作,他想到可以利用计算机程序协助处理大量投稿,让志愿者轻松些。真科学确实会被误判 Ginsparg 最初的目的很简单:设计一种算法,将论文按学科分类,为审稿人省去浏览误投稿件的麻烦——有些稿件会在提交时被错误分类。几个小时后,新程序就诞生了,它能接收一篇新文章,提取关键词,统计每个词出现的次数,通过“学习”过去人工的分类方式对新论文进行分类。
Ginsparg 没有预先设置关键词表,而是通过算法做出最佳选择。因为审稿人会对每个分类进行检查,算法能够得到即时回馈,并且逐步完善,实现每天对几百篇投稿逐篇处理。
然而他没有想到,这种分类方法有个神奇的“附加属性”:它能区分出“好”论文和“坏”论文!arXiv 意外地将“必要的张力”付诸了实践,它是如何做到的?审查了成千上万篇文章之后,分类算法掌握了真科学的信号:语言。
通过学习科学语言,程序可以用与审稿人类似的方式对文章进行判断。被拒绝的论文不符合科学语言规范:偏离可能非常明显,例如把不同学科的内容胡乱拼凑在一起;也可能不易察觉,像“or”、“it”和“that”之类无意义词的错误分布。
学术编辑、审稿人和科研人员在判断论文好坏时早已关注到了语言问题。
卡迪夫大学的科学社会学家 Luis Reyes-Galindo 表示,arXiv 反映了学术界的特性,将学界内外区分开来。伪科学也有其特定的语言风格。加州大学河滨分校的数学物理学家 John Baez 设计了“民科指标”,将文章按 37 个“民科特征”进行打分:全部大写的单词每个给 5 分,宣称工作“处在‘范式转移’最前沿”给 10 分,宣称有个“革命性理论但没给出具体的可检验预言”给 50 分。
当然,最后一项和语言关系不大。无罪推定。arXiv 的创建者 Paul Ginsparg 对大量涌入的文章采取这种态度。截图显示 2016 年 10 月,仅天体物理方向 arXiv 就接收了 1058 篇论文。而每年只有不到 1% 的文章因为伪科学被拒。语言能够分辨论文好坏是有原因的。
受过正式科学训练(包括 4 年大学,更长时间的研究生和博士后)的作者不仅掌握了一些基本事实、思考和实验的方法,还学会了特定的交流方式。“成为科学家的关键在于科学语言:知道如何表达、演讲。” Reyes-Galindo 说道。
arXiv 不会自动拒绝被算法判为“异常”的文章:它们被做上标记,等待进一步的人工审查。作为人类智慧成果的承载者,科学应当由内容而非风格进行衡量,所以有人争论说,通过词汇识别外行并将他们拒之门外的做法不够稳妥。举例来讲,成绩蜚然的交叉学科研究人员怎么办?“早在互联网出现之前,我们就看到过奇怪的非主流工作。”麻省理工物理学家 David Kaiser 说,“但它们中的一些的确是沙子里的黄金。”
现在很多习以为常的物理定律在当时看来简直不可思议:日心说、场能够传递相互作用、数学公式描述的物理定律等等。现代量子理论中有些不可或缺的研究在上世纪 70 年代根本不受待见:晦涩难懂,像是磕药后的胡言乱语。Kaiser 在 2011 年出版的新书《嬉皮士如何拯救了物理学》中写道:“很多现在占据量子信息科学核心地位的想法诞生于反主流文化运动。
这个运动中还有汤匙弯折心灵感应、东方神秘主义、LSD 致幻之旅、中情局灵魂追梦、‘水瓶时代’狂热等稀奇古怪的‘探索’。”
为量子计算、量子加密和量子隐形传输奠定基础的物理学家采用的方法并不时髦,并且处于学术边缘,但时间证明了它们的价值。“我很怀疑早期那些丰富多彩的想法能否被 arXiv 接收。” Kaiser 说道。现在也一样,靠谱(至少不是离经叛道)的想法确实偶尔会被 arXiv 误判。
“在我熟知的领域内就有三个例子:专业的物理学家,包括声誉良好的教授的论文被拒之门外或标记审查。” 圆周理论物理研究所的物理学家 Lee Smolin 说。
审稿人的判断很多据理力争才使论文出现在 arXiv 上的研究人员不愿谈起伤心往事,他们担心被拉入黑名单。日内瓦大学的资深物理学家 Nicolas Gisin 却是个例外,他在 2015 年 12 月公开为两位学生申冤。
他们向 arXiv 提交了一篇关于黑洞的文章,结论不同寻常:物质不可能掉进黑洞。同时,这两名作者并不属于黑洞研究的学者圈。但是 Gisin 觉得他们的计算非常清楚,逻辑也很清晰。“我很欣赏他们的勇气,敢于逾越物理学不同研究方向间的壁垒。” 他在维也纳量子光学和量子信息研究所的博客上写道。
苦等几个月后——在 arXiv 快速更新的世界里这简直就是永恒——论文被拒了。
系统标记了论文,随后审稿人把文章毙掉。这两名学生的第二篇论文同样被拒,但这回快多了,Gisin 认为他们上了黑名单。Ginsparg 否认 arXiv 有黑名单。他并未参与 Gisin 学生的文章审查,但在读过他们的文章后,他觉得里面存在基本错误。发表于 EMBO 期刊上的一篇关于 arXiv 的文章中,Ginsparg 提到了这件事,他表示,arXiv 的审稿人为鲁莽的研究生避免了不必要的尴尬。
Ginsparg 解释道,arXiv 的自动筛选系统可能标记曾经投稿被拒的用户,也会拒绝用别名再次提交的被拒论文。arXiv 还为用户提供申诉流程:作者可以要求被拒文章由原先的审稿人重审,如果再次被拒,作者还可以要求由仲裁审稿人进行第三轮审查。如果被拒论文随后被同行评议的期刊接收,arXiv 也会重新接收这篇论文。
但是 Gisin 的学生没有申诉,论文最终被 Physics Letters A 接收后也没再放到 arXiv 上。
尽管偶尔引起争议,arXiv 的标准还是相当宽容的。Ginsparg 表示,去年只有不到 1% 的投稿由于内容问题被拒,而且很多像 Gisin 一样的批评者仍然是网站的忠实用户。但是 arXiv 的处理程序仍然不够透明。“arXiv 对投稿者的人身保护不够。” Kaiser 说道。
审稿人拒绝论文时只会按照 arXiv 的标准模板发送拒信,没有更多具体的解释。“被拒后的申诉过程也令人失望,”Smolin 说道,“根据我所了解的几个例子,他们的申诉流程不够完善,也没有遵循最专业的做法,这与 arXiv 在物理界的重要地位并不相称。”
在接收和拒绝之间,还存在一个中间选项:存疑论文被归类到“general physics”(“gen-ph”)中。
说得好听点,gen-ph 收容了无法与其他类别完全匹配的论文;说得难听点,这就是个垃圾场。总之,审稿人可以借此躲避拒稿带来的纠纷。但是对于很多作者而言,被发配到 gen-ph 和被直接拒绝一样让人难堪。有个研究人员告诉 Reyes-Galindo,把他的论文分类到 gen-ph 中就像是在故意降低文章的影响力。
不过 gen-ph 只占 arXiv 的一小部分:从 2014 年 7 月到 2015 年 6 月,arXiv 接收了超过 10 万篇论文,其中只有 302 篇被发配到 gen-ph。
对于 arXiv 的失望催生了另一个预印本网站:viXra。这个新网站由英格兰独立物理学家 Philip Gibbs 创建。每个人都可以在 viXra 上贴东西,但是网站禁止“粗俗、诽谤、抄袭和危险导向”的内容。
有些人能在这里找到论文的容身之所,对他们而言,viXra 是知识的避难所。但在学术界的很多人眼里,viXra 更像错位玩具岛:古怪和破旧玩具的流放地。(对于 viXra,Ginsparg 讥讽道:“这个网站太棒了!下一回再有人问为什么 arXiv 需要筛选机制时,我们就向他们推荐 viXra。”)
Gibbs 在 viXra 的博客上发表了包含 17 部分的回顾文章“正确的民科”,他认为 viXra 作为历史档案,保留了走在时代之前的想法的雏形,也许这些想法能在将来得到承认。何谓科学?大家往往认为这是互联网带来的新问题。但 Kaiser 认为 arXiv 正在试图解决的是古老问题——“必要的张力”的放大版。长久以来,学者总是抱怨:需要一种工具来帮助人们规范出值得关注的科学范围。
arXiv 重塑了科学的大门——将门推得更开——但总有人要被困在门外。