【NeurIPS 官方分析】投稿量暴增,我们能从 NeurIPS 2019 的数据中学到什么?

作者: Alina Beygelzimer, Emily Fox, Florence d’Alché-Buc, Hugo Larochelle

来源: 学术头条

发布日期: 2019-12-11

本文分析了 NeurIPS 2019 的投稿和评审数据,发现投稿数量显著增加,录取率为 21.6%。文章讨论了评审机制的改进,包括编辑筛选、限制投稿数量和使用市场体系控制评审。此外,还探讨了评审质量的衡量标准和反驳、讨论期参与的影响。

在过去的五年中,NeurIPS 论文投稿数量增加了四倍。今年,我们共收到了 6743 篇投稿,经过筛选最终有效投稿降为 6614 篇,有 4500 多个评审人撰写了超过 20000 篇评审意见。今年 NeurIPS 的录取率为 21.6%,共录取了 1428 篇论文。鉴于论文数量的急剧增长,我们决定看看,从这些数据中能得出什么结论。

这篇文章的目的不是对新的审稿体系提出建议,而是为了告知和促进大家对于此话题的讨论。

NeurIPS 2019 共收到 15920 位作者提交的论文。有四分之三的作者并不在会议委员会的邀请名单上,无论是评审员、ACs 还是 SACs。余下的四分之一作者,略超过 70% 的人接受了我们的邀请加入了评审委员会,这是一个好兆头。此外,大多数评审者也提交了论文,这也是一个好兆头。

那么,NeurIPS 有搭便车的问题吗?这并不是很重要。如上表所示,只有约四分之一的人没有接受对 NeurIPS2019 年论文审稿的邀请。然而,他们中大约有 10% 的作者提交了 5 篇或者更多的论文。共有 769 篇论文(在 6,743 篇论文中),至少有一位作者受邀担任委员会成员,但没有任何受邀的作者参与审稿过程。

现在,让我们仔细看一看那些不在委员会邀请名单上的作者(四分之三)。这些作者中大约有 40% 的作者没有与邀请名单上的任何人共同撰写过一篇论文,而这一类别的论文录取率(占所有投稿的近 30%)是最低的,只有十分之一左右。

正如预期的那样,受邀担任更高职务的学者提交了更多论文,并且平均接受率更高。下表给出了 ACs 的统计数据。SACs 的人数略高——每个 SAC 提交了 5.24 篇论文,接收率为 34.78%。来自学术界的审稿者与 ACs 的比例约为 70%。

共有 85 位作者提交了至少 10 篇文章,其中只有 6 人是女性(7%)。我们初步估计的提交论文的女性作者的总体比例为 13%,几乎是多篇论文提交者的两倍。提交多篇论文作者的平均接收率为 24.7%,略高于所有提交者 21.6% 的平均接收率。

最后,与 2018 年相比各主题领域的录取率情况见下图。该图按照每个领域的提交数量进行排序(有关按地区提交的图,请参见下文)。对于我们所看到的前四个主题领域和后四个主题领域之间(统计上显著的)接收率的差异,可解释的是提交最多主题领域的论文,也会存在更大比例的低质量论文,这并不奇怪。

关于如何改变 NeurIPS 的审稿机制,以更好地应对不断增长的论文提交数量的讨论很多。让我们看看,利用 NeurIPS 2019 年的数据来预估这些提议的后果。

作为一项实验,我们想要衡量 AC 的能力,以便在看到评审意见之前就能预估其指定的论文将会被拒收(例如,论文的新颖性不足或学术水平不足)。问题是 NeurIPS 是否应考虑允许 AC 拒绝未经审阅的投稿,以减轻审稿者的负担——这种编辑筛选机制是顶级期刊的常见做法。

另一个常见的提议是限制作者可以提交的论文数量。AAAI 会议甚至提出了 2020 年每位作者最多可提交 15 篇论文(从他们论文征集要求可见)。

另一个建议是使用市场体系来控制评审,仅接收那些引起审稿人足够兴趣的投稿。

大多数提交论文(54%)都会发布在 arXiv 上;其中 21% 的提交论文至少被一名审稿人看到。后一类的录取率为 34%,明显高于 21.6% 的平均录取率。相比之下,未公布论文的接收率为 17%。

客观衡量评审质量好坏的标准是什么?有人提议,论文中是否引用了指定审阅者的论文。那么,NeurIPS 2019 年提交的论文中,至少有一位被引用的审稿人的比例是多少呢?

我们当然希望看到更高的数字,但 40.6% 的投稿人至少有一次评级为 5 的分数,94.7% 的投稿人至少有一次可信度评级为 4 的评论。

为了改进工作分配,我们与 CMT 进行合作,允许 ACs 招募外部审稿人处理他们正在审的特定论文。如果 AC 在常规资源库中找不到合适的人选,他们可以向外部审阅者发送特定论文的邀请。超过 40% 的 ACs 使用了该功能,发送了近 400 个邀请(其中近 80% 被接受)。

作为撰写反驳的作者,您可能想知道论文的初始评分以及论文被接受的概率。你的反驳改变结果的可能性有多大?

尽管数据对很多问题仍然没有给出答案,但我们注意到以下几点问题:

1. NeurIPS 没有搭免费车的问题:没有受邀参与审稿的作者,提交的论文相对也较少。

2. 文中的数据图表并没有表明,在审稿人全面评审论文前应如何快速地去过滤一些质量不高的论文,ACs 的作用就是前期去筛选一些论文,根据他们的淘汰方法,在没有重大决策错误发生的情况下,对审稿人的工作量没有很大的影响。同时,也没有一个很强烈的信号表明,审稿人对特定的论文表示出强烈的渴望去评审。

3. 没有明确的证据表明,以审稿意见的长度来判定 NeurIPS 评审质量的高低:在评审长度方面,NeurIPS 与其他规模较小的会议没有太大的不同。

4. 反驳、讨论期参与的影响:总体参与度似乎高于 2018 年。

UUID: 21756558-53bc-47ee-9b2d-83689598a3c3

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/学术头条公众号-pdf2txt/学术头条2019年/2019-12-11_【NeurIPS官方分析】投稿量暴增,我们能从NeurIPS2019的数据中学到什么?.txt

是否为广告: 否

处理费用: 0.0069 元