昨日,机器学习领域的顶级会议NeurIPS(Conference and Workshop on Neural Information Processing Systems)公布了2019年的论文接收结果。据统计,大会最初收到的论文摘要提交量为9185篇,但最终符合提交要求的论文数量为6743篇,相比2018年的4854篇提升了将近40%,再次刷新历史记录。
最终,1428篇论文被接收,接收率达到21.17%(略高于去年的20.8%)。在接收的论文中,还有36篇Oral论文和164篇Spotlight论文。
在论文评审结果出炉后,很多提交者和研究者都进行了讨论,大家对大部分审稿人、程序主席的评审工作都非常满意,即使是论文没有被接收的研究者,也表示从评审中学到了很多。看来今年的录取结果也算是让众人“心服口服”。
除了几近疯狂的投稿量,近年来想去NeurIPS参会也是一票难求,去年门票开售仅10分钟就被疯抢一空,堪比春运现场,引来机器学习圈子各路吐槽。今年,NeurIPS2019将于12月8日在加拿大温哥华会议中心举行,相比与往年的“先到先得”,大会组织者更改了今年的门票预售规则,将以“抽奖”为原则,也就是去年大家还能拼手速,而今年完全就要靠人品和运气了。
主办方开放的注册时间就在明晚8点,想参会的同学,考验人品的时刻到了……
作为AI领域最重要的顶会,诞生自1987的NeurIPS(NIPS),最初被设计为研究探索生物和人工神经网络的互补性开放跨学科会议,早年间并没有如此火爆。随着近几年深度学习的崛起,NeurIPS不仅成为了学术界的新星,也引起了工业界的高度关注,注册人数从数年前的几百人跃升到去年近万人。
在各种学术会议统计中,NeurIPS一直有着很强的影响力和排名,被认为是神经计算方面最好的会议之一。在CCF和清华的计算机学科推荐列表中均被评为A类会议。根据AMiner大数据平台的统计分析,通过对近五年来各类会议的h5指数、cit_med、10H、avg_pub等指标的综合计算,NeurIPS的H5指数为149,10H值为34641,在人工智能方向排名第二。
NeurIPS为什么这么火?早期NeurIPS会议的研究主题范围很广,包括从解决纯工程问题到使用计算机模型作为了解生物神经系统的工具等等。之后,生物和人工系统的研究发生了分化,近年来的NIPS大会一直以机器学习、人工智能和统计学论文为主。
根据以下关键词云图可以看出,近五年来的NeurIPS大会关键词主要有人工智能、推荐系统、kaczmarz算法、强化学习、图表示学习等。
通过对五年来NeurIPS接收论文中所有学者信息的提取,我们分析了这些学者的性别比例、国籍分布与语言分布情况。可以看出,NeurIPS的投稿学者主要以男性为主,占比94.4%,女性学者占比5.6%。从学者分布情况来看,投稿学者主要来自美国、加拿大,分别占比40%、20%,英国、中国学者分别占比13.3%。从语言分布情况来看,投稿学者主要以英语为主,中文第二,希腊语第三。
根据对近五年论文引用量的统计,AMiner对NeurIPS的十大高引论文进行了排名。
高引论文TOP1是发表于2015年的《Faster R-CNN:Towards Real-Time Object Detection with Region Proposal Networks》一文,引用量高达9790次,作者是来自微软研究院的Shaoqing Ren,Kaiming He,Ross B. Girshick,Jian Sun。
该文主要介绍了基于region proposal算法来假设目标的位置,作者发现基于region的detector(如Fast R-CNN)的卷积feature map也可以用于生成region proposals,它与检测网络共享完整的图像卷积特征,从而实现几乎无成本的区域建议。
高引论文TOP2是《Generative Adversarial Nets》,作者是来自谷歌与蒙特利尔大学的Ian J. Goodfellow,Jean Pouget-Abadie,Mehdi Mirza,Bing Xu,David Warde-Farley,Sherjil Ozair,Aaron C. Courville,Yoshua Bengio。该文主要提出了一种新的模型——生成对抗模型。
该模型训练了两个相互对抗的网络,一个是训练一个生成器(Generator),另一个是训练一个判别器(Descriminator)。
高引论文TOP3是《Sequence to Sequence Learning with Neural Networks》,作者是谷歌的Ilya Sutskever、Oriol Vinyals、Quoc V. Le。
深度神经网络(DNNS)在2014年之前已经被证明可用于各种复杂的学习任务,并且均被证实其可行性及高准确率。但其有一个弊端,即它需要有足够的标注数据,因此其并不适用于去做序列到序列的映射任务(map sequences to sequences)。本论文提出了一种端到端(end-to-end)的神经网络模型,来学习这种映射关系。
通过AMiner的数据分析,我们发现,有一位学者在2014-2018年的五年间,分别以第一作者身份发表过4篇论文,以二、三作者身份发表过四篇论文,并且这些文章均在NeurIPS高引论文TOP100榜单。Oriol Vinyals究竟是谁?或许有些人对他感到陌生,但有一群人很早就听过他的大名,年少时,他曾是西班牙《星际争霸》游戏排名第一的电竞高手。
Google Gmail、图像识别服务出自于他写下的程序,他还开发过一个AI机器人,可以和你畅谈人生。2016年,他拿下了MIT TR35大奖,名列全球35位最具创新力年轻人之一。
我们还发现了另一位明星学者,他出现在2016年与2017年NeurIPS高引学者TOP20榜单中。2016年,他分别以第一作者和第二作者身份发表过2篇论文;2017年,发表4篇论文,其中以第一作者身份发表2篇;2018年也有5篇论文见于NeurIPS。他就是“清华学神”、MIT博士生吴佳俊,他将于2020年加入斯坦福大学担任计算机科学助理教授。