最近十年,人工智能领域的学术出版物迅速增加,全新的领域也如雨后春笋般地出现。我们想知道,如何定义每个领域最重要的论文呢?更有意思的是,通过不同的方法(例如投票和自动检索)对论文的“品味”会有什么区别?
2020年2月起,清华大学AMiner,智谱华章和biendata将联合组织一次“为AI主题推荐论文”的活动,覆盖了100个AI相关的主题。我们希望AI领域的所有人——老师、同学、检索团队一起加入进来,共同定义这些主题中最重要的论文。
本次活动包括数据标注、人工投票和信息检索比赛三大部分。在人工投票中,我们希望邀请您为自己熟悉的领域选择选择一些最有意义的论文,并简单地给出理由。
在项目结束后,清华AMiner、智谱华章和biendata将联合发布一份《10K Papers of 100 Topics》报告。在报告中,我们将开源所有结果数据,以及获得这些结果的方法(检索模型和人工推荐理由),并对不同的方法进行比较。我们相信,通过不同方式获得领域论文,并比较不同方式如何“判断”论文的重要性是一个很有趣的尝试。这份报告将于2020年夏季或秋季向学术界和公众开放。
添加小助手(微信号:biendata02)领取论文推荐表(内含100个主题),从100个主题中选择1-3个。您可以直接通过表格的方式为自己感兴趣的话题各选择10-30篇论文,每篇论文提供标题、会议、年份和一句话或几句话的选择理由。我们希望:1. 您是人工智能相关研究方向的硕士、博士研究生。2. 至少在所选择领域内发表过一篇论文,如果暂无论文发表,我们也欢迎您通过其他任何方式展示您对领域的熟悉程度。
本次活动的结果将通过清华大学AMiner、智谱华章和biendata三方共同发布。学术界和公众都可以免费阅读。与此同时,我们还将组织一次信息检索技术评测,要求参赛者使用信息检索技术筛选出同样主题的论文,评测结果同样会在报告里公开,并与人工选择的结果做比对。(检索评测有另外的标准,不会用本次投票作为标记。)
本次活动的所有数据和模型都会免费发布并开源,供大家阅读或进一步研究。
我们希望,您对论文的判断来自您的经验和知识,而不是通过某种硬性的指标(如查询论文引用数)进行判断,同时,我们不希望您直接使用或过多参考网上的论文推荐列表。如果这个主题是一个技术(例如LSTM),那么发明了这个技术和对技术作出重大改进的论文肯定是最重要的,如果使用了这个技术做出了非常有影响力的研究,也可以被认为是这个技术话题下的重要论文。
如果这个主题是一个领域(如NLP),那么开创了重要的子领域或发明了对这个领域影响深远的技术的论文也是最重要的。
除了获得一次系统梳理领域论文的机会,您还将获得:联合作者署名:在清华大学AMiner、智谱华章和biendata联合发布的《10K Papers of 100 Topics》上作为联合作者署名。一张京东卡: 100元-500元不等。
如果您目前本科在读,能力优秀,也想加入到此项目中,我们可以为工作出色的本科在读成员提供清华大学计算机系实验室的项目实习证明。有任何问题请直接添加小助手进行咨询(微信号:biendata02)