庖丁解牛剖析国际学术论文写作的快速入门

作者: 赵鑫

来源: 学术头条

发布日期: 2020-04-18

赵鑫在智源论坛上分享了如何写好一篇国际学术论文的经验,包括引言、相关工作、模型、实验、参考文献等部分的写作方法和技巧。他强调了写作的逻辑性和重要性,并提供了一些实用的写作建议和学习途径。

2020年3月17日,在超千人同时在线的“智源论坛·论文写作专题报告会”上,三位智源青年科学家分别进行了精彩的在线分享,题目分别为:中国科学院计算技术研究所研究员兰艳艳《论文写作小白的成长之路》、中国人民大学副教授赵鑫《谈如何写一篇合格的国际学术论文》、北京大学研究员施柏鑫《计算机视觉会议论文从投稿到接收》。

他们通过丰富的实战示例,分别从论文写作的润笔和修改技巧、论文写作的常用步骤与方法、论文投稿和审核中的关键注意事项等多种角度,详细解析了如何写好一篇优秀的国际学术论文,收到了直播间观众的热烈反响。我们将他们的演讲整理成文字,陆续发布。

今天,我们将介绍智源青年科学家、中国人民大学副教授赵鑫《如何以初学者的身份写好一篇国际学术论文》。赵鑫从一篇国际学术论文的通常逻辑布局入手:引言、相关工作、模型、实验、参考文献等,通过大量的实战示例,详细解析了它们的写作方法、技巧和注意事项等,此外还分享了他本人对于一些国际期刊的投稿经验。

需要说明的是,本次报告的示例主要以信息检索,自然语言处理以及数据挖掘的论文展开。同时赵鑫认为,国际论文不同领域的基本方法和思路都是相通的。写作堪称一门学术内功,需要时间加以修炼,报告人也在修炼途中;而且写作千人千面,没有绝对的正确和错误。本次报告仅作为他个人写作经验的一次交流分享。

首先,赵鑫给我们介绍了两篇主要的示例论文,第1篇发表在SIGKDD 2019上,主题是基于背景信息的智能化路径搜索算法。作者将从起点到终点的路径搜索算法定义为A*算法,原始的A*算法会分解启发式搜索值为两个部分,其中g用来计算历史消耗,h用来预估未来消耗,论文的新思路是采用了图神经网络进行计算,包括采用深度学习方法来计算其中的g以及h。

第2篇发表在SIGIR 2018上,是基于知识属性的序列推荐算法。赵鑫指出,为了帮助论文初学者们快速入门,他接下来的内容风格可能会有点像“八股文”:按照论文的撰写顺序,介绍每一个部分该怎么写,有哪些规范、技巧或教训等。

引文:论文必须装点的“门面”。一般来讲,摘要部分只要不出现太大的失误就不会成为拒稿的因素,但引文部分如果把握不好就容易成为文章被拒的理由,或者让读者难以提起兴趣阅读该论文。

引文部分主要具有以下作用:交代研究任务,向读者传达作者的任务和目的;阐述研究现状总结不足,说明目前状态,为读者提供研究背景的铺垫,带出论文研究的挑战和难点,如果论文需要解决的技术挑战重大,可以单独列出段进行描述。但切忌单纯罗列工作,而不突出难点;提出解决的新思路,主要是用来引出论的解决思路;给出新方案的设计,较为详细地介绍所提出思路的实现;总结论的贡献以及实验结论,这部分需要总结并且强调论的贡献。

以第一篇示例论文(SIGKDD 19)为例,其在引文中首先介绍了个性化路径推荐问题,即给定路网结构,旨在解决生成特定用户的路径推荐问题。因而需要突出在大图以及路网上的复杂性等难点。其次是在引文中阐述了研究现状并总结出了不足,为读者做出了研究背景方面的铺垫。这部分不同于对相关工作的介绍,主要是总结已有算法的不足。

传统启发式搜索如A*算法的好处在于大图上的有效性,而机器学习算法的优点在于突出了算法的灵活性。很自然地,引出能否结合两者的优点呢?这一想法通过加入在策略游戏上的过渡句来带出:同时结合A*算法与机器学习算法的优点。下面还是给出新方案的具体设计过程,即通过一句话说清楚算法的具体功能与设计思路。最终强调论文的贡献,尽量避免强调的贡献过多,细致强调一个贡献效果更好。

在引文中也特别需要注意讲究逻辑性,逻辑错误是目前许多同学都会出现的问题。常见的逻辑错误有以下几个方面:因为模型A好使,所以用A做某任务。这是机器学习学生前期论文经常出现的错误。典型的错误如“因为Deep Learning好用,所以就可以用来完成某个任务”;因为任务B没有人做,所以我做了。没有人做的事情很多,并不能体现出意义;之前的人做了什么工作,我做了什么工作,我的比前人做得好。

这种情况很容易出现缺乏解释性,强迫进行衔接;这个任务很难,这篇论文我们这样解决了这个挑战。没有突出解决过程中的思路描述;夸大自己模型的贡献、忽略别人的工作。这一定要和related work建立联系,不能夸大贡献。

综上所述,赵鑫对引文(Introduction)的写法“六句扩展法”进行了如下总结:①第一句写任务介绍以及研究意义;②第二句概述研究现状以及存在主要的问题;③第三句写解决这些问题的研究挑战;④第四句写当前方法的主要出发点以及解决思路;⑤第五句写当前方法的主要技术方案;⑥第六句写总结、强调贡献。写出这六句话后,可以分别按段进行拓展,用以完成introduction的写作。

除此之外,在引文写作中还需要注意过渡词的使用,例如yet、although等。

相关工作:分类整理,覆盖全面。论文写作中相关工作部分的要求,主要包括这四个方面:尽量覆盖所有相关工作,其中可以匹配一些特定排版风格;多读论文;进行细致的分类整理并突出相关之处;强调差异与不同之处,例如主要任务,数据,算法的归纳与整理,这样可以写的非常高瞻远瞩并且浓缩;兼顾长写与短写,铺垫好足够的内容再展开相关工作。

在这个过程中,以下几点错误是较为常见的,我们需要特别避免:简单罗列阅读文章,并没有在平时读论文的过程中做到分类总结;没有讲清楚区别与联系,这体现了对论文进行分类总结的重要性;语法错误,论文的时态可以选择过去时或现在完成时,但切忌混乱使用时态;套用与滥用模板。

定义:清楚明晰是关键。通常来说,定义部分主要具有以下三个作用:介绍清楚所有术语,让符号符合人的直觉与常用思维(如首字母命名法);给出所有符号的含义以及使用方式,好看、好记、成体系并活用上下标(推荐花书的符号参考,避免黑白式符号);形式化地描述清楚任务。

模型部分:注重逻辑与收尾。模型部分的写作一定要强调逻辑,这对论文最终呈现出的质量极其重要。其中,最基本的逻辑形式分为总-分式和总-基础-增强式。

总-分式的逻辑是指模型有若干个部分并对其分别加以介绍,各部分联系紧密且title比较清晰;总-基础-增强式是指首先概述一个基本模型,并在基本模型之上进行拓展。在对模型进行收尾即在总结模型训练的过程中,可以通过加入模型分析、模型训练和模型学习等方面的介绍,用以对于模型进行完善、升级以及延伸。

实验部分:注重对比实验。

在文章的实验部分,往往遵循如下的一般流程:数据集合(包括:评测指标和评测流程)、对比方法、主干实验分析、模型细致分析、定性实验,下面是各流程节点写作的详细方法:数据集合,首先要在文章中写明原始数据来源,以及经过哪些预处理步骤得到最终用于评测的数据集。最终的数据还要列表进行诸如数据量类别数等的对比。

一个小技巧是将表格中的数字右对齐,使用逗号表示法,如“200,000”,这样方便审稿人进行比较不同数据集合的大小。至于评测指标和评测流程,新任务的评测指标或流程,则要详细给出,老任务的则可以沿用已有指标。

摘要和总结:整体把握。写摘要应该是时间花费最少的,建议在文章完结后进行摘要写作。因为此时论文已经成型,方便你直接借鉴或者改动论文中一些已经很成熟的重要语句。

摘要部分要注意讲清楚任务、方法和创新点,不要提实现细节,不需要代入,而是要直接了当地写。总结也是一样,简要总结工作,不要再埋包袱、打伏笔,具体流程可以这样写:①具体任务、②解决方案、③实验结果、④未来扩展。需要注意的是,语法上,现在完成时和过去时都可以,但是不能混着用。

写作习惯:如何安排写作顺序。对于论文写作、修改时的流程,一般来说,我首先会花费半天时间写相关工作,之后会对问题定义和模型细节进行足够了解并且进行写作,随后将写作重点放在引言和实验部分,一般会在2-3日内完成初稿。初稿完成后会花费一天时间在引言和其他部分反复进行迭代修改,全文定稿,最后完成摘要和结论部分及修改相关工作。

建议:最快、最稳的论文写作学习法。

演讲最后,赵鑫提纲挈领提了一系列“high level”的建议。首先,是论文写作中一些“固定而正确”的实践建议,赵鑫解释说,“只有学会跑之后才能考虑飞翔”,初学论文者首先要像学习八股文一样进行论文写作。具体建议如下:学一手好的LaTex,建议模板化、流程化、标准化。同时观念上将写论文作为科研的一部分——只有做好了科研,才能写出好论文。学会一些固定转折、承接、突出、总结、代入、发现、介绍等固定语句。

重学四级单词或者学术论文常用单词,了解这些词的准确用法。(可以写个程序,找出来最频繁的词汇,以及它们的搭配,对于自己使用的新搭配要小心)建议学会一套好的画图技术、做表技术。相关工作应该平时准备好,对于bib提前找好。自己做拼写检查。

对于论文写作,最快的学习途径,赵鑫认为是不断地复盘:多写论文,然后找师长修改;赵鑫强调:“要珍惜每一次老师给你的修改。

作为中国人,尽管老师难免可能会出现语病,但他毕竟写过的论文比你多,一定要好好琢磨他为什么这么做”。对应的,对于论文写作最稳妥的学习途径,赵鑫建议寻找一些科普的文章,如一些大组的工作,从头到尾去学习写作、背诵甚至默写;此外还有一种“廉价”的方法,是读论文的时候不看abstract,从而根据论文写abstract,然后进行对比,这在本质上相当于写论文然后找人修改的过程。

此外QA环节中,赵鑫还提到以下几点:1、建议大家读论文的时候,一定先有一个大概的topic,把论文量首先积累到50篇,然后开始做一个分类的操作,然后做一个重写摘要的操作,这两个事情做完以后,论文基本上确定了。不要硬写论文,一定想清楚自己的contribution是不是已经足够了,或者自己是不是已经做好了写论文的准备,做好文献阅读的情况下才可以写论文。

2、论文中相关术语的缩写一定要和原始论文中的一样,比如BERT不是Bert或者bert。3、不要把图画得复杂,把故事说清楚,就是图要画得越简单越好,很多情况下是因为要讲的故事复杂它才复杂,千万不要把模型图画得太复杂。

UUID: 57ccce9d-c2bb-430d-addc-2566c07a944b

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/学术头条公众号-pdf2txt/学术头条2020年-上/2020-04-18_庖丁解牛剖析国际学术论文写作的快速入门.txt

是否为广告: 否

处理费用: 0.0122 元