CCKS(全国知识图谱与语义计算大会,China Conference on Knowledge Graph and Semantic Computing)已于本月24日在杭州召开。前几天我们对录用的部分论文进行了简单的剖析,今天我们就来继续解析部分录用的论文。CCKS华人库已在GCT官网上线,想要了解论文作者详细信息可以通过下面链接进入人才库。
传送门:https://gct.aminer.cn/eb/gallery/detail/eb/5d5e4f9186d144b6fc835735 (人才持续更新中)
Oral论文题目基于连通图的篇章级事件抽取与相关度计算剖析:本文的方法采用无监督的方式,不需要大规模的标注数据对模型进行训练,减少模型应用过程中的人力成本与时间成本。
从整体上看,模型流程可以分为四个部分:关键子句筛选、关键事件词识别、标题关键词抽取、篇章相似度计算。前两部分对篇章核心事件词进行提取,第三部分与前两部分组成的pipline通过最后一步结合在一起,完成对篇章事件相关度的计算。
本文的创新点主要有以下两个方面:1. 在传统Text Rank算法中引入了EM思想,使得模型可以同时对句子和词语的重要性进行识别;2. 提出了以事件多边形为基本元素、事件关键词为节点的连通图构建方法,并在此基础上对关键事件词进行挖掘。本文设计了丰富的对比实验,验证了提出的模型的有效性。
Poster论文题目面向问题意图识别的深度主动学习方法剖析:本文基于深度主动学习技术设计问题意图识别语料标注方法,以减少问题意图识别任务中的人工标注成本。针对深度学习在主动学习中计算量巨大等挑战,设计了一个轻量级深度学习意图识别模型,并实验证明了该模型在问题意图识别任务中表现出高性能的同时,训练速度更快。
针对主动学习方法中常用的不确定性选择策略存在的孤立点和冗余问题,提出了一种结合样例的信息性、代表性与多样性三项准则的选择策略,并在实验证明了该选择策略能更有效地度量样例价值,减少更多的问题意图标注成本。