高信龙一,他是一位清华大学计算机系的研究生,在 SIGDIAL 2020 会议上,作为清华 COAI 小组的一员,帮助自己的队伍拿到了 SIGDIAL2020 最佳论文。
SIGDIAL 是由 ISCA(International Speech Communication Association,国际语言交流协会)和 ACL(Association for Computational Linguistics,计算机语言协会)共同举办的世界级顶级学术会议。
高信龙一的论文 Is Your Goal-Oriented Dialog Model Performing Really Well? Empirical Analysis of System-wise Evaluation,这是一篇关于提高完整对话系统评价的论文。现如今,越来越多的学者加入到了对话系统的研究与开发工作之中,这使得对话系统在单轮评测中有着极为优秀的表现。
然而对话系统是多轮交互的,单轮结果一旦出错,比如偏离用户本意,那么在这之后的对话系统都将跟着一起出错。这也是为什么对话系统需要一个妥善的评价系统。
通过高信龙一的验证,他得出了三条结论:(1)使用不同组件级别的细粒度监控信号训练的 pipeline 对话系统通常比使用粗粒度标签训练的联合或端到端模型的系统获得更好的性能。(2)单轮、模块内的评估结果并不总是与多轮、系统级的整体性能一致。
(3)尽管模拟用户和真实用户之间存在差异,但模拟评估仍然是昂贵的人工评估的有效替代,特别是在开发的早期阶段。模拟评估可以很好地评估面向目标的对话系统,并显示出与人类评估的适度相关性,但它明显高估了系统在人类交互中的性能。因此,需要设计更好的用户模拟器,使其更接近人类。
高信龙一选择了清华大学的计算机系,他告诉学术头条,虽然投入了大量的时间用于钻研数学,然而他清楚自己的能力界限,再加上对计算机有着独特的兴趣爱好,于是选择进入了计算机系。在大一时期,高信龙一没有直接进入计算机实验室,而是报名了像是足球社、留学生交流社这样的社团。但是他心里明白,相较于他的同学们,他自己没有在计算机领域的先天优势。只能通过私下阅读论文的方式来进行恶补。
一年之后,随着自身利用课外时间的积累,他发现自己已经具备了着手于研究和探索的信心,这让他产生了加入清华大学计算机系实验室的想法。
清华大学计算机系的实验室有很多,有热门的,也有冷门的。看着同学们相继报名了较为热门的实验室,高信龙一没有怀揣着多么复杂的想法,找到了一个感兴趣且又没那么多人的实验室——清华大学计算机系黄民烈教授团队的交互式人工智能实验室。
他用一种自嘲的口吻说,“当时交互实验室人少,更有机会得到锻炼,我就去了。”当然,即便是私下阅读了大量的论文,高信龙一也对计算机基础深有自知。他选择跟随学姐,做一些 baseline 层面的实现与分析工作,即使相对后面的研究来说这种工作还处于初级阶段,不过对于高信龙一,这些工作所积累的知识是十分宝贵的。
高信龙一在实验室中主要负责的领域是对话系统、推荐系统和强化系统。
人机交互的过程中,预言交互是一种重要的交互方式。这种交互方式会让用户产生自己是在跟真人进行交流的错觉,不过想要达到该程度,需要对话系统更加可靠。除了对话系统,高信龙一在其他领域依然有所建树。
他曾在 WWW 2019 上发表了论文 Aggregating E-commerce Search Results from Heterogeneous Sources via Hierarchical Reinforcement Learning。这是一篇对电商搜索结果进行聚合的算法研究,利用子任务排序的方法先呈现所有源的聚合,再从用户的反馈中进行学习,从而提高搜索性能。
清华是个养人的地方,高信龙一是一个直到上了大学才开始了解计算机的人,却在本科和研究生时期实现了远超同龄人的成就。伴随大环境浓厚的学术气息,再加上自身的勤奋和努力,以及在研究领域的钻研,促成了高信龙一的今天。