AI TIME PhD 直播预告｜清华 CoAI 小组博士生关健学术分享

今天（6月30日）19:30~20:30，AI TIME 特别邀请到清华 CoAI 小组博士生关健，为大家带来“开放端故事生成评价指标的评测基准及长文本生成的连贯性建模”学术分享。学术头条作为合作媒体，将通过视频号进行线上直播。该报告将介绍两篇发表在 ACL 2021 主会的论文。

第一篇论文提出了第一个评价故事生成评价指标的评测基准；第二篇论文针对如何提高长文本生成的连贯性的问题，提出在生成模型中引入句子级别和篇章级别的前缀表示，并分别用句子相似度预测和句子位置判别的预训练任务学习相应的表示。感兴趣的小伙伴，可以在学术头条视频号一键预约并观看直播。

直播结束后，我们将邀请讲者与大家进行答疑交流，请添加“学术君（ID：xueshujun01）”，备注“PhD”，进入“AI TIME PhD 交流群-2”！关于嘉宾★邀请嘉宾 ★关健：清华大学计算机科学与技术系博士生，师从黄民烈副教授。研究方向为长文本建模，曾以第一作者身份在 ACL、AAAI、EMNLP 等国际知名会议发表多篇论文。

报告题目：开放端故事生成评价指标的评测基准及长文本生成的连贯性建模。该报告将介绍两篇发表在 ACL 2021 主会的论文。第一篇论文提出了第一个评价故事生成评价指标的评测基准。该基准基于人工标注和自动构造的数据集对现有的评价指标进行了综合测试。实验发现现有的故事生成评价指标仍然与人工评价相关性较弱，难以识别篇章级别的不连贯错误，缺少因果和时序方面的推理知识，缺乏鲁棒性和泛化性。

该基准的数据集、评测脚本和评价工具包已发布在：https://github.com/thu-coai/OpenMEVA。第二篇论文针对如何提高长文本生成的连贯性的问题，提出在生成模型中引入句子级别和篇章级别的前缀表示，并分别用句子相似度预测和句子位置判别的预训练任务学习相应的表示。

实验结果表明我们的模型能生成更连贯的文本，且具有更好的语言建模能力，模型已发布在：https://github.com/thu-coai/HINT。主办：AI TIME、清华 CoAI 小组。合作伙伴：智谱·AI、中国工程院知领直播、学堂在线、学术头条、biendata、数据派、Ever链动。合作媒体：学术头条。