20篇聊天机器人领域必读论文速递!

来源: 学术头条

发布日期: 2020-04-15

本文介绍了20篇关于聊天机器人领域的必读论文,涵盖了聊天机器人的历史发展、技术挑战、伦理问题以及最新的研究成果。这些论文详细探讨了对话状态追踪、开放领域对话、移情对话系统、数据驱动对话系统中的伦理问题等多个方面,为研究者和开发者提供了宝贵的参考资料。

聊天机器人(Chatbot)是经由对话或文字进行交谈的计算机程序。其能够模拟人类对话,通过图灵测试。自1966年以来人类从未停止过对聊天机器人的探索。现如今,苹果语音助手Siri,微软的小冰、小娜、Rinna、Tay、Zo、Ruk kkuh,亚马逊的Echo,百度的小度机器人,京东JIMI客服机器人,网易七鱼等Chatbot纷纷进驻到生活的各个领域,改变着我们的生活。

1966年,MIT的计算机科学家Joseph Weizenbaum发表了ELIZA,它可以根据人工设计的脚本与人类交流,是世界上第一个模仿人类谈话的机器人;1971年,斯坦福大学的Kenneth Colby开发出Parry聊天机器人,它模仿偏执狂患者,这是第一个通过图灵测试的聊天机器人;1988年,加州大学伯克利分校的Robert Wilensky等人开发了名为UNIX Consultant的聊天机器人系统;1990年,美国人Hugh Loebner设立Loebner Prize,奖励首个与人类回复无差别的计算机程序,即聊天机器人系统;1995年,Richard Wallace博士开发的ALICE系统允许用户自定义自己的聊天机器人,被认为是20世纪最伟大的聊天机器人。

ALICE在2000、2001和2004年三次斩获勒布纳人工智能奖(Loebner Prize),该奖项颁发给最像人类的系统;2001年,SmarterChild在短信和即时信息中广泛流行,聊天机器人第一次被应用在即时通信领域;2006年,IBM Watson能够用自然语言回答问题;2010年,苹果语音助手Siri诞生;之后,全球各大公司开始推出Chatbots平台或开源架构。

Dialog State Tracking: A Neural Reading Comprehension Approach作者:Shuyang Gao, Abhishek Sethi, Sanchit Agarwal, Tagyoung Chung, Dilek Hakkani-Tur链接:https://www.aminer.cn/pub/5de0b9f3df1a9c0c41598a75/dialog-state-tracking-a-neural-reading-comprehension-approach对话状态追踪用于在给定所有先前对话的情况下估计当前的对话状态。

机器阅读理解则侧重于构建系统,以读取文本段落并回答基于段落理解的问题。本篇论文将对话状态追踪转化为一项机器阅读理解任务,以基于上下文回答当前的对话状态是什么这一问题。

Topical-Chat: Towards Knowledge-Grounded Open-Domain Conversations作者:Karthik Gopalakrishnan, Behnam Hedayatnia, Qinlang Chen, Anna Gottardi, Sanjeev Kwatra, Anu Venkatesh, Raefer Gabriel, Dilek Hakkani-Tür发表:Interspeech Conference链接:https://www.aminer.cn/pub/5db92b0647c8f7664621a7e6/topical-chat-towards-knowledge-grounded-open-domain-conversations建立可以与人类进行深层次、开放性对话的社交机器人,是人工智能领域的重大挑战之一。

Amazon团队开发的Topical-Chat是一个基于知识的人-人之间开放领域对话数据集(Knowledge-Grounded Open-Domain Conversations)。其中的基础知识涵盖8个广泛的主题,并且对话伙伴没有明确定义的角色,有助于对开放域对话式AI的进一步研究。

MoEL: Mixture of Empathetic Listeners作者:Zhaojiang Lin, Andrea Madotto, Jamin Shin, Peng Xu, Pascale Fung链接:https://www.aminer.cn/pub/5db9294b47c8f766461f2f8d/moel-mixture-of-empathetic-listeners以往对移情对话系统的研究主要关注在特定情绪下产生的反应。

但是,产生共情不仅需要具备生成情绪反应的能力,更需要理解用户的情绪并适当地予以回复。本篇论文提出全新的基于端到端(End-to-End)在对话系统中建立移情模型的方法:移情听众的混合物(MoEL)。这一模型首先捕获用户的情绪并输出情绪分布。

Ethical Challenges in Data-Driven Dialogue Systems作者:Peter Henderson, Koustuv Sinha, Nicolas Angelard-Gontier, Nan Rosemary Ke, Genevieve Fried, Ryan Lowe, Joelle Pineau发表:In the 2018 AAAI/ACM Conference on AI, Ethics, and Society链接:https://www.aminer.cn/pub/5a4aef9e17c44a2190f7a8b1/ethical-challenges-in-data-driven-dialogue-systems本篇论文重点介绍对话系统研究中可能出现的道德问题,包括:数据驱动系统中的隐性偏见、对抗性示例的出现、潜在的隐私侵犯源、安全问题,强化学习系统的特殊考虑以及可复制性问题等。

MultiWOZ - A Large-Scale Multi-Domain Wizard-of-Oz Dataset for Task-Oriented Dialogue Modelling作者:Pawel Budzianowski, Tsung-Hsien Wen, Bo-Hsiang Tseng, Iñigo Casanueva, Stefan Ultes, Osman Ramadan, Milica Gasic链接:https://www.aminer.cn/pub/5bdc315017c44a1f58a05b9f/multiwoz-a-large-scale-multi-domain-wizard-of-oz-dataset-for-task尽管机器学习已成为对话研究界的主要场景,但真正的突破已被可用数据的规模所阻碍。

为了解决这个基本障碍,本篇论文引入了Multi-Domain Wizard-of-Oz数据集(MultiWOZ),这是一个跨越多个领域和主题的完全标记的人与人的书面对话数据集。它的对话数量达到了10k,比所有先前注释的面向任务的语料库大至少一个数量级。

A Survey of Available Corpora For Building Data-Driven Dialogue Systems: The Journal Version作者:Iulian Vlad Serban, Ryan Lowe, Peter Henderson, Laurent Charlin, Joelle Pineau发表:Dialogue & Discourse链接:https://www.aminer.cn/pub/5b3d98bd17c44a510f800274/a-survey-of-available-corpora-for-building-data-driven-dialogue-systems-the本篇论文告诉我们目前有哪些可用于对话生成系统的开源数据集,并且分析了它们各自的重要特性,以及该如何使用他们。

此外讨论了它们除了对话系统外的其他用途,以及这些数据集对应的检测方法。

The Design and Implementation of XiaoIce, an Empathetic Social Chatbot作者:Li Zhou, Jianfeng Gao, Di Li, Heung-Yeung Shum发表:Computational Linguistics链接:https://www.aminer.cn/pub/5c5ce50d17c44a400fc38d54/the-design-and-implementation-of-xiaoice-an-empathetic-social-chatbot这是由微软研究员发表的关于智能语音助手小冰的论文。

小冰是一个独特的人工智能伴侣,具有情感联系,满足人类对交流、感情和社会归属的需求。本篇论文在系统设计中考虑了智商和情商,将人机社交聊天作为马尔可夫决策过程(MDP)的决策,并优化了小冰的长期用户参与度和预期的每次会话对话。

A Network-based End-to-End Trainable Task-oriented Dialogue System作者:Lina Maria Rojas-Barahona, Milica Gasic, Nikola Mrksic, Pei-Hao Su, Stefan Ultes, Tsung-Hsien Wen, Steve J. Young, David Vandyke链接:https://www.aminer.cn/pub/59ae3c3a2bbe271c4c71fcd9/a-network-based-end-to-end-trainable-task-oriented-dialogue-system让机器去和人类自然的交谈是具有挑战性的。

最近的任务型对话系统需要创造几个部分并且通常这需要大量的人工干预,或者需要标注数据去解决各部分训练的问题。本篇论文提出了一种端到端的任务型对话系统(End-to-End trainable system),它采取了一种基于管道框架的新颖的收集对话数据的方法。

Neural Belief Tracker: Data-Driven Dialogue State Tracking作者:Nikola Mrksic, Diarmuid Ó Séaghdha, Tsung-Hsien Wen, Blaise Thomson, Steve J. Young链接:https://www.aminer.cn/pub/57a4e921ac44365e35c9913a/neural-belief-tracker-data-driven-dialogue-state-tracking现代口语对话系统的核心组成部分之一是belief tracker,它可以在对话的每一步估计用户的目标。

然而,目前大多数方法难以扩展到更大、更复杂的对话领域。这是由于他们依赖:a)口语理解(Spoken Language Understanding,SLU)模型,需要大量注释的训练数据;或者 b)手工制作的词汇表,用于捕捉用户语言中的一些词语变种。本篇论文提出了一个新的Neural Belief Tracking(NBT)框架,通过将模型建立在表征学习上以此克服了这些问题。

Towards an Automatic Turing Test: Learning to Evaluate Dialogue Responses作者:Ryan Lowe, Michael Noseworthy, Iulian Vlad Serban, Nicolas Angelard-Gontier, Yoshua Bengio, Joelle Pineau链接:https://www.aminer.cn/pub/59ae3c262bbe271c4c71ea58/towards-an-automatic-turing-test-learning-to-evaluate-dialogue-responses本篇论文使用语境和真实反应来对模型生成的反应进行打分,并和人类打分的分值进行比较,从而达到一种自动进行图灵检测效果。

训练出来的模型可以生成符合人类判断、能回答输入语句的对话。

Adversarial Learning for Neural Dialogue Generation作者:Jiwei Li, Will Monroe, Tianlin Shi, Alan Ritter, Dan Jurafsky链接:https://www.aminer.cn/pub/58d82fcbd649053542fd6082/adversarial-learning-for-neural-dialogue-generation

To Plan or not to Plan? Discourse Planning in Slot-Value Informed Sequence to Sequence Models for Language Generation作者:Neha Nayak, Dilek Hakkani-Tür, Marilyn A. Walker, Larry P. Heck发表:Interspeech Conference链接:https://www.aminer.cn/pub/5a73cb6317c44a0b30358265/to-plan-or-not-to-plan-discourse-planning-in-slot-value-informed

Training End-to-End Dialogue Systems with the Ubuntu Dialogue Corpus作者:Ryan Thomas Lowe, Nissan Pow, Iulian Vlad Serban, Laurent Charlin, Chia-Wei Liu, Joelle Pineau发表:Dialogue & Discourse链接:https://www.aminer.cn/pub/58d82fecd649053542fdc665/training-end-to-end-dialogue-systems-with-the-ubuntu-dialogue-corpus

A Copy-Augmented Sequence-to-Sequence Architecture Gives Good Performance on Task-Oriented Dialogue作者:Mihail Eric, Christopher D. Manning链接:https://www.aminer.cn/pub/58d82fd2d649053542fd76c7/a-copy-augmented-sequence-to-sequence-architecture-gives-good-performance-on-task

Learning Symmetric Collaborative Dialogue Agents with Dynamic Knowledge Graph Embeddings作者:He He, Anusha Balakrishnan, Mihail Eric, Percy Liang链接:https://www.aminer.cn/pub/599c7953601a182cd263067d/learning-symmetric-collaborative-dialogue-agents-with-dynamic-knowledge-graph-embeddings

Key-Value Retrieval Networks for Task-Oriented Dialogue作者:Mihail Eric, Lakshmi Krishnan, Francois Charette, Christopher D. Manning链接:https://www.aminer.cn/pub/5d9edbfa47c8f7664602e485/key-value-retrieval-networks-for-task-oriented-dialogue

Learning Robust Dialog Policies in Noisy Environments作者:Maryam Fazel-Zarandi, Shang-Wen Li, Jin Cao, Jared Casale, Peter Henderson, David Whitney, Alborz Geramifard链接:https://www.aminer.cn/pub/5a73cbc317c44a0b3035eb5a/learning-robust-dialog-policies-in-noisy-environments

Hybrid Code Networks: practical and efficient end-to-end dialog control with supervised and reinforcement learning作者:Jason D. Williams, Kavosh Asadi, Geoffrey Zweig链接:https://www.aminer.cn/pub/58d82fcbd649053542fd5e67/hybrid-code-networks-practical-and-efficient-end-to-end-dialog-control-with

The Dialog State Tracking Challenge Series: A Review作者:Jason D. Williams, Antoine Raux, Matthew Henderson发表:Dialogue & Discourse链接:https://www.aminer.cn/pub/57a4e937ac44365e35c9cbfe/the-dialog-state-tracking-challenge-series-a-review

How NOT To Evaluate Your Dialogue System: An Empirical Study of Unsupervised Evaluation Metrics for Dialogue Response Generation作者:Chia-Wei Liu, Ryan Lowe, Iulian Vlad Serban, Michael Noseworthy, Laurent Charlin, Joelle Pineau链接:https://www.aminer.cn/pub/573696106e3b12023e5239eb/how-not-to-evaluate-your-dialogue-system-an-empirical-study-of-unsupervised

UUID: 8dc07563-6875-4f9b-92e1-0a1b5b20cc12

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/学术头条公众号-pdf2txt/学术头条2020年-上/2020-04-15_20篇聊天机器人领域必读论文速递!.txt

是否为广告: 否

处理费用: 0.0117 元