AI在狼人杀游戏中的表现

天黑请闭眼，欢迎来到狼村。狼人杀游戏，是一种基于自由自然语言交流的社交推理游戏。在狼人杀中，所有玩家（通常为5-10人）被随机分配一个角色（如平民、狼人、女巫、叛徒和预言家等），他们试图推断其他玩家的角色。“好人阵营”中有平民、女巫和预言家等角色，在白天投票驱逐狼人；“狼人阵营”方面，狼人试图在夜晚杀死平民，而叛徒试图扰乱平民。玩家必须欺骗其他玩家才能生存，对话之中不可避免地包含大量虚假信息。

为了在游戏中获胜，玩家需要记住对话的细节，对其他玩家的角色做出假设，并发现其中的矛盾。

不少玩家表示自己是“狼人杀黑洞”，没有办法准确识别他人的“谎言”，抑或是不知道如何思考话术和逻辑而消极应对——“我是好人，昨晚发生了什么我都不知道。反正我是‘好人’。”即使拿到“预言家”“女巫”等功能性身份例如，也不会推理发言，只能浑水摸鱼。如果让AI玩狼人杀游戏，它会有怎样的表现？

近日，一款名为Deep Wolf的AI语言模型被证明能够理解自然语言并扮演狼人杀中的角色，在游戏中成为人类的游戏助手或竞技对手。Deep Wolf通过Longformer理解语言，然后用强化学习方法来训练，最终决定投票谁出局或者“刀”谁。

相关研究论文以“Playing the Werewolf game with artificial intelligence for language understanding”为题，已发表在预印本网站arXiv上。AI玩狼人杀，能力如何？目前，大多数AI系统在其所处理的大量数据是正确的假设下学习和输出数据。然而，由于真实社会受到虚假信息的困扰，如果AI能够检测到矛盾和虚假信息是极其有帮助的。

狼人杀的一个重要特点是，大部分对话都是虚假信息，而AI在这种情况下尚未得到广泛调查。同时，虽然很难开发出能够检测真实世界中各种谎言的人工智能，但狼人中相对有限的词汇量和处理的信息类型吸引了学者的注意。据此，这项研究旨在开发一种可以通过自然语言对话扮演狼人杀角色的AI代理。

通过收集15名人类玩家的游戏日志，学者Hisaichi SHIBATA、Soichiro MIKI、Yuta NAKAMURA对基于Transformer的预训练语言模型进行了微调，构建了一个价值网络，该网络能够预测在游戏的任何给定阶段赢得游戏的后验概率，并为下一步行动提供候选。另外，基于从价值网络中获得的概率，研究者开发了一个名为Deep Wolf的AI代理，它可以与人类交互并选择最佳投票目标。

最后，他们通过真正让Deep Wolf与人类玩家玩狼人杀并收集其胜率来评估人工智能代理的性能。

在游戏的早期阶段，当价值网络的角色是狼人时，后验概率总是很低；而在扮演预言家时后验概率总是很高。这表明，在这个五人版狼人杀中，价值网络有能力正确估计获胜的概率，并且在判断平民一方有优势。Deep Wolf的表现。叛徒和平民的平均胜率与Deep Wolf扮演背叛者和平民的胜率没有明显区别。

这表明，如果Deep Wolf的角色是叛徒或平民，和普通人类玩家能力相当；而在扮演狼人或预言家角色时，则不如人类玩家。

这项研究首次建立了一个AI代理，它可以通过与人类玩家理解自然语言来扮演狼人杀中的角色。这意味着当前的语言模型有能力理解陈述、说谎或检测对话中的谎言。在这项研究中，三位学者仅仅基于32份游戏日志对Deep Wolf进行了训练和评估。

如果能获得更多的游戏日志，对AI代理进行训练，可能提高其性能，让AI玩家变得更强，从而提升游戏的竞技性。同时，在涉及AI代理的游戏中，除了推断另一个玩家的角色之外，还有一项额外的任务，即推断每个玩家是AI代理还是人类，评估人类玩家在这种情况下使用的策略的变化将是一个有趣的话题。此外，AI玩家能够为狼人杀带来更多的可能性，例如，全部角色都使用AI代理，人类仅仅作为游戏观众？

那么，你愿意让Deep Wolf加入你的狼人杀游戏吗？