比人类更像人类!在这个虚拟小镇里,NPC有了自己的想法

作者: 不周

来源: 环球科学

发布日期: 2023-04-27 22:28:57

研究人员基于GPT-3.5创建了一个虚拟小镇Smallville,25个生成式智能体在其中生活,拥有各自的思想、个性和社交关系。这项研究展示了生成式智能体的潜力,能够模拟人类行为并与用户交互,但也提出了道德伦理的考量。

有时候玩游戏,看到角色冒出一些引我沉思或是捧腹大笑的对话,总会暗暗想到:如果这些角色是真实的,Ta一定会是我最好的朋友(当然,也可能是老公/老婆)。甚至有时正对战的boss突然间蹦出的段话,也会让我联想到一个复杂却极具魅力的形象,而本来正紧张冒汗的我有一瞬间真的很想转投敌营(虽然并没有这个选项),然后便乱了阵脚,被Ta打回快乐老家,深刻体会到了游戏创作者的恶意。

这种能耽于其中的、交互式的快乐,是游戏这种艺术形式带给我们的独有体验。大多数游戏佳作都在游戏性和故事性之间实现了完美的平衡,让玩家尽可能高程度地沉浸在创作者构建的奇幻世界里。在很常见的角色扮演游戏(RPG)中,玩家就需要扮演世界中的一个角色。而游戏的剧情、世界观,总是经由玩家与非玩家角色(NPC)的交互一点点展现在眼前。

但无论NPC多么有趣,程序性的设定总会提醒我们,与你互动的与其说是一个个人物,不如说是游戏创作者们。因此很多玩家都向往着一个开放世界,随处可见的是与真人无异的智能NPC,就像《西部世界》或者电影《失控玩家》里的游戏那样。

最近,这个看上去遥不可及的梦想好像有了丝希望。

在一篇发表于预印本网站Arxiv上爆火的文章《生成式智能体:人类行为的交互性仿真》中,美国斯坦福大学和谷歌的研究团队基于GPT-3.5创建了一个迷你的“西部世界”——25个NPC都是由生成式智能体(Generative Agents)扮演的,他们有着各自的思想、个性、记忆、计划、社交关系等人类属性,一同生活在Smallville小镇中。

这些AI角色在虚拟的世界中认真地生活,计划着自己的每一天,甚至还会主动地制造机会来追求自己喜欢的人。

过去研究人员就曾提出一些人工智能的认知架构,希望能构建全面的认知功能,使AI能扮演各种各样人物形象。理论上,它们将拥有短期记忆和长期记忆,会在感知外界、规划安排、做出行动的循环中运行为“人生”。然而,系统自带的行为或反应只有很少的几种,这种结构并没有办法刺激AI寻求新的行为。

也就是说,它们看似能对你的操作或刺激做出反应,但它们只能在系统现有的选项中选择自己的行为,不可能有额外发挥的空间。相比较之下,真实世界充满了随机性,不像游戏中NPC始终带着游戏作者的影子。

要打破游戏的这种局限,大语言模型就成为了让AI说人话或做人的关键。首先,大语言模型会从训练数据中识别并编码各种人类行为,这它们可以表现出类人行为。事实上,学习人类,“成为”人类,超越人类,这大概是所有人工智能开发者的初衷。近半年来最受瞩目的ChatGPT之所以掀起了全民热潮,也正是因为某种程度上,它已经表现出了与人类认知相当的水平。

这个AI小镇的第一作者,美国斯坦福大学计算机科学专业的三年级博士生朴俊成(Joon Sung Park)表示:“我们认识到,这些大语言模型的训练数据中包含了很多关于人类的行为方式、彼此间的交流方式以及如何行动的信息。如果能够用某种方式从模型中检索到这些信息,就能以此来构建NPC智能体的基本模块。”当我们和大语言模型发生对话时,通常它会根据你当下与它的交流,在行为模板的提示下做出尽可能合理的响应。

但当你退出界面,它并不会保留之前和你交流内容的记忆。而一个可信的智能体(拥有社会行为的智能体),必须有过往记忆,并能根据当下的刺激调动回忆,做出符合它形象的行为反应。

研究者在文中也列出了他们心目中理想的智能体NPC应该具备的条件:1. 他有自己的身份、身体以及自由行动的能力;2. 他能够记住自己或周围环境发生的事情;3. 他能生成自己的想法;4. 他能根据需求做出计划并调整自己的行动。

基于这些原则,研究者以模拟类游戏《模拟人生》为灵感,创建了一个交互式的沙盒世界——Smallville小镇,镇上有杂货店、公园、学校、咖啡厅、酒吧、宿舍、住宅等建筑,每一个建筑都能发挥他们应有的功能,比如NPC会去酒吧喝酒、去公园散步或者和人聊天等。在小镇中,所有生成式智能体之间都会以自然语言相互交流,而用户也可以使用自然语言与他们交互,比如采访他们、命令他们或者加入他们的活动。

研究人员创建了25个生成式智能体,每一位都有自己的性格、爱好、职业、目标等属性。

而每一个生成式智能体都能做到:1. 自由地与其他NPC发生交流;2. 记住、并回忆起自己曾经做过的事情或者观察到的事情;3. 反思自己观察到的事情(回溯到第二步,记住自己提炼出的更高级别的想法,并用于之后行动的指导);4. 为每一天要做些什么做出规划。搭建好这样的框架后,研究者便让这个小小的世界自由地演化。

演化的结果很“平常”,却也令人震惊。最初,研究人员仅仅给其中一个智能体NPC伊莎贝拉设定了“想要举办一场情人节派对”的想法。于是,她便邀请其他智能体一起参加派对,在这个过程中,她结识了新的朋友,并敲定了派对举办的时间。最终受邀的NPC都如约抵达了伊莎贝拉的住所。

每一个智能体都会安排自己一天会做些什么,而在接收别人的邀请后,他们会根据派对时间调整自己原来的安排。更有趣的是,后来研究者又给另一位智能体NPC玛利亚提供了“喜欢克劳斯”的想法,当伊莎贝拉请玛利亚帮她一起邀请人参加情人节派对时,玛利亚就抓住机会跑去邀请了克劳斯。一切都很平常,又如此奇妙,因为这就是人类社会中普通而常见的社会行为。

那么这些生成式智能体是如何拥有“灵魂”的呢?其关键在于架构和组件。

研究者设计了一种扩展大预言模型的架构,它会存储智能体使用自然语言的完整体验记录(memory stream,记忆流),随着时间推移将这些记忆整合为更高级别的反思想法,并存储到记忆中,而后根据记忆动态地计划行动。整个架构有三个主要的组件:观察、规划和反思。每个组件都会执行特定的功能:观察:使用自然语言记录智能体的感官输入信息(每个角色会有一个对其他角色和环境的观察日志,像记忆库一样)。

这些信息会存储在情景记忆缓冲区,智能体会根据信息的记录时间、重要性以及相关性提取最近的记忆。

规划:从情景记忆缓冲区中检索相关的记忆,并利用这些记忆为智能体的下一步行动生成计划。这些计划会用自然语言描述智能体的意图和行动的理由,它们也存储在情景记忆缓冲区,以供未来参考。这意味着NPC能够自主地设定和调整自己的计划和安排,他们会首先制定5到8个大概的计划,而后再将每个计划分成1小时的详细安排,再进一步到5到15分钟的细节安排。

反思:随着时间的推移,将智能体的记忆整合为更高级别的反射。这些反射也使用自然语言,总结智能体的经验、感受、意见和目标。它们同样存储在情景记忆缓冲区,能够用于指导智能体的行为或与其他智能体以及用户的交流。也就是说,NPC们会定期地回顾自己的记忆,并从这些记忆中提炼出一些想法,而且还会在这些凝练的思考中进一步反思。

这些组件协同地运转,使得这些生成式智能体形成了能反映他们个性、偏好、技能、目标的真实且可靠的行为。就像我们人类会随时调整计划一样,这些NPC也是一样。他们有了新的观察、发现——比如,环境发生变化、遇到其他智能体——都会触发他们调整自己的计划。而这些丰富的变化正是依赖于他们能够记忆和反思。

为了评估这些生成式智能体的拟人行为的可信度,研究者招募了25位人类参与者,为他们展示了不同类型的智能体的录像:生成式智能体、人类操纵的智能体、按剧本演绎的“智能体”以及随机式智能体。参与者需要在连贯性、一致性、个性、情感和社交性等方面对智能体的可行度评分。结果显示,在各个方面,生成式智能体的评分都高于剧本式“智能体”和随机式智能体。

在连贯性和一致性方面,生成式智能体的评分甚至高于人类,但在个性、情感及社交性方面,生成式智能体的评分较低。研究人员认为这很可能是源于自然语言模型在非语言线索上的局限性。

虽然仍有局限性,但这项研究提供了一个结合人工智能与交互式模拟的新概念,展示了创建拟人智能体的潜力。而生成式智能体的潜在应用可以预见,是极为广泛的,从创建身临其境的虚拟世界,到模拟人类行为来辅助研究和设计,再到教育领域等。

但也正是因为生成式智能体高度拟人,我们更需要审慎地考虑相关的道德伦理限制。否则就像《西部世界》故事的发展一样,这项技术也可能会从一个美好的设想不停地下陷,直到演变成一个反乌托邦的世界。

UUID: a0425025-fb18-421d-bc24-c9f042855b55

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/环球科学公众号-pdf2txt/2023/环球科学_2023-04-27_比人类更像人类!在这个虚拟小镇里,npc有了自己的想法.txt

是否为广告: 否

处理费用: 0.0099 元