大模型自主智能体爆火,OpenAI也在暗中观察、发力

作者: Lilian Weng

来源: 学术头条

发布日期: 2023-07-09 09:15:59

随着大语言模型的持续火爆,利用其构建AI智能体的研究陆续进入人们的视线。AI智能体这个概念也流行开来,不断突破人们的想象力。OpenAI安全系统负责人Lilian Weng写了一篇关于AI智能体的博客,认为AI智能体的核心驱动力是大语言模型,规划、记忆和工具使用是实现它的三个关键组件。

最近几个月,随着大语言模型的持续火爆,利用其构建AI智能体的研究陆续进入人们的视线。AI智能体这个概念也流行开来,不断突破人们的想象力。先是斯坦福大学、谷歌的研究者,他们成功构建了一个「虚拟小镇」,小镇上的居民不再是人,而是25个AI智能体。它们的行为比人类角色的扮演更加真实,甚至举办了一场情人节派对。

随后商汤、清华等机构提出了能够自主学习解决任务的通才AI智能体Ghost in the Minecraft (GITM),在《我的世界》中比以往所有智能体都有更优秀的表现。同一时间,英伟达开源的VOYAGER,也给AI圈带来了「小小的」的震撼。作为一个大模型驱动、可以终身学习的游戏智能体,VOYAGER在《我的世界》中玩出了高水平。

这些AI智能体的先后涌现,甚至让人认为是未来通用人工智能(AGI)的雏形。

很多AI领域的大佬和科技巨头对AI智能体的发展产生了极大兴趣并寄予了厚望。特斯拉前AI总监、今年年初回归OpenAI的Andrej Karpathy在一次开发者活动上透露,每当有新的AI智能体论文出现时,OpenAI内部就会非常感兴趣,并认真地进行讨论。那么不禁要问,AI智能体到底有哪些组成部分呢?

它的神奇之处又具体表现在哪些方面呢?近日,OpenAI安全系统(Safety Systems)负责人Lilian Weng写了一篇关于AI智能体的博客。她认为AI智能体的核心驱动力是大语言模型,规划(Planning)、记忆(Memory)和工具使用(Tool Use)是实现它的三个关键组件。

Lilian Weng于2018年加入OpenAI,在GPT-4项目中主要参与预训练、强化学习&对齐、模型安全等方面的工作。Lilian Weng对每个组件展开详细剖析,并提供了一些案例研究,比如科学发现智能体、生成式智能体模拟和概念验证示例。对于AI智能体未来将面临哪些挑战,她也给出了自己的观点。

智能体系统的概念在大语言模型(LLM)赋能的自主智能体系统中,LLM充当了智能体的大脑,其三个关键组件分别如下:首先是规划,它又分为以下内容:子目标和分解。智能体将大型任务分解为更小、可管理的子目标,从而高效处理复杂的任务;反思和完善:智能体可以对过去的行为展开自我批评和自我反思,从错误中吸取教训,并针对未来的步骤进行完善,提高最终结果的质量。

其次是记忆,分为了短期记忆和长期记忆:短期记忆:作者认为所有的上下文学习(参见提示工程)都是利用模型的短期记忆来学习。长期记忆:为智能体提供了长时间保留和回忆(无限)信息的能力,通常利用外部向量存储和快速检索实现。最后是工具使用:智能体学习调用外部API来获取模型权重中缺失的额外信息(通常在预训练后很难更改),包括当前信息、代码执行能力、对专有信息源的访问等。

UUID: 88ba1eb3-ac86-4dbb-9aed-6988b391997c

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/学术头条公众号-pdf2txt/学术头条2023年/学术头条_2023-07-09_大模型自主智能体爆火,OpenAI也在暗中观察、发力,这是内部人的分析博客.txt

是否为广告: 否

处理费用: 0.0105 元