清华、智谱AI团队:自动网页导航智能体AutoWebGLM

作者: GLM技术团队

来源: GLM大模型

发布日期: 2024-04-25 19:22:06

清华、智谱AI团队发布了一款名为AutoWebGLM的自动网页导航智能体,该智能体基于ChatGLM3-6B模型,能够自主完成复杂的现实世界中的任务,并在多个评测集上表现优于GPT-4。

清华、智谱AI团队发布了一款名为AutoWebGLM的自动网页导航智能体。AutoWebGLM借助LLM(大型语言模型)强大的理解和响应能力,能够自动完成人类世界中的复杂操作,如自动总结最新新闻,自动安排日程等。这种能力不仅能提升生活效率,还将重新界定机器辅助生产力的边界。然而,不同的网站具有复杂的任务操作,目前依然缺乏一个统一的、跨越各类网站所有必要任务的行为空间。

网页的多样性、复杂性以及网页内容的冗长,对执行正确操作都带来一定的挑战,目前缺乏一个有效的网页简化方法。由于缺乏高质量的操作轨迹数据,目前基于LLM的Agent在网页任务上正确推理和自我检查的能力明显不足,一旦陷入错误循环,很难迅速纠正问题。基于这些考虑,清华、智谱AI团队提出了AutoWebGLM框架。这是一个基于ChatGLM3-6B模型的自动网页浏览Agent框架。

与其前身——专注于检索增强的WebGLM不同,AutoWebGLM会像人类一样去操作真实的网页,从而能够自主完成复杂的现实世界中的任务。在多个评测集上,AutoWebGLM相比GPT-4有较大的性能提升。项目地址:https://github.com/THUDM/AutoWebGLM,论文地址:https://arxiv.org/pdf/2404.03648.pdf。

UUID: 7f2d089a-b111-45f5-a115-4d75dd80f301

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/学术头条公众号-pdf2txt/学术头条2024年/学术头条_2024-04-25_「转」清华、智谱AI团队:自动网页导航智能体AutoWebGLM.txt

是否为广告: 否

处理费用: 0.0034 元