为什么GPT无法输出恰好10个字?

作者: 仰旗

来源: 中科院物理所

发布日期: 2024-04-08 13:47:06

本文探讨了GPT模型在输出恰好10个字这一简单任务上的无能为力,分析了其背后的自回归模型原理,并指出该模型在规划和反省修订能力上的欠缺。

最近,大家可能都听说了各种风靡互联网的聊天机器人,它们的背后是GPT模型。作为强大的大语言模型,GPT已经展现出了令人惊叹的实力。写邮件,学英语,帮忙看文献,已然成为了许多人的生活好帮手。但今天我们不是要夸它,而是要展示一个看似很简单的事情,但是GPT却完全无能为力。要解释为什么GPT无法胜任这么简单的任务,我们首先需要从GPT的底层原理——自回归模型开始讲起。

自回归模型能做的事情其实和猜单词类似,GPT在工作的时候就像猜词一样,只是把字母换成了token。GPT会依据给定地语境,在可能的不同输出选项中计算概率,并按照这个概率进行输出。GPT欠缺的两种能力缺少规划,自回归模型每次抽样都是根据当前信息(当前语境),在抽样的过程中对全局缺少规划。反省和修订,自回归模型不具有“反省并修订”的能力。

UUID: 89c44faa-e5a8-4aba-9c0e-a1a645f42d66

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/中科院物理所公众号-pdf2txt/2024/中科院物理所_2024-04-08_GPT那么强,居然说不了恰好10个字?.txt

是否为广告: 否

处理费用: 0.0034 元