为什么GPT无法输出恰好10个字？

最近，大家可能都听说了各种风靡互联网的聊天机器人，它们的背后是GPT模型。作为强大的大语言模型，GPT已经展现出了令人惊叹的实力。写邮件，学英语，帮忙看文献，已然成为了许多人的生活好帮手。但今天我们不是要夸它，而是要展示一个看似很简单的事情，但是GPT却完全无能为力。要解释为什么GPT无法胜任这么简单的任务，我们首先需要从GPT的底层原理——自回归模型开始讲起。

自回归模型能做的事情其实和猜单词类似，GPT在工作的时候就像猜词一样，只是把字母换成了token。GPT会依据给定地语境，在可能的不同输出选项中计算概率，并按照这个概率进行输出。GPT欠缺的两种能力缺少规划，自回归模型每次抽样都是根据当前信息（当前语境），在抽样的过程中对全局缺少规划。反省和修订，自回归模型不具有“反省并修订”的能力。