为什么ChatGPT仿如⼗万个为什么回答机？

近⽇⼈⼯智能ChatGPT⽕爆全球，各路吃⽠⼈⼠纷纷晒出与它的对话，有些回答令⼈拍案叫绝，也有⼀本正经的胡说⼋道；还有⼈⽤其辅佐⽂案写作、修改代码，试图使其成为⼈类⼯作的好帮⼿。为什么ChatGPT可以万能陪聊，能回答我们的各种问题？OpenAI推出的聊天机器⼈chatGPT在全球范围内成为讨论的焦点。基于强⼤的GPT模型构建的chatGPT语⾔⽣成系统，拥有⾮凡的⾃然语⾔⽂本⽣成能⼒。

经过⼤量语料库预训练后，它能够胜任各种⾃然语⾔处理任务，不仅能根据⽤户要求⽣成出⼗分逼真的⽂本，如论⽂、新闻稿、诗词、代码等，还能回答你⼏乎⼀切的问题——上知天⽂下知地理。为什么它会这么强⼤？本⽂将对chatGPT背后的语⾔模型原理和发展历程做⼀个简单的介绍。

语⾔建模：⼀个基础的任务chatGPT背后是⼀个强⼤的语⾔模型，语⾔模型是什么呢？举个例⼦，我们都⽤过输⼊法语⾳转⽂字，⽽语⾔中是有很

多同⾳词的，譬如这家餐馆的爆炒鱿⻥真好吃！和这家餐馆的爆炒由于真好吃！机器如何根据语⾳来分辨到底说的是“鱿⻥”还是“由于”？这⾥就需要⽤到语⾔模型。语⾔模型的任务是，给定⼀个句⼦，判断该句⼦真正会出现的概率。⼀个好的语⾔模型，就会给第⼀句（鱿⻥）判定⼀个⾼概率，⽽给第⼆句（由于）判定⼀个低概率。

这个“神翻译”，显然就是缺少⼀个好的语⾔模型的结果。

那么，语⾔模型如何准确判断⼀个给定的句⼦真正出现的概率呢？机器要去读万卷书，使得它⾮常熟悉⼈类的语⾔，了解遣词造句的习惯。⽽这⾥的技术问题在于，我们如何设计⼀个算法或者程序来学习语⾔的模式，让机器“理解”⼈类的语⾔？