近⽇⼈⼯智能ChatGPT⽕爆全球,各路吃⽠⼈⼠纷纷晒出与它的对话,有些回答令⼈拍案叫绝,也有⼀本正经的胡说⼋道;还有⼈⽤其辅佐⽂案写作、修改代码,试图使其成为⼈类⼯作的好帮⼿。为什么ChatGPT可以万能陪聊,能回答我们的各种问题?OpenAI推出的聊天机器⼈chatGPT在全球范围内成为讨论的焦点。基于强⼤的GPT模型构建的chatGPT语⾔⽣成系统,拥有⾮凡的⾃然语⾔⽂本⽣成能⼒。
经过⼤量语料库预训练后,它能够胜任各种⾃然语⾔处理任务,不仅能根据⽤户要求⽣成出⼗分逼真的⽂本,如论⽂、新闻稿、诗词、代码等,还能回答你⼏乎⼀切的问题——上知天⽂下知地理。为什么它会这么强⼤?本⽂将对chatGPT背后的语⾔模型原理和发展历程做⼀个简单的介绍。
语⾔建模:⼀个基础的任务chatGPT背后是⼀个强⼤的语⾔模型,语⾔模型是什么呢?举个例⼦,我们都⽤过输⼊法语⾳转⽂字,⽽语⾔中是有很
多同⾳词的,譬如这家餐馆的爆炒鱿⻥真好吃!和这家餐馆的爆炒由于真好吃!机器如何根据语⾳来分辨到底说的是“鱿⻥”还是“由于”?这⾥就需要⽤到语⾔模型。语⾔模型的任务是,给定⼀个句⼦,判断该句⼦真正会出现的概率。⼀个好的语⾔模型,就会给第⼀句(鱿⻥)判定⼀个⾼概率,⽽给第⼆句(由于)判定⼀个低概率。
这个“神翻译”,显然就是缺少⼀个好的语⾔模型的结果。
那么,语⾔模型如何准确判断⼀个给定的句⼦真正出现的概率呢?机器要去读万卷书,使得它⾮常熟悉⼈类的语⾔,了解遣词造句的习惯。⽽这⾥的技术问题在于,我们如何设计⼀个算法或者程序来学习语⾔的模式,让机器“理解”⼈类的语⾔?