为什么ChatGPT仿如⼗万个为什么回答机?

作者: 陈清扬

来源: 返朴

发布日期: 2023-03-04 08:00:12

本文介绍了ChatGPT的强大自然语言生成能力,以及其背后的语言模型原理和发展历程。通过大量语料库预训练,ChatGPT能够胜任各种自然语言处理任务,并回答几乎所有问题。文章还探讨了语言模型的基础任务,以及如何通过算法和程序让机器理解人类的语言。

近⽇⼈⼯智能ChatGPT⽕爆全球,各路吃⽠⼈⼠纷纷晒出与它的对话,有些回答令⼈拍案叫绝,也有⼀本正经的胡说⼋道;还有⼈⽤其辅佐⽂案写作、修改代码,试图使其成为⼈类⼯作的好帮⼿。为什么ChatGPT可以万能陪聊,能回答我们的各种问题?OpenAI推出的聊天机器⼈chatGPT在全球范围内成为讨论的焦点。基于强⼤的GPT模型构建的chatGPT语⾔⽣成系统,拥有⾮凡的⾃然语⾔⽂本⽣成能⼒。

经过⼤量语料库预训练后,它能够胜任各种⾃然语⾔处理任务,不仅能根据⽤户要求⽣成出⼗分逼真的⽂本,如论⽂、新闻稿、诗词、代码等,还能回答你⼏乎⼀切的问题——上知天⽂下知地理。为什么它会这么强⼤?本⽂将对chatGPT背后的语⾔模型原理和发展历程做⼀个简单的介绍。

语⾔建模:⼀个基础的任务chatGPT背后是⼀个强⼤的语⾔模型,语⾔模型是什么呢?举个例⼦,我们都⽤过输⼊法语⾳转⽂字,⽽语⾔中是有很

多同⾳词的,譬如这家餐馆的爆炒鱿⻥真好吃!和这家餐馆的爆炒由于真好吃!机器如何根据语⾳来分辨到底说的是“鱿⻥”还是“由于”?这⾥就需要⽤到语⾔模型。语⾔模型的任务是,给定⼀个句⼦,判断该句⼦真正会出现的概率。⼀个好的语⾔模型,就会给第⼀句(鱿⻥)判定⼀个⾼概率,⽽给第⼆句(由于)判定⼀个低概率。

这个“神翻译”,显然就是缺少⼀个好的语⾔模型的结果。

那么,语⾔模型如何准确判断⼀个给定的句⼦真正出现的概率呢?机器要去读万卷书,使得它⾮常熟悉⼈类的语⾔,了解遣词造句的习惯。⽽这⾥的技术问题在于,我们如何设计⼀个算法或者程序来学习语⾔的模式,让机器“理解”⼈类的语⾔?

UUID: 8f97ac9c-368a-483e-998d-ac8572a81642

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/返朴公众号-pdf2txt/2023/返朴_2023-03-04_为什么ChatGPT仿如十万个为什么回答机?.txt

是否为广告: 否

处理费用: 0.0075 元