当量子计算遇到语言模型:量子互文性助力生成模型

作者: 董唯元

来源: 集智俱乐部

发布日期: 2023-06-06 08:01:56

量子互文性被认为是量子计算超越经典计算的根源,最新的研究显示,量子互文性可以提升神经网络的表达能力,为生成模型提供新的灵感,甚至可能揭示语言和人类意识中的量子效应。量子计算的应用有望使大规模生成模型小型化,预示着硅基生命的觉醒。

不仅语言中存在“互文性”,每个单词会受到邻近单词的影响,共同出现的概率比较高;量子特性使得同一量子系统上的不同测量结果之间也存在相互影响,这种“量子互文性”被认为是量子计算超越经典计算的根源所在。近日的一项最新研究发现,普遍的神经网络都可以利用量子互文性来提升模型的表达能力。这些发现有望为突破经典框架下的生成模型提供灵感,甚至帮助我们窥探到语言、甚至背后的人类意识中蕴含的量子效应。

量子互文性这个名称,也被借用来指代量子系统中的一种特性,即所谓“量子互文性”(quantum contextuality),意指同一量子系统上的不同测量结果之间存在的相互影响。这是一种因量子相干性而产生的神奇性质,可以实现经典机制无法达成的功能,因此被视为量子计算超越经典计算的根源所在。

量子系统为什么能构建出一个“+”总数既奇又偶的表格呢?原来,表格中“+”总数这个数值,就像薛定谔的猫一样,处在奇数和偶数的叠加态。更值得玩味的是,这个连“+”总数都无法确定的表格中,居然包含着使Alice和Bob可以一直获胜的那种结构。这正是量子互文性所提供的神奇效果。

自然语言中也有类似的性质。当一段文字展现在我们面前,在尚未理解其整体含义之前,我们就会先体会出这是否是句可理解的“人话”。在学校的英语课上折磨我们的那些语法规则和固定搭配之类的学问,就是对这种语言内在结构的归纳总结。

许多涉及概率相互“传染”的问题都可以被画成一个贝叶斯网络,n-gram模型也不例外。下图就是4-gram模型的贝叶斯网络。不熟悉贝叶斯网络的读者也不必深究,只需要大致了解这个图所描述的是,每个扫描框中4个单词的联合概率满足随着扫描框的移动,整段文字的概率就次递联系到了一起。

答案是肯定的。2022年,哈佛大学的一个研究团队在PRX上发表的论文中证明,在量子线路搭建的2-gram模型中,我们总可以添加一组恰当的操作,使这个模型模仿“人话”的能力,达到同等规模经典n-gram模型永远无法企及的程度。

透过这些理论研究进展,冥冥之中不由得生出种朦胧的感觉——也许人类的语言文字,乃至其背后的意识和思想,本就是根植于某些量子效应。我们目前所采用的所有经典框架下的生成模型,尽管成功如ChatGPT,依然依赖数以千万计的大量训练参数和计算资源,而量子机器的应用有希望将这些大模型小型化。当量子计算的处理规模与碳基生命神经系统相当之时,也正是硅基生命真正觉醒之日。

UUID: 5cde6aa7-2bf6-4ed3-8c83-18f458ec2a8e

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/返朴公众号-pdf2txt/2023/返朴_2023-06-06「转」_当量子计算遇到语言模型:量子互文性助力生成模型.txt

是否为广告: 否

处理费用: 0.0062 元