用电子计算机执行自然语言处理任务,已经取得诸多进展。但是,如果是用量子计算机呢?
英国时间2021年3月2日,一家名为Cambridge Quantum Computing(下文简称CQC)的创企宣布,他们在量子计算机上实现了有史以来最大规模的量子计算自然语言处理任务。
“多个独立实验强有力地证明了,量子自然语言处理触手可及”,在一份声明中,该公司如此介绍道。
与该成果相关的研究论文QNLP in Practice: Running Compositional Models of Meaning on a Quantum Computer则已刊登在预印本网站Arxiv上。该论文详细介绍了这些实验,展示了NLP任务是如何在量子计算机上实现的。
文中写道:“总而言之,本文的贡献如下:首先,我们概述了在量子计算机上训练和运行NLP模型的过程、技术和挑战;其次,我们提供了一个强大的概念证明,即量子NLP(QNLP)即将到来”。
本次成果中,硬件上使用了IBM的量子计算机完成,而CQC则负责将句子实例化为参数式的量子线路,并根据句子语法结构,将单词含义嵌入为“纠缠”的量子态。
量子计算提供了一种革新计算机的方法,量子计算机可以利用量子理论、叠加和纠缠的特性来进行与经典计算机完全不同的计算。使用量子计算机加速AI算法的训练是一种具备前瞻性的方法。
量子自然语言处理处理,便是在量子硬件上运行NLP模型。CQC团队在论文介绍,他们根据Coecke等人提出的意义组成模型的形式相似性和量子理论,创建了具有与量子电路自然映射关系的句子表示形式,然后在NISQ计算机上进行实验结果,使用了包含超过100个句子的数据集进行训练。结果证明,这些表示成功训练并实现了两个NLP模型,可以解决基于量子硬件的简单句子分类任务。
值得一提的是,这次实验使用的量子计算机是NISQ计算机。这个概念由加州理工学院理论物理学家John Preskill在2017年12月5日的量子商业计算机大会上提出。NISQ,Noisy Intermediate-Scale Quantum,表示“带噪声的中型量子计算”。
CQC团队认为,即便是在NISQ时代,量子算法的开发依然刻不容缓。他们此次实验的目标之一,便是描述量子自然语言处理(QNLP)及其结果,使之能够被NLP研究人员及从业者理解,从而为NLP社区进一步参与语言处理的量子编码铺平道路。
公开资料显示,CQC成立于2014年,是英国一家量子计算软件初创公司。早在去年4月,CQC曾宣布他们在量子计算机上执行的自然语言处理测试获得成功,且为全球首次成功案例。在那之后,CQC研发的首款量子计算机通用系统Deltaflow.OS诞生。2020年12月,CQC完成了4500万美元的融资(约合人民币2.9亿),投资方包括Honeywell Venture Capital、IBM等。