数学家说:物理学是如此重要,不能全留给物理学家。物理学家说:信息和计算是如此重要,不能全留给计算机科学家。量子信息学是量子力学与信息科学、计算机科学的交叉学科。不同学科的科学家给交叉学科带来各自的特长。大数学家希尔伯特有句幽默的名言:“物理学如此重要,不能留给物理学家(Physics is too important to be left to physicist)。
”我们还可以说,信息和计算是如此重要,不能全留给计算机科学家。本文回顾物理学家是如何开启了量子信息学。在此道路上,物理学家也对经典的信息科学做出了贡献。当然,物理学对信息技术提供了硬件基础。电子计算机的器件(晶体管、存储器等)中的电子服从量子力学。信息是什么?信息的英文是information。信息是讯息(message)的内容,是对我们在获得该讯息之前对它的无知程度的度量,是对不确定性的降低。
信息的一个性质是,它可以编码成各种形式。比如,同样的思想可以用不同语言来表达。信息论中,信息用一个字符串来表达。信息不仅是个抽象的数学概念。信息离不开物理载体,又可在不同物理载体之间转换。信息处理过程是物理过程,受物理规律主宰。1991年,德裔美国人Rolf Landauer提出一个口号:“信息是物理的(Information is physical)”,倡导从物理的角度研究计算和信息。
1990年,美国人John Wheeler提出一个口号:“物质来自比特(It from bit)”。Wheeler和Landauer的思想影响了最早研究量子信息的一批人,可以称他们为量子信息学的祖父。综合这些思想,从信息和量子信息的角度考虑物理定律的层展(emergence),也是一个有意思的方向。
最早进入物理学的信息问题,可能是麦克斯韦妖佯谬。1867年,麦克斯韦在一封信里提出了这个佯谬。
在1871年出版的《热的理论(Theory of Heat)》一书中,他做了详细论述。1879,开尔文勋爵(William Thomson)将麦克斯韦假想的being称为麦克斯韦妖。麦克斯韦(James Clerk Maxwell,1831年6月13日-1879年11月5日)。1929年,作为博士论文,西拉德研究了麦克斯韦妖问题。
他用比特(容器的左右,他没有用比特这个名词)表示分子的位置状态,涉及到了信息(也没用这个词)。他提出麦克斯韦妖测量分子状态时,消耗能量,熵增加了kln2,抵消了气体分子的熵减少。这里k代表玻尔兹曼常数,ln是以e为底的对数。西拉德还提出一种利用信息的热机,也就是说,可以从信息提取功。
1948年,克劳德·艾尔伍德·香农(Claude Elwood Shannon,1916年4月30日-2001年2月26日)借助熵的概念,提出了信息论。香农定义了信息熵: S=-p1log_2(p1) -p2log_2(p2) ⋯ -pnlog_2(pn)。这里log_2代表以2为底的对数。香农证明了这S个字母组成的讯息可以压缩到nS比特。
也就是说,信息熵代表平均每个字母的信息量,定量刻画了信息存储与传输所需的资源。1961年,Rolf Landauer在IBM工作时提出了Landauer原理:每删除一个比特的信息,环境的熵至少增加kln2,也就是说,至少需要耗散能量kTln2。我们知道熵乘以温度T就是热量,也就是耗散到环境的能量。1973年,Bennett提出可逆计算的概念,指出原则上不需要能耗。
虽然很多逻辑运算是不可逆的,比如2+3和1+4都等于5,因此从输出结果5,不能唯一确定输入。但是不可逆运算可以嵌套在可逆运算中,也就是将输入信息也当作输出结果的一部分。1982年,他提出可逆图灵机模型。图灵机是最简单的计算模型。
在这些工作的基础上,1987年,Bennett给出了麦克斯韦妖佯谬的解决方案——对分子状态的测量本身可以不消耗能量,测量结果存储在妖的记忆中,气体的熵减少由妖的记忆的熵增加补偿。但是妖的记忆有限,为了存储新的测量结果,需要删除旧的记忆,因此必须将熵转移到环境,也就是说,必须耗散能量到环境中去。因此耗散的能量不是来自测量信息,而是来自删除信息。当然,如果将气体、妖、环境一起考虑,总熵总是不减少的。
信息与能量作为对前述若干概念的消化,我们看一下信息与能量的关系。如果事先知道某讯息(message,一串比特,如各分子的位置)的内容,删除这个讯息不需要消耗能量。例如,考虑一个盒子中有一个分子,如果知道它在盒子的哪半边,可设法用一个小盒子包住它,它对小盒子的每个壁都有碰撞,平均做功为零,因此我们在不做功的情况下将它转移到事先选好的盒子的一半(事先选定左边或者右边),也就是删除讯息。
因此,知道信息后,可以不费能量将其删除。而且,前面说过,还可以利用它,让分子对外做功。但是,如果不知道分子位置时,我们只能统一地将将盒子体积压到一半(事先选定左边或者右边)。这需要付出能量。19世纪的查尔斯·巴贝奇(Charles Babbage,1791年12月26日-1871年10月18日)设计了两个机械计算机,虽然都没能实际完成。
1837年,他又设计了可编程的机械计算机Analytic Engine,包含了计算机的主要元素。1941年,有人实现了他的设计。Babbage制作的AnalyticEngine的模型。(图源:Wiki)诗人拜伦的女儿Ada Lovelace为Analytic Engine写了程序,成为历史上第一位程序员。Babbage和Lovelock的照片曾经放在一起,作为英国50英镑新钞票上的候选人物。
但最终,另一位候选人图灵(Alan Turing)胜出。1937年,图灵提出了图灵机、普适图灵机和图灵假说,严格定义了计算和程序的概念。图灵假说是说,存在普适图灵机,可以模拟任何图灵机。这就是说,存在普适计算机,用程序就可以实现任何计算。1939年,物理学家John Vincent Atanasoff与他的学生Clifford Berry建造了第一台电子计算机。这是一台特定目的的计算机,不能编程。
它用2进制和布尔代数,能计算29个联立方程。硬件上,它由电子真空管实现计算,用电容器作内存,没有中央处理器(CPU)。物理学家 John Mauchly 和 J. P. Eckert设计了世界上第一台电子通用计算机,即ENIAC (电子数值积分计算机,Electronic Numerical Integrator And Computer),1946年建成。
ENIAC的第一个用途是冯诺依曼和乌拉姆的氢弹计算。Machley多次访问过Atanasoff,但是1944年之前,没有告知后者,自己也在造计算机。这使得Machley后来没有获得专利。电子计算机飞速发展。1950年代,每秒做1000次浮点运算。而现在的速度是148.6PFLOPS(P = 10^12)。
1965年,Gordon Moore总结出所谓的“Moore定律”:单个集成电路芯片上的晶体管数目大约每两年翻一番。从下图可以看出,Moore定律延续多年。晶体管越来越小,越来越快。如此下去,单个比特只需要原子尺寸。但是在原子尺寸,量子效应将起支配作用,适用于经典计算机的Moore定律也就不能延续。所以,一个思路就是,变不利为有利,干脆用量子力学作为新的计算(逻辑)原理。
利用量子力学的原理,特别是量子态叠加原理,完成计算任务,处理和传递信息,这就是所谓的量子计算与量子信息。
量子力学基本问题的研究量子计算与量子信息又与量子力学基本问题密切相联。
量子纠缠是超越任何经典关联的量子特性,研究始于爱因斯坦等人,经过戴维·玻姆(David Bohm,1917年12月20日-1992年10月27日)等人,后来由约翰·贝尔(John Bell,1928年6月28日-1990年10月1日)取得突破。单量子系统在这些研究中体现出重要性。以前,正如薛定谔所说,“我们从来不用单个电子或原子或小分子做实验。
在思想实验中,我们有时候假设能够做,这不可避免导致奇怪的后果……”事实上,当年的思想实验今天已经成为真实的实验,对于奇怪后果的探究导致量子物理基础和量子信息的进展。1982年,费曼提出,用经典计算机模拟量子过程需要指数级资源,而量子计算机则可以有效地模拟量子过程。1985年,英国物理学家David Deutsch提出量子图灵机和普适量子图灵机的概念。
1989年,他又提出由量子门组成的量子计算的线路模型。作为一个有实用意义的突破,1994年,美国人Peter Shor提出有效解决素数因子分解(寻找奇数的素数因子)的量子算法。在经典计算中,这个问题是一个NP问题,也就是说,需要的时间不是数字的二进制位数n的多项式函数。事实上,需要的时间是exp(O(n^3(log(n))^(2/3) ))。
而Shor的量子算法需要的时间只是O(n^2 log(n) loglog(n))。f=O(g)的意思是,|f/g|介于两个有限正数之间。量子计算的算法基于纠缠态的运用。量子纠缠也导致量子通信,比如量子隐形传态。而量子密码的某些方案基于海森堡不确定关系,某些方案基于量子纠缠。
2017年,意大利的国际理论物理中心将狄拉克奖授予Bennett,Deutsch 和Shor,以表彰他们用量子力学的基本概念解决计算和信息的基本问题,从而将量子力学、计算机科学和信息联系在一起。
小结信息是物理的。因此经典计算和经典信息基于经典物理,而量子物理导致量子计算和量子信息。突破“Moore定律”的需要,经典信息和经典计算的量子推广,量子力学基本问题的探究,形成合力,催生了量子信息和量子计算。