本文为《物理学咬文嚼字》027,原名为熵非商-the Myth of Entropy。熵是温度关于能量的共轭量,脱离温度理解熵,难免不着边际。此次趁"什么是温度?"一起发表之机,又增添了两条补缀。
就不易理解和容易误解这一点来说,entropy是非常特殊的一个物理量。Entropy的本意是一个同能量转换相关的热力学广延量,中文的熵,或热温商,是对克劳修斯公式形式上的直译。Entropy是一个具有深远意义的基础概念,量子力学以及后来的通讯理论都得益于熵概念之上的深入研究。
热力学是大学物理教育中不可或缺的一门基础课,我印象中这是一门教的人和学的人都倍感困惑的课程。
我在德国乡间一所大学读书的时候,在机械系一间实验室的窗框上读到过这样的一段话,原文记不住了,大意是"热力学是这样的一门课:你学第一遍的时候觉得它挺难,糊里糊涂理不清个头绪,于是你决定学第二遍。第二遍你觉得好像明白了点什么,这激励你去学第三遍;第三遍你发现好像又糊涂了,于是你只好学第四遍。等到第四遍,well,你已经习惯了你弄不懂热力学这个事实了。
"我一向认为笑话也是来自生活的,所以看到这段话我会心一笑。别人怎么回事我不知道,反正热力学于我来说大约就是这么样的困难。
况且,人家说这话的时候读的是自己的先辈克劳修斯、玻尔兹曼、普朗克等热力学奠基人用自己的母语撰写的书,而我们读的却是物理教师用中文转述或编或凑的课本。
你会发现中文热力学教科书热衷于在那儿来回捣鼓麦克斯韦关系式,但到底那些微分表示在什么情况下才是真正有意义的物理量,一个麦克斯韦关系表示的是什么物质体系的哪些物理量在什么条件下的关联,作者们似乎懒得理会。甚至各种自由能啊热力学势啊是针对什么样的体系提出的,是否都是基于同样地也需要证明和辩护的热力学第二定律,也是一笔糊涂账。
至于一百多年前一帮子英国人、法国人、德国人是如何艰难地凭经验构造热力学的,热力学如何导致量子力学关键概念的产生和薛定谔方程的推导,热力学又是如何发展成了统计力学的,这些问题更是鲜有提及。而热力学就一直这样被恐惧着、误解着,它在整个物理学体系中的重要性也未能得到充分的强调。如果要给热力学指定唯一的关键词的话,笔者以为最恰当的是entropy(汉译熵)。
熵是一个体系之作为热力学体系所特有的广延量,是热力学的灵魂。可以说,如果一个体系的物理学描述不出现熵这个物理量,它就不是一个热力学的问题。熵是和温度相联系的,实际上温度是熵关于能量的共轭,但温度并不总是可以定义的。
一般的印象是,所谓研究物质的热力学性质就是研究物质的某些特性随温度的变化,这里的一个未明言的假设是,我们关切的是一个同热库取得热平衡的体系,赫尔姆霍兹自由能是描述体系的合适的热力学势。
这种做法的好处是,温度是一个可操控的外部控制参数。温度一般会被混同于冷热的感觉,温度的概念比熵出现得早,但并不是说温度就比熵更基本。人们之所以把热力学性质看成是物理性质对温度的依赖而不是表达成同熵的关联,笔者揣测是因为人们还不习惯于面对熵这样的emergent的概念。熵是一个非常独特的概念,就不易理解和容易误解这两点来说,在整个物理学领域,熵都是鲜有其匹的一个词。
Entropy的概念是1865年克劳修斯正式引进的一个关于热力学体系的态函数,用来表述热力学第二定律,其本意是希望用一种新的形式来表达热机在其循环过程中所要满足的条件。考察一个闭合的过程,有,其中dQ是流入系统的热量,T是绝对温度。对于可逆过程,有。这说明对可逆过程,从状态A到状态B,不依赖于路径,有,所以说S是一个状态函数。实际上,无论循环是否是可逆的,在循环结束时,"工作介质"是恢复了原状的。
针对一个热力学体系,总可以定义这样的状态函数S,它是一个广延量,一个对气体、磁体、电介质来说是共性的东西。因为这个新物理量是同能量在物理意义上密切地联系在一起的,克劳修斯参照能量和转变,构造了一个和能量字面上贴近的新词entropy,意指这是一个描述能量转换的新概念。
克劳修斯的原文中用它来表示"转变的内容"。此外,heliotropism和geotropism也有助于对entropy的理解。
Trope还有回转的意思,这从Tropic of Cancer和Tropic of Capricorn两个词中可明显看出。Entropy一词传入中国,据文献说是在1923年5月25日。I. R.普朗克来南京讲学,在南京东南大学作《热力学第二定律及熵之观念》等报告,胡刚复教授为普朗克做翻译,首次将entropy译为熵。
其根据是公式ds=dQ/T,因为是热力学概念,从火;此表达式又是个除式,为商,故名为熵!文献中有"濮朗克教授(是否Max Planck待考)……讲‘热学之第二原理及热温商之意义’"的说法,但也未敢断言。笔者未能找到胡刚复教授翻译entropy的确切中文文献记载。
此外,笔者印象中德国物理学家名普朗克的对热力学有贡献的科学家就是Max Planck,虽然普朗克被认为是量子概念的创始人,但普朗克常数却是研究热力学的结果。
笔者翻阅德国物理学会纪念普朗克诞辰150周年文集和普朗克传记,也未见提起1923年曾访问中国一事。Entropy如何转变成了中文的"熵",这一点还盼国内科学史家详加考证。
中文熵,或曰热温商,确实易让人联想到除式ds=dQ/T而非能量转换的内在问题。此公式是计算工具,却不是entropy的定义。若由熵,或热温商,来理解entropy,难免误入歧途。其根据积分公式而来的汉译有其历史的合理性,但从根本上来说却是错误的,似乎熵的定义或计算依赖温度的存在。熵是比温度更基本的物理量,对温度无从定义的体系,熵一样是可定义、可计算的。
虽然历史上是由热力学第二定律导致了熵概念的引入,但热力学的叙述却可以从一开始就引入熵。
关于熵的性质,应注意到首先它是一个广延量,应有可加性:考察一个具有N1+N2粒子的热力学体系,设想用一个虚拟的隔板将体系分割成粒子数分别为N1,N2的两部分,则熵的定义或算法必须满足S(N1+N2)=S(N1)+S(N2)。
热力学的第一件要务是写出体系的内能U=U(S, V, N, P, M, ……),其中熵S、体积V和粒子数N对应的强度量分别是温度T、压强p和化学势μ,是体系的内在性质;而电极矩P和磁矩M对应的分别是外加电场和磁场。理解熵的第二个要点是它是一个emergent物理量。
Emergent本意是冒出来的、突然出现的;emergent物理量是指粒子数增多到某个临界值以上才出现的物理性质,同动量、能量这种对单个粒子也能很好定义的物理量相映衬。实际上,体积、压强也是emergent物理量,熵并不比体积或压力是emergent更难理解。
对于少粒子体系来说,粒子在容积为V的约束空间中游荡,我们很少会把一个大的真空室当作是几个分子气体体系的体积。
只当分子数足够多的时候在整个约束空间的每个小区域内的分子密度,或该空间区域被粒子访问的频率,都是抗涨落的,我们才把约束空间当作气体体系的体积。同样,对于几个粒子组成的体系,约束的表面会不规则地受到来自粒子的碰撞,但还没有压力的概念。只当分子数足够多的时候在整个约束面上的任意小邻域内单位时间得到碰撞的动量传输是抗涨落的,我们才把约束空间受到的碰撞笼统地用气体体系的压力来表征。
热力学不习惯从一开始就用S作为与V,N等同身份的基础变量来书写,可能是人们还不习惯于处理熵这样的比体积更不直观的emergent物理量。但近几年来emergent phenomenon的研究得到广泛的重视,连引力也可从呈展现象的角度看待,相信从一开始就用S,V,N展开热力学讨论的书籍会很快面世。这样的热力学,如同有人对经典力学做过的那样,是用一张PPT就能说清楚了的。
热力学很大程度上给人以经验科学的印象,时至今日许多教科书都直白地表露这一点。为了给热力学奠立坚实的理性的基础,其中至关重要的一点是如何理解不可逆性或热力学第二定律,玻尔兹曼为此进行了艰苦卓绝的探索。篇幅所限,不能详述玻尔兹曼的工作,此处仅指出玻尔兹曼基于原子假设,把事件的不可能性表述成了相应体系状态的极小概率。
他的伟大之处在于在1872~1875年间给出了熵的定量表达,1900年普朗克将它写成我们现在熟知的形式S=k logW,其中W应被理解为同体系热力学变量相恰的宏观状态数。不过,这里有个误解。用在这里的W是德语概率Wahrsheinlichkeit的首字母,状态数和某个状态出现的概率是倒数关系,故此公式中的W是理解为状态数还是概率问题不是太大,只相差一个负号。
后来出现的吉布斯熵、香农的信息熵,其定义都是基于概率的概念,所以都有一个负号。因为利用状态数有其便利的一面,为避免混淆,一些统计力学书中把熵公式写成S=k logΩ的形式,用Ω表示同宏观状态相恰的微观状态数。这个熵公式的美妙之处在于,若体系的状态数或几率具有可分解性,这在经典热力学和古典概率中是得到满足的,则熵应有可加性,这是熵作为一个热力学的广延量必须具备的性质。
考察这部分内容时,笔者有了“物理学唯赖天成”的感觉。熵公式是为了应付计算阶乘,factorial的麻烦,被鬼使神差地通过近似引导到对数函数的形式上的。而经典概率的可分解性,factorizability,恰恰通过对数函数保证了熵的可加性。奈何天意乎?而这般得窥天机的工作,是要耗费心血甚至要以生命为代价的。
玻尔兹曼的工作建立在原子论的基础上,而1900年前后人们还没有能力看到原子,对原子论的怀疑或责难也算情理之中的事情,这里面尤以马赫的名言“Haben Sie mal Atom gesehen(您见过原子吗?)”为代表。1906年,饱受压抑之苦的玻尔兹曼自杀身亡。巨星陨落,为后人留下无限的哀思。
热力学长期被看作是一门普通物理课,对近代物理中的量子力学、固体量子论等同热力学的渊源却强调不足。
许多人印象中,普朗克是量子力学的创始人,实际上他把一生都献给了热力学。2008年,德国物理学会纪念普朗克诞辰150周年纪念文集之一的题目就是"献给热力学的一生(Ein Leben für die Thermodynamik)"。爱因斯坦因对相对论、量子力学的贡献闻名于世,实际上他关于布朗运动和金刚石比热的工作已尽显大家风范,后者开启了固体量子论这门学科。
热力学才是一门高深的、又要求修习者具有天分的学科!有一种论断,认为提出量子论并非普朗克的本意,所以一直有"普朗克:违背自己意愿的革命家(Max Planck: Revolutionär gegen Willen?)"的说法。不考虑意愿的问题,就具体的工作来说,普朗克从假定的熵与内能的关系式出发拟合黑体辐射公式确是神来之笔。
记黑体辐射在频率ν处的单位体积平均能量为Uν假设,其中“h”是一未定常数,要求Uν/hν为无量纲量。由,可得,这实际上就是维恩公式。这当然只能同黑体辐射谱的高频部分拟合,但这个假设的熵的形式之二阶微分却给了普朗克以重大启发。如果(2)式右侧的表示在ν→0时,分母上的hν渐变为Uν,问题就可能得到解决。
普朗克把式(2)改写成,立即得到了,换算成能量的谱密度,就是,这个公式很好地拟合了黑体辐射的实验数据。这个公式公开几天之后,Kurlbaum就得出了h=6.65×10-34 Js。这时的“h”就是一个常数,它的量子力学意义是后来被赋予的。注意,公式(3)同现在的黑体辐射公式相差一个常数2,因为那时人们没认识到光子有自旋,更不理解光子的自旋为1为什么意味着存在两种(左旋和右旋)而不是三种模式。
有趣的是,1924年,玻色推导黑体辐射公式就暗含了光子有两种(以上)模式,所用方法就是玻尔兹曼曾采用的计算将N个全同粒子分配到不同状态上之可能状态数的那一套。
玻尔兹曼的熵公式是物理学史上最伟大的构造之一,是经验的热力学同其理性基础统计力学之间的桥梁。这个公式不仅仅属于热力学和统计力学,它的对外延伸同样给出了令人震撼的结果。熵公式的延伸,或曰借用,之一是量子力学的薛定谔方程。
1924年德布罗意提出了物质波的概念,论文在1925年被传到了瑞士苏黎世。德拜认为既然物质可以是波,是波则需要个波动方程。薛定谔接受了这个任务,于1925年的圣诞节到瑞士达沃斯小镇度假兼工作,由此完成了构造出量子力学波动方程的伟大工作。不过,在其1926年发表的两篇论文里,薛定谔的“那些推导过程其实根本不是推导,而仅是一个似乎可以接受的论证”。
薛定谔本来是从相对论出发的,但因为当时对电子自旋的认识还缺乏,故没能走通。薛定谔转而从老师玻尔兹曼的熵公式出发来构造波动力学。将公式S=k logW中的状态数W替换成另一个量ψ来描述波,S=k logψ,然后反过来写成的形式。这里虚数“i”使得该式变成了波动函数,引入就和量子搭上了关系。作为exp函数的变量,应该是无量纲的,这样看来,S就应该是某种作用量。
而经典力学里面本来就有关于作用量(不过那里不叫作用量,而是被笼统地用数学语言称为正则变换的生成函数,且碰巧也是用符号S表示的) 的Hamilton-Jacobi方程,这样后续的推导也就能回到经典力学了,由此就凑出了所谓的薛定谔波动方程。因此,就薛定谔方程而言,笔者看不出有什么和经典力学精神相异的东西。
热力学的另一个延伸是由香农于1948年做出的。参照1878年吉布斯给出的熵表达式,其中pi是微观状态“i”在系统涨落中出现的几率,香农提出了信息熵(一种关于事件发生的不确定性的度量)的定义,它反映了“发生概率越小的事件其发生包含越多的信息”的思想。香农信息熵的定义让信息的定量化成为可能,成了通讯理论的基础。
热力学第二定律将熵推到了作为热力学系统演化方向判据的位置:对于一个孤立的体系,体系的熵恒增加。熵增加意味着系统可能的状态数的增加,因此直观上熵增加就和系统的无序联系了起来。但是,熵同无序度之间的关系却存在误解。所谓熵增加对应状态数的增加,但状态数是相空间里的概念,并不必然地同坐标空间里的、视觉上的从有序到无序的变化相一致。熵增加在坐标空间中可能表现有序来,比如一定条件下小水珠会聚集成大水珠。
另一个值得注意的现象是,系统某个自由度上的熵的减小可能换来系统总熵的增加,但那个自由度上熵的减小所对应的有序,因为视觉上较明显容易让人误以为整个体系变得有序了。比如由棒状单元组成的系统,像类似细火柴棒的丝状液晶,水面漂浮的竹排,这些体系没有位置有序但可以自发地表现出长程的取向有序,因为沿着长轴方向的取向有序可以在横向方向上换来更大的活动自由,这显然是符合热力学第二定律的。
这种连江上放排的老乡都知道的事实,即体系一个自由度上熵的减小会换来其它自由度上熵的大增,却被一些科学家冠上了“熵驱动的有序”这样一个误导性的名称,实在匪夷所思。
熵增加过程被认为是体系的自发过程,它规定了时间的箭头。是不是熵减少的过程绝对不会发生呢?有一种观点认为答案是否定的,否定来自庞加莱1890年发表的循环定理。
考虑一个占据有限体积,能量有限的系统,庞加莱循环定理说,无论你的初始态如何,只要你等足够长的时间,系统会回到任意靠近这个初始态的一个态。既然是相空间的构型经过一个过程回到原点,则必然既有熵增加的时候,也有熵减小的时候,这和熵增加原理似乎存在不可调和的矛盾。笔者以为这个所谓的矛盾有关公战秦琼的味道。
庞加莱循环定理中描述经典力学运动的时间,同牛顿绝对时间一样是个数学的参数,在这个力学体系里,没有引入熵这个呈展的广延量,至少是未指明如何引入的。因此这个矛盾根本不成立!笔者这个观点是否正确,请方家指教!实际上,力学描述如何引入熵这个概念,而后才能共同建立起对体系的热力学描述,是理解统计力学的一个非常关键的问题。
遗憾的是,这一点在教科书里很少有人交代,笔者也一直未能读到热力学、统计力学奠基人在这方面的描述。
笔者注意到,统计力学自Hamiltonian力学出发,是在构造配分函数时手动添加进熵的共轭量温度的。这个配分函数的对数联系着体系的Helmholtz自由能,而熵是由公式才给出的。这个做法,即熵作为温度T的共轭量后给出,至少形式上会给人以熵的引入依赖于温度的存在的印象。事实当然不是这样。
熵这个概念虽然今天已被人们运用到了许多学科中去,但在关于热力学的文本中人们对熵感到生疏的历史痕迹依然还在。像玻尔兹曼常数,人们习惯用的物质比热,本质上都是熵。在相变和临界现象的实验研究中,常见人们测量比热却不从熵的角度深入讨论问题就是这种生疏感的表现。物理学研究固然需要以易测量的物理量来求得事实的佐证或应用的实施,但对于内涵的理解,还是应该建立在基础概念上。
熵的概念是一个丰富的矿藏,笔者未能窥其奥秘之万一,且一篇短文也不足以描绘神龙之首尾。匆匆收笔,留待有机会时再论。