在数学研究以及实际应用中,经常会涉及各种发散级数。数学家们试图给这类发散级数客观地指派一个实或复的值,定义为相应级数的和。本篇介绍了发散级数两种最著名的广义求和方法,解读切萨罗求和背后的平均化思想和遍历理论,并给出了一个有趣等式的证明。
学过初等微积分中关于无穷级数收敛理论的读者,看到本文标题后,或许会问:“级数既然发散,岂能求和?”不错,他们的质疑精神可嘉,应该大力提倡。
不过本文要讲的是,怎样求发散级数的“广义和”。这是个有趣也有用的问题,因为不仅在数学上许多级数不幸是发散的,在物理上也是如此。正如力学家孙博华教授最近告诉我的,对描绘非平衡态热力学系统之统计行为的玻尔兹曼方程,求解“查普曼-恩斯科格展开”,就面临着棘手的发散级数问题。
收敛还是发散,这是个问题。
任何标准的微积分教科书中都严格定义了何时称一个级数“收敛”、什么是收敛级数的“和”,以及何时称一个级数是“发散”的。给定一个无穷级数,其中a_n是实数无穷数列,称为该级数的通项。定义所给级数的部分和数列,即s_n是级数的前n项的和。因为项数是有限的,所以每一个部分和s_n都是可以计算出的数。如果部分和数列s_n当n趋向于无穷大时收敛到一个数s,即s_n → s,则称级数是收敛的并且收敛到s。
这时s叫做该级数的和,写成s=∑a_n。在此情形下,s具有确定的数学意义,它代表了一个叫做“级数和”的实数。反之,如果部分和数列s_n当n趋向于无穷大时不收敛到一个数(也称发散),所给级数也被说成是发散的,这时,只是一堆数学符号的混合体而已,不代表任何数,没有任何数学意义,遑论求和了。
然而,无穷级数的求和基于对“求和”的合理定义,既然经典的定义不能对级数求和,我们寻找的是能不能补充定义,对它“广义求和”。
发散级数的“广义求和”首先需要一个合理的定义。这里的合理性自然包括要满足两个基本要求。一个是,如果级数本身在通常的意义下已经收敛,由广义求和法得到的“和”就应该等于级数在原先意义上的和。这个要求说明“广义求和”具有“狭义求和”的“遗传性”。
另一个要求是基于传统求和法的线性性质。我们知道,微积分中的许多运算如极限、求导、求积分等都具有线性特征,例如求导代数法则[af(x)+bg(x)]' = af'(x) + bg'(x)。对于级数而言,也有类似的断言:如果和均为收敛级数且c和d为常数,则级数c∑a_n + d∑b_n也是收敛的,而且有等式∑(ca_n + db_n) = c∑a_n + d∑b_n。
我们希望发散级数的广义求和法也保持这个性质。
怎样定义满足如上两个合理条件的发散级数广义求和法呢?一个好的思路是“平均化处理”,或用更时髦的专业术语:“切萨罗算术平均法”。这个法子是用来对付不收敛数列的,而级数的收敛性或发散性,根据定义,实际上是关于给定级数的部分和数列而言的。所以我们来考虑怎样让一个不收敛的数列转变为一个“收敛数列”。先举个简单例子。考虑数列a_n = (-1)^(n-1)。
它是1和-1交替出现的无穷数列,当然不收敛。然而如果我们取这个数列的前n项的算术平均值,得到的称为原数列a_n的切萨罗算术平均数列,它的各项写出来就是A_n = (1/n)∑(i=1到n)(-1)^(i-1),所以当n趋向于无穷大时A_n趋向于0。这样,对于这个发散的数列,通过平均化处理,我们获得了一个收敛的数列。
一般地,对于一个数列a_n,如果它对应的切萨罗算术平均数列收敛并收敛到极限L,则称原数列a_n在切萨罗算术平均的意义下收敛并收敛到L。平均化思想不仅在数学上对数列的收敛性有巨大帮助,而且它也让统计物理成长为一个令人尊敬的学科。甚至对于人类社会的福祉和安定,现代国家在税收上实行的“富人多缴税穷人拿福利”政策,体现的多半也是仁慈的平均化思想。
切萨罗(Ernesto Cesáro,1859-1906)是意大利的微分几何学家。尽管他写过一本关于内蕴几何的书,其中描绘了现被称为“切萨罗曲线”的一类分形,以及几本微积分教材,但他提出让可能发散的数列收敛的平均化途径,或许对后世的影响最大。读者自然会问,如果数列本来就已收敛,那么它的切萨罗算术平均数列也收敛并收敛到同一极限吗?答案是“Yes”。
这是数列极限理论中的一个简单命题,在这里我们不妨把它证出来,顺便复习一下极限的“ε-N”语言。设a_n → L。任给正数ε,存在自然数M,使得对所有的自然数n > M,不等式|a_n - L| < ε/2成立。现在,对n > M,有A_n = (1/n)∑(i=1到n)a_i,因此存在自然数N > M使得当n > N时,|A_n - L| < ε。证毕。
另外显然,切萨罗平均运算是线性的,即数列c*a_n + d*b_n的切萨罗平均等于c乘以a_n的切萨罗平均加上d乘以b_n的切萨罗平均。再取极限可见,切萨罗平均的极限运算满足线性性质。这样,如果把用于发散数列的切萨罗算术平均法移植到对于发散级数的广义求和,这个方法满足前面提出的遗传性和线性两个基本要求。
综上所述,我们有了发散级数的切萨罗广义求和算术平均法:对于给定的发散级数,如果它的部分和数列在切萨罗算术平均的意义下收敛到极限s,则称原级数在切萨罗算术平均的意义下有广义和s。由前面我们知道,如果级数本身已经收敛到和s,那么它也在切萨罗算术平均的意义下收敛到广义和s。此外,切萨罗广义求和算术平均法是线性的广义求和法。
举一个历史上既简单又著名的发散级数例子:1 - 1 + 1 - 1 + …。
它的部分和数列是s_n = [1 - (-1)^n]/2。对所有的自然数k:s_{2k-1} = 1和s_{2k} = 0,故数列s_n不收敛,因此级数发散。另一方面,部分和数列s_n的切萨罗算术平均数列为A_n → 1/2。因此,所给级数在切萨罗算术平均意义下的广义和为1/2。
之所以要举出上面的这个例子,是因为十八世纪的瑞士人欧拉(Leonhard Euler,1707-1783)对这个级数也曾经给出和为1/2的结论。
然而这位历史上最多产的数学家玩起无穷级数来,有时玩得太自由了,因为他偶尔会自作主张地给幂级数在不收敛的点处赋上一个值,上面的欧拉的答案就是这样得出的:他知道著名的幂级数求和公式(这是公比为r的几何级数等式的直接结果,其中|r| < 1),于是他轻率地在等式两边代入x=1,得到等式1/2 = 1 - 1 + 1 - 1 + …。然而,这离真理还差了一步。
今天,每一个学过初等级数理论的理工科大学生都知道上述幂级数的收敛半径为1,且收敛区域仅仅是开区间(-1, 1)。所以欧拉用了错误的幂级数赋值法所得到的是发散级数的广义和。其实,如果他将-1分别乘以如上幂级数展式的两端,得到一个非幂级数形式的函数项级数,然后再如法炮制地代入x=1,便有同一常数项级数的另一个“和”,这是多么荒唐的“数学”啊!
不过,如果欧拉不用直接赋值法,而是对等式左端的函数1/(1+x)取时的极限,就得到与切萨罗广义求和算术平均法结果相同的另一种意义下的广义和。将这个法则一般化,我们就得到了发散级数的第二个经典的广义求和法:对于给定的发散级数,形式上写出对应的幂级数。
如果这个级数关于满足不等式0 < x < 1的每一个数x都收敛(换句话说,此幂级数的收敛半径不小于1),并且它的和函数f(x)当x → 1-时有极限,则此值s称为给定级数在泊松-阿贝尔幂级数意义下的广义和。
这个方法曾由法国数学家泊松(Siméon Denis Poisson,1781-1840)用于三角级数这一特殊的情形,但其思想根植于下段中定理的主人的挪威伟大却早逝的数学家阿贝尔(Niels Henrik Abel,1802-1829),所以让他们共享这个命名荣誉是合适的。
“基于幂级数和函数极限意义下的广义和”的定义陈述,让我们想起了微积分中关于幂级数在收敛区间端点性质的阿贝尔定理:假设幂级数的收敛半径为R > 0。若收敛,则该幂级数在闭区间[0, R]上是一致收敛的。
“函数项级数在点集A上一致收敛到和函数f(x)”这个性质大大强于它在A上逐点收敛到f(x),后者的定义是:在A中一点x收敛到数f(x)是指对于任意的正数ε,存在自然数N=N(x, ε),使得当n > N时,|f_n(x) - f(x)| < ε成立。由此可见,逐点收敛定义中的自然数N不仅依赖于ε,也依赖于x。
至于一致收敛,在它的定义中,自然数N取值不依赖于A中的点x:在A上一致收敛到f(x),若对任意的正数ε,存在自然数N=N(ε),使得当n > N时,对A中所有的x,都有|f_n(x) - f(x)| < ε。因为一致收敛是数学分析中的重要概念,我给出一个不一致收敛的级数例子,还是请我们的老朋友几何级数帮忙吧。该级数在A=[0, 1)上处处收敛。
如果它在A上一致收敛到和函数1/(1-x),那么对于一个具体的正数ε=1,存在自然数N,使得不等式对[0, 1)中的所有x都成立。然而初等代数提醒我们,只要x接近1,就有|f_n(x)| → ∞,这导致矛盾。因此几何级数在[0, 1)上不是一致收敛的。倘若有读者理解上一段有点困难,可以这样想象“非一致收敛”:设想一群好汉同一批骏马同时奔向十里以外的目的地。
虽然这些人和马迟早都会跑到终点,然而骏马却远远地将长跑好手甩在后头。如果把这一赛事视为函数数列,那么每位选手都“收敛”,然而马与人之间悬殊的速度差距导致到达终点的快慢“不是那么一致的”。
在A上一致收敛有个令人喜悦的好处,就是只要函数项级数中的每一项函数都在A上连续,那么级数的和函数也一定在A上连续。
回到阿贝尔定理的结论,因为幂级数中的每一项都是幂函数,自然是处处连续的,故只要收敛,则幂级数的和函数f(x)在[0, R]上连续,特别就有f(1) = s。因此如果级数已经收敛到一个实数s,那么幂级数在x=1收敛,故由阿贝尔定理可知,它在闭区间[0, 1]上一致收敛到连续的和函数f(x),因而有极限s。这说明,泊松-阿贝尔基于幂级数的广义求和法具有遗传性。
它的线性性质则来自数列、级数以及极限关于代数运算的线性性质。所以我们有了第二个满足遗传性和线性基本要求的广义求和法。
那么,切萨罗广义求和算术平均法与泊松-阿贝尔广义求和幂级数法有关系吗?有。它们的基本关系是:如果发散级数能用前者广义求和,那么用后者也行,并且两种广义和相等。
这个结果称为弗罗尼乌斯定理,证明如下:对给定的级数,由假设,其部分和数列s_n的切萨罗算术平均数列A_n = (1/n)∑(i=1到n)s_i收敛到数s,故对任给的ε > 0,存在自然数N使得当n > N时,|A_n - s| < ε。简单计算便得到关系nA_n - (n-1)A_{n-1} = s_n,故有s_n = nA_n - (n-1)A_{n-1}。
上式推出s_n → s,后者也保证幂级数在开区间(0, 1)内收敛到一个函数f(x)。由于数列A_n有界且幂级数的收敛半径为1,可知级数对0 < x < 1收敛,从而有另一个方面,对任何级数逐项求导得f'(x) = ∑a_nx^{n-1},故有f(1) = s。
综上所述,对开区间(0, 1)中的每一个x,我们有f(x) = ∑a_nx^n,因为N是已经取定的正整数以及s是一个常数,故当x → 1-时上面最后不等式右端的第一项和第三项均趋向于0,因此存在δ > 0使得当0 < 1-x < δ时,它们都小于ε,故由于ε是任意的正数,这就证明了s = f(1)。
事实上,泊松-阿贝尔广义求和幂级数法比切萨罗广义求和算术平均法强。
为了说明这一点,给出一个简单例子。考虑明显的发散级数(因为它的通项数列不趋向于0,违背了级数收敛的必要条件:若级数收敛,则通项数列a_n → 0)。1 - 2 + 3 - 4 + 5 - 6 + …。由于不趋向于0,切萨罗广义求和算术平均法成功的必要条件不成立,故此法不适用。
但另一方面,由于幂级数在区间(0, 1)上有和,它当x → 1-时趋近于极限1/4,因此这个数是上述常数项发散级数在泊松-阿贝尔幂级数意义下的广义和。
在发散点上求傅里叶级数的广义和更能体现泊松-阿贝尔方法相对于切萨罗方法的优越之处。设f(x)为一个周期为2π的周期函数,其绝对值函数在任意有界区间上可积。考虑它的傅里叶级数,其中a_n和b_n是函数f(x)的傅里叶系数。
当固定x后,对于这个级数应应用泊松-阿贝尔广义求和法。为此,我们建立关于变量r(因为字母x此时另有他用)的幂级数f(x, r) = ∑(n=0到∞)(a_n cos(nx) + b_n sin(nx))。
傅里叶系数的一个基本性质就是a_n和b_n当n趋向于无穷大时都趋向于0,故上面幂级数的“系数数列”a_n cos(nx) + b_n sin(nx)一致有界,这推出该级数当0 < r < 1时收敛,记其和为f(x, r)。将傅里叶系数的表达式代入,运用余弦函数的两角差公式,且注意到对一致收敛级数可以逐项求积分的理由,得f(x, r) = ∫(0到r)f(x, t)dt。
再利用代数恒等式,便得f(x, r)的积分表达式。上面用到的代数恒等式可通过将左端乘上右端的分母,再利用三角学中的和差化积公式化简得之,但此法繁琐。可用复数简证之:令z = x + iy。考虑黎曼ζ-函数ζ(z) = ∑(n=1到∞)(1/n^z)。当z的实部x > 1时,上面的狄利克雷级数收敛到和ζ(z)。
将乘以级数的两端,得两式相减便有右端的交错狄利克雷级数在它的收敛区域内定义了狄利克雷η-函数η(z)。故有函数等式η(z) = (1 - 2^{1-z})ζ(z),它对所有使得两个级数收敛的复数z为真。虽然z = -1导致级数发散,但是可以通过复分析中的解析延拓,使得该等式对于z的更大区域依然成立。这个区域包含-1,因此-3ζ(-1) = η(-1)。
而解析延拓后的值η(-1)就等于1 - 2 + 3 - 4 + …的泊松-阿贝尔基于幂级数的广义和1/4;这点也可以在等式中令z = 1并注意到Γ(1) = 1和η(2) = π^2/12得到。由此得出
写于2023年12月9日星期六美国哈蒂斯堡夏日山庄
致谢:感谢西安建筑科技大学力学技术研究院孙博华院长鼓励作者写作本文并提供建议。
出品:科普中国