陶哲轩：什么是好数学

Terence Tao

赛先生

2017-01-02 07:10:35

（图片来源：网络）

撰文

Terence Tao

翻译

卢昌海

译者序本文译自澳大利亚数学家 Terence Tao 的近作 "What is Good Mathematics?"。Tao 是调和分析、微分方程、组合数学、解析数论等领域的大师级的年轻高手。

2006年，31岁的 Tao 获得了数学界的最高奖 Fields 奖，成为该奖项七十年来最年轻的获奖者之一。美国数学学会（AMS）对 Tao 的评价是："他将精纯的技巧、超凡入圣的独创及令人惊讶的自然观点融为一体"。

著名数学家 Charles Fefferman（1978年的 Fields 奖得主）的评价则是：“如果你有解决不了的问题，那么找到出路的办法之一就是引起 Terence Tao的兴趣”。Tao 虽然已经具有了世界性的声誉，但由于他的年轻，多数人（尤其是数学界以外的人）对他的了解仍很有限。

Tao 的这篇短文在一定程度上阐述了他的数学观，在这一点上类似于英国数学家 Godfrey Hardy 的名著 "A Mathematician's Apology"，相信会让许多读者感兴趣（如果哪位读者想接受 Fefferman 的忠告，让自己的问题有朝一日引起 Tao 的兴趣，那么读一读这篇文章可能会有所助益）。

不过 Tao 的这篇文章远比 "A Mathematician's Apology" 难读得多。从表面上看，它不带任何数学公式，这点甚至比 "A Mathematician's Apology" 做得更为彻底，但实际上，文章的主要部分所涉及的数学概念相当密集，足以给非数学专业的读者造成很大的困难，因此译文对译者知识所及且能用简短方式加以说明的若干概念进行了注释。

本译文略去了原文的摘要、文献及正文中单纯与文献有关的个别文句。

数学品质的诸多方面我们都认为数学家应该努力创造好数学。但 "好数学" 该如何定义？甚至是否该斗胆试图加以定义呢？让我们先考虑前一个问题。我们几乎立刻能够意识到有许多不同种类的数学都可以被称为是 "好" 的。

比方说，"好数学" 可以指（不分先后顺序）：好的数学题解（比如在一个重要数学问题上的重大突破）；好的数学技巧（比如对现有方法的精湛运用，或发展新的工具）；好的数学理论（比如系统性地统一或推广一系列现有结果的概念框架或符号选择）；好的数学洞察（比如一个重要的概念简化，或对一个统一的原理、启示、类比或主题的实现）；好的数学发现（比如对一个出人意料、引人入胜的新的数学现象、关联或反例的揭示）；好的数学应用（比如应用于物理、工程、计算机科学、统计等领域的重要问题，或将一个数学领域的结果应用于另一个数学领域）；好的数学展示（比如对新近数学课题的详尽而广博的概览，或一个清晰而动机合理的论证）；好的数学教学（比如能让他人更有效地学习及研究数学的讲义或写作风格，或对数学教育的贡献）；好的数学远见（比如富有成效的长远计划或猜想）；好的数学品味（比如自身有趣且对重要课题、主题或问题有影响的研究目标）；好的数学公关（比如向非数学家或另一个领域的数学家有效地展示数学成就）；好的元数学（比如数学基础、哲学、历史、学识或实践方面的进展）；严密的数学（所有细节都正确、细致而完整地给出）；美丽的数学（比如 Ramanujan 的令人惊奇的恒等式；陈述简单漂亮，证明却很困难的结果）；优美的数学（比如 Paul Erdős 的 "来自天书的证明" 观念；通过最少的努力得到困难的结果）；创造性的数学（比如本质上新颖的原创技巧、观点或各类结果）；有用的数学（比如会在某个领域的未来工作中被反复用到的引理或方法）；强有力的数学（比如与一个已知反例相匹配的敏锐的结果，或从一个看起来很弱的假设推出一个强得出乎意料的结论）；深刻的数学（比如一个明显非平凡的结果，比如理解一个无法用更初等的方法接近的微妙现象）；直观的数学（比如一个自然的、容易形象化的论证）；明确的数学（比如对某一类型的所有客体的分类；对一个数学课题的结论）；其它。

如上所述，数学品质这一概念是一个高维的概念，并且不存在显而易见的标准排序。我相信这是由于数学本身就是复杂和高维的，并且会以一种自我调整及难以预料的方式而演化；上述每种品质都代表了我们作为一个群体增进对数学的理解及运用的不同方式。至于上述品质的相对重要性或权重，看来并无普遍的共识。

这部分地是由于技术上的考虑：一个特定时期的某个数学领域的发展也许更易于接纳一种特殊的方法；部分地也是由于文化上的考虑：任何一个特定的数学领域或学派都倾向于吸引具有相似思维、喜爱相似方法的数学家。它同时也反映了数学能力的多样性：不同的数学家往往擅长不同的风格，因而适应不同类型的数学挑战。

我相信 "好数学" 的这种多样性和差异性对于整个数学来说是非常健康的，因为它允许我们在追求更多的数学进展及更好的理解数学这一共同目标上采取许多不同的方法，并开发许多不同的数学天赋。虽然上述每种品质都被普遍接受为是数学所需要的品质，但牺牲其它所有品质为代价来单独追求其中一两种却有可能变成对一个领域的危害。

考虑下列假想的情形：一个领域变得越来越华丽怪异，在其中各种单独的结果为推广而推广，为精致而精致，而整个领域却在毫无明确目标和前进感地随意漂流。一个领域变得被令人惊骇的猜想所充斥，却毫无希望在其中任何一个猜想上取得严格进展。一个领域变得主要通过特殊方法来解决一群互不关联的问题，却没有统一的主题、联系或目的。

一个领域变得过于枯燥和理论化，不断用技术上越来越形式化的框架来重铸和统一以前的结果，后果却是不产生任何令人激动的新突破。一个领域崇尚经典结果，不断给出这些结果的更短、更简单及更优美的证明，但却不产生任何经典著作以外的真正原创的新结果。在上述每种情形下，有关领域会在短期内出现大量的工作和进展，但从长远看却有边缘化和无法吸引更年轻的数学家的危险。

幸运的是，当一个领域不断接受挑战，并因其与其它数学领域（或相关学科）的关联而获得新生，或受到并尊重多种 "好数学" 的文化熏陶时，它不太可能会以这种方式而衰落。这些自我纠错机制有助于使数学保持平衡、统一、多产和活跃。

现在让我们转而考虑前面提出的另一个问题，即我们到底该不该试图对 "好数学" 下定义。

下定义有让我们变得傲慢自大的危险，特别是，我们有可能因为一个真正数学进展的奇异个例不满足主流定义而忽视它。另一方面，相反的观点——即在任何数学研究领域中所有方法都同样适用并该得到同样资源，或所有数学贡献都同样重要——也是有风险的。那样的观点就其理想主义而言也许是令人钦佩的，但它侵蚀了数学的方向感和目的感，并且还可能导致数学资源的不合理分配。

真实的情形处于两者之间，对于每个数学领域，现存的结果、传统、直觉和经验（或它们的缺失）预示着哪种方法可能会富有成效，从而应当得到大多数的资源；那种方法更具试探性，从而或许只要少数有独立头脑的数学家去进行探究以避免遗漏。

比方说，在已经发展成熟的领域，比较合理的做法也许是追求系统方案，以严格的方式发展普遍理论，稳妥地延用卓有成效的方法及业已确立的直觉；而在较新的、不太稳定的领域，更应该强调的也许是提出和解决猜想，尝试不同的方法，以及在一定程度上依赖不严格的启示和类比。

因此，从策略上讲比较合理的做法是，在每个领域内就数学进展中什么品质最应该受到鼓励做一个起码是部分的（但与时俱进的）调查，以便在该领域的每个发展阶段都能最有效地发展和推进该领域。

比方说，某个领域也许急需解决一些紧迫的问题；另一个领域也许在翘首以待一个可以理顺大量已有成果的理论框架，或一个宏大的方案或一系列猜想来激发新的结果；其它领域则也许会从对关键定理的新的、更简单及更概念化的证明中获益匪浅；而更多的领域也许需要更大的公开性，以及关于其课题的透彻介绍，以吸引更多的兴趣和参与。

因此，对什么是好数学的确定会并且也应当高度依赖一个领域自身的状况。

这种确定还应当不断地更新与争论，无论是在领域内还是从通过旁观者。如前所述，有关一个领域应当如何发展的调查，若不及时检验和更正，很有可能会导致该领域内的不平衡。上面的讨论似乎表明，评价数学品质虽然重要，却是一件复杂得毫无希望的事情，特别是由于许多好的数学成就在上述某些品质上或许得分很高，在其它品质上却不然；同时，这些品质中有许多是主观而难以精确度量的（除非是事后诸葛）。

然而，一个令人瞩目的现象是：上述一种意义上的好数学往往倾向于引致许多其它意义上的好数学，由此产生了一个试探性的猜测，即有关高品质数学的普遍观念也许毕竟还是存在的，上述所有特定衡量标准都代表了发现新数学的不同途径，或一个数学故事发展过程中的不同阶段或方面。

个例研究：Szemerédi 定理

现在我们从一般转向特殊，通过考察 Szemerédi 定理——那个声称任何具有正（上）密度的整数子集必定包含任意长度算术序列的漂亮而著名的结果——的内容及历史来说明上段所述的现象。这里我将避免所有的技术细节。这个故事有许多个自然的切入点。

我将从 Ramsey 定理——任何有限着色的足够大的完全图必定包含大的单色完全子图（比如任意六人中必有三人要么彼此相识，要么彼此陌生，假定 "相识" 是一个有良好定义的对称关系）——开始。这个很容易证明（无需用到比迭代鸽笼原理更多的东西）的结果代表了一种新现象的发现，并且开辟了一系列新的数学结果：Ramsey 型定理。

这些定理中的每一个都是数学上一个新近洞察的观点 "完全无序是不可能的" 的不同表述。

最早的 Ramsey 型定理之一（事实上比 Ramsey 定理还早了几年）是 van der Waerden 定理：给定整数集的一个有限着色，其中必有一个单色类包含任意长度算术序列。van der Waerden 的高度递归的证明非常优美，但有一个缺点，那就是它给出的出现第一个给定长度算术序列的定量下界弱得出奇。

事实上，这个下界含有序列长度和着色种数的 Ackermann 函数。Erdös 和 Turán 所具有的良好数学品位，以及希望在（当时还是猜想的）素数是否包含任意长度算术序列这一问题上获取进展的企图，使他们对这一定量问题做了进一步的探究。

他们推进了一些很强的猜想，其中一个成为了 Szemerédi 定理；另一个则是一个漂亮（但尚未证明）的更强的命题，它声称任何一个倒数和非绝对可和的正整数集都包含任意长度算术序列。

在这些猜想上的第一个进展是一系列反例，最终汇集为 Behrend 对不存在长度 3 算术序列的适度稀疏集（对于任意给定的 ε，这个集合在 {1,...,N} 中的密度渐近地大于 N-ε）的优美构造。

这一构造排除了 Erdös-Turán 猜想中最具野心的部分（它猜测多项稀疏集包含大量的序列），而且还排除了很大一类解决这些问题的方法（比如那些基于 Cauchy-Schwarz 或 Hölder 之类不等式的方法）。这些例子虽不能完全解决问题，但它们表明 Erdös-Turán 猜想若成立，将需要一个非平凡的（从而想必是有趣的）证明。

下一个主要进展来自于 Roth，他以一种优美的方式运用 Hardy-Littlewood 的圆法及一种新的方法（密度增量论证），确立了 Roth 定理：每一个密度为正的整数集都包含无穷多个长度 3 序列。接下去很自然的就是试图将 Roth 的方法推广到更长的序列。Roth 和许多其他人在这方面花费了好几年的时间，却没能取得完全的成功。困难的起因直到很久之后才由于 Gowers 的工作而得到显现。

问题的解决则依靠了 Endré Szemerédi 的惊人才华，他重新回到了纯粹的组合方法上（特别是，把密度增量论证推进到了一个令人瞩目的技术复杂度上），将 Roth 的结果首先推广到长度 4，然后到任意长度，从而确立了他的著名定理。

Szemerédi 的证明是一项技术绝活，它引进了许多新想法和新技巧，其中最重要的一个是引进了看待极端复杂图的新方法，即通过有界复杂模型来取近似。

这一结果，即著名的 Szemerédi 正规性引理，在很多方面都引人注目。如上所述，它给出了有关复杂图结构的全新洞察；它提供了一种将在本故事后面部分变得至关重要的新的证明方法（能量增量方法）；它还导致了从图论到性质检验到加性组合学的数量多得难以置信的意外应用。可惜的是，正规性引理的完整故事太过冗长，无法在这里加以叙述。

Szemerédi 的成就无疑是本故事的一个重点，但它绝不是故事的终结。

Szemerédi 对其定理的证明虽然初等，却极为复杂、不易理解。并且它也没能完全解决启发 Erdös 和 Turán 进行研究的原始问题，因为这一证明本身在两个关键地方用到了 van der Waerden 定理，从而无法改进该定理中的定量下界。

接下来是 Furstenberg，他的数学品位使他试图寻找一种本质上不同的（高度非初等的）证明，他所依据的是组合数论与各态历经理论之间富有远见的类比，这一类比很快被他表述为很有用的 Furstenberg 对应原理。

从这个原理人们可以很容易地得出结论：Szemerédi 定理等价于保测体系中的多重回归定理，由此可以很自然地直接运用各态历经理论中的方法，特别是通过考察这种体系中各种可能的分类及结构分解，来证明这一定理（现在被称为 Furstenberg 回归定理）。

Furstenberg 很快建立了 Furstenberg 结构定理，这一定理把所有保测体系都描述为一个平凡体系的一系列紧致拓展的弱混合拓展。

在这一定理及几个附加论证（包括 van der Waerden 论证的一个变种）的基础上可以确立多重回归定理，从而给出 Szemerédi 定理的一个新的证明。同样值得一提的是 Furstenberg 还撰写了有关这一领域及相关课题的优秀著作，在对这一领域的成长及发展做出重大贡献的同时对基础理论作了系统的形式化。

Furstenberg 与其合作者随后意识到这一新方法所具有的强劲潜力可以用来确立许多类型的回归定理，后者（通过对应原理）又可以产生一些高度非平凡的组合定理。

顺着这一思路，Furstenberg、Katznelson 及其他人获得了 Szemerédi 定理的许多变种和推广，比如高维空间的变种，他们甚至确立了 Hales-Jewett 定理的密度版本（这是 van der Waerden 定理的一个非常有力及抽象的推广）。这些通过无穷各态历经理论技巧所获得的结果中的许多，人们至今也不知道是否存在 "初等" 证明，这证实了这种方法的力量。

不仅如此，作为这些努力的一个有价值的副产品，人们还获得了对保测体系结构分类的深刻得多的理解。特别是，人们意识到对于许多类型的回归问题，一个任意体系的渐进回归性质几乎完全由该体系的一个特殊因子所控制，这个因子被称为该体系的（最小）特征因子。确定各类回归中这一特征因子的精确性质于是便成为了研究的焦点，因为这将导致有关极限行为的更精确的信息。

Furstenberg 和 Weiss 的反例，及 Conze 和 Lesigne 的结果，逐渐导致一个结论，即这些特征因子应该由一个非常特殊的（代数型的）保测体系，即与幂零群相联系的零系统，来描述。这些结论的集大成者是对这些因子给予精确及严格描述的技术上引人注目的 Host 和 Kra 的论文，它在得到其它一些结果的同时解决了刚才提到的渐进多重回归平均的收敛性问题。

这些特征因子所扮演的核心角色相当充分地表明了存在于（由零系统所表示的）结构与（由某些技术型的 "混合" 性质所刻划的）随机性之间的二向性，以及一种深刻的见解，即 Szemerédi 定理的力量实际上是源于这一二向性。

Host-Kra 分析的另一个值得一提的特点是平均概念在 "立方体" 或 "超平行体" 中令人瞩目的出现，出于一些原因，它比与算术序列有关的多重回归平均更易于分析。

与这些各态历经理论的进展相平行，其他数学家则在寻找用别的方式来理解、重新证明及改进 Szemerédi 定理。Ruzsa 和 Szemerédi 取得了一个重要的概念突破，他们用上面提到的 Szemerédi 正规性引理确立了一些图论中的结果，包括现在被称为三角消除引理的引理，其大致内容是说一个包含少数三角形的图中的三角形可以通过删除数目少得令人惊讶的边而消除。

他们随后发现前面提到的 Behrend 例子对这一引理的定量下界给出了某种极限，特别是它排除了一些类型的初等方法（因为那些方法通常给出多项式型的下界），事实上迄今所知消除引理的所有证明都是通过正规性引理的某些变种。将这一联系反过来应用，人们发现其实三角消除引理蕴含了 Roth 关于长度 3 序列的定理。

这一发现首次开启了通过纯图论技巧证明 Szemerédi 型定理的可能性，从而抛弃了问题中几乎所有的加性结构。不过，一段时间之后人们才意识到图论方法与先于它出现的 Fourier 分析方法在很大程度上局限于检测象三角形或长度 3 序列那样的 "低复杂度" 结构，检测更长的序列将需要复杂得多的超图理论。

特别是，这启示了（由 Frankl 和 Rödl 率先提出的）一个计划，意在寻找超图理论中正规性引理的类比，这将足以产生象 Szemerédi 定理（及其变种和推广）那样的推论。这被证明是一项复杂得令人吃惊的工作，尤其是要仔细安排这种正规化中参数的等级，使之以正确的顺序相互主导。事实上，能够从中推出 Szemerédi 定理的正规性引理及与之相伴的记数引理的最终证明直到最近才出现。

Gowers 的很有教益的反例也是值得一提的，它表明原始的正规性引理中的定量下界必须至少是塔状指数形式，从而再次显示这一引理非同寻常的性质（和力量）。

自 Roth 之后未曾有实质进展的 Fourier 分析方法最终由 Gowers 做了重新考察。和其它方法一样，Fourier 分析方法首先确立了整数集中的二向性，即他们在某种意义上要么是有结构的，要么是伪随机的。

这里的结构这一概念是由 Roth 提出的：有结构的集合在中等长度算术序列上有一个密度增量，但有关伪随机或 "均匀性" 的正确概念却没那么清楚。

Gowers 提出了一个反例（事实上这一反例与前面提到的 Host 与 Kra 的例子有着密切的关系），表明以 Fourier 分析为基础的伪随机概念对于控制长度 4 或更长的序列是不够的，他随后引进了一个满足需要的不同的均匀性概念（与 Host 和 Kra 的立方体平均有很密切的关系，与某些超图正规性的概念也有关系）。剩下的工作就是为二向性确立一个定量且严格的形式。

这却是一项困难得出人意料的工作（主要是由于这一方法中 Fourier 变换的效用有限），并且在许多方面与 Host-Kra 及 Ziegler 试图将特征因子赋予零系统代数结构的努力相类似。

但是，通过将 Fourier 分析工具与诸如 Freiman 定理和 Balog-Szemerédi 定理等加性组合学的主要结果，及一些新的组合与概率方法结合在一起，Gowers 用令人瞩目的高超技巧成功地完成了这一工作，他并且得到了有关 Szemerédi 定理和 van der Waerden 定理的非常强的定量下界。

总结起来，人们给出了 Szemerédi 定理的四种平行的证明；一种是通过直接的组合方法，一种是通过各态历经理论，一种是通过超图理论，还有一种是通过 Fourier 分析及加性组合学。即便有了这么多的证明，我们依然觉得有关自己对这一结果的理解还不完全。

比方说，这些方法中没有一种强到能够检测素数中的序列，这主要是由于素数序列的稀疏性（不过，Fourier 方法，或更确切地说 Hardy-Littlewood-Vinogradov 圆法，可以用来证明素数中存在无穷多长度 3 序列，并且在付出很大努力后可以部分地描述长度 4 序列）。

但是通过调和分析中的限制理论（这是另一个我们将不在这里讨论的引人入胜的故事），Green 能够将素数 "当成" 稠密来处理，由此得到了一个有关素数稠密子集的类似于 Roth 定理的结果。这为相对 Szemerédi 定理开启了可能性，使人们能检测整数集以外的其它集合，比如素数，的稠密子集中算术序列。事实上，一个与相当稀疏的随机集合的稠密子集有关的相对 Roth 定理的原型已经出现在了图论文献中。

在与 Ben Green 的合作中，我们开始试图将 Gowers 的 Fourier 分析及组合论证方法相对化到诸如稀疏随机集合或伪随机集合的稠密子集这样的情形中。经过许多努力，我们逐渐能够检测这类集合中的长度 4 序列。这时候，我们意识到了我们所用的正规性引理与 Host-kra 有关特征因子的构造之间的相似性。

通过对这些构造的置换，我们可以确立一个令人满意的相对 Szemerédi 定理，它依赖于一个特定的转化原理，粗略地说，该原理断言稀疏伪随机集合的稠密子集的行为 "就好比" 它们在初始集合中就是稠密的。为了将这一定理应用于素数，我们需要将素数包裹在一个适当的伪随机集合（或者更确切地说，伪随机测度）中。

对我们来说很偶然的是，Goldston 和 Yildirim 最近有关素数隙的突破几乎恰好构造了我们所需要的东西，使我们最终确立了早年的猜想，即素数集包含任意长度的算术序列。

故事到这里仍未结束，而是继续沿几个方向发展着。一方面转化原理现在已经有了一些进一步的应用，比如获得高斯素数中的组团或有理素数中的多项序列。

另一个很有前途的研究方向是 Fourier 分析、超图理论及各态历经方法的彼此汇聚，比如发展图论与超图理论的无穷版本，或各态历经理论的有限版本。第三个方向是使控制各态历经情形下的回归的零系统也能控制算术序列的各种有限平均。特别是，Green 和我正在积极地计算素数及由零系统（通过 Vinogradov 方法）产生的序列之间的关联，以便确立能够在素数中找到的各种结构的精确渐进形式。

最后，但并非最不重要的是最初的 Erdös-Turán 猜想，它在所有这些进展之后仍未得到解决，不过现在 Bourgain 已经取得了一些非常有希望的进展，这应该能引导出进一步的发展。

结论如我们在上述个例研究中可以看到的，好数学的最佳例子不仅满足本文开头所列举的数学品质判据中的一项或多项，更重要的，它是一个更宏大的数学故事的一部分，那个故事的展开将产生许多不同类型的进一步的好数学。

实际上，人们可以将整个数学领域的历史看成是主要由少数几个这类好故事随时间的演化及相互影响所产生的。因此我的结论是，好数学不仅仅是用前面列举的一个或几个 "局部" 品质来衡量的（尽管那些品质无疑是重要且值得追求与争论的），还要依赖于它如何通过继承以前的成果或鼓励后续发展来与其它好数学相匹配这样更 "全局" 的问题。当然，如果不凭借后见之利，要确切地预言什么样的数学会具有这种品质是困难的。

不过实际上似乎存在某种无法定义的感觉，使我们能感觉到某项数学成果 "触及了什么东西"，是一个有待进一步探索的更大谜团的一部分。在我看来，追求这种对发展潜力的难以言状的保障，对数学进展来说起码是与前面列举的更具体更显然的数学品质同等重要的。因此我相信，好数学并不是单纯的解题、构筑理论、对论证进行简化、强化、明晰化、使论证更优美、更严格，尽管这些无疑都是很好的目标。

在完成所有这些任务（及争论一个给定领域中哪一个应该有较高的优先权）的同时，我们应该关注我们的结果所可能从属的任何更大的范围，因为那很可能会对我们的结果、相应的领域，乃至整个数学产生最大的长期利益。

鸣谢

感谢 Laura Kim 阅读并评论本文的早期文稿，以及 Gil Kalai 的许多深思熟虑的评论与建议。