全世界都在为π庆祝的时候,建议你来看看这些最“无聊”的数字

作者: 玛农·比朔夫(Manon Bischoff)

来源: 环球科学

发布日期: 2023-03-14 21:30:01

本文探讨了数字的有趣与无趣之分,通过OEIS(整数数列线上大全)的数据分析,发现自然数可以分为有趣数和无趣数两类。有趣数通常是那些具有特殊性质或易于描述的数字,而无趣数则是那些在OEIS中出现频率极低的数字。文章还讨论了数学家尼尔·斯隆对数字序列的研究,以及社会因素如何影响我们对数字的偏好。

总有⼀些数字更容易被⼈类偏爱,例如质数或是2的⼏次⽅,这并不奇怪。事实上,所有数字可以被分成两类:有趣的和⽆趣的。你最喜欢的数字是什么?很多⼈的答案可能会是⼀个⽆理数,⽐如圆周率π、欧拉数e,或者√2。

但即使只在⾃然数中做选择,你脑海中也会出现平时在各种情况下遇到的数值:⽩雪公主和7个⼩矮⼈、电影《7宗罪》、不吉利的数字13,以及因为道格拉斯·亚当斯(Douglas Adams)的⼩说《银河系漫游指南》(The Hitchhiker’s Guide to the Galaxy)⽽深受⼤家喜爱的数字42。那么假如是⼀个⽐较⼤的数字呢,⽐如1729?对⼤多数⼈来说,这个数字并没有什么特别之处。

乍⼀看,它似乎是彻头彻尾的⽆趣:既不是质数,也不是平⽅数,并且也不遵循任何明显的规律。数学家哈代(Godfrey Harold Hardy)起初也是这样的看法。曾经有⼀次,哈代在去医院探望⽣病的同事拉⻢努⾦(Srinivasa Ramanujan)的途中,上了⼀辆⻋牌号为1729的出租⻋,⻅到了拉⻢努⾦后,哈代向他说起了那个“⽆趣”的出租⻋⻋牌号。

但拉⻢努⾦⽴即反驳了哈代:“这个数字⾮常有趣:它是可以⽤两种不同⽅式表达为两个⽴⽅之和的最⼩数字。”现在可能你会想,到底有没有哪个数字是⽆趣的?然⽽这个问题会⽴即引出⼀个悖论:如果真的有⼀个值n没有任何有意思的特性,那么它没有特性这个事实本身就是n的⼀个特别的属性。

不过令数学家惊讶的是,确实有⼀种⽅法可以以相当客观的⽅式确定⼀个数字的有趣度——2009年的⼀项研究表明,⾃然数(正整数)可以划分为两个鲜明的阵营:有趣数和⽆趣数。有⼀本全⾯的数字序列百科全书提供了研究这两种数字类别的⽅法。1963年,数学家尼尔·斯隆(Neil Sloane)在写博⼠论⽂时萌⽣了汇编数列的想法。

当时,他需要计算⼀种叫做树状⽹(tree network)的图形中数值的高度,并遇到了⼀个数列:0,1,8,78,944,……但他不知道如何准确计算这个数列,于是他想知道他的同事在研究中是否遇到过类似的数列。不像对数或公式,数列并没有相关的参考表。

于是,10年后,斯隆出版了他的第⼀本百科全书《整数数列⼿册》(A handbook of Integer Sequences),其中包含⼤约2400个数列,这些数列也被证明在进⾏某些计算时很有⽤。这本书饱受盛誉,据斯隆描述,⼀位热情的读者是这样评价这本书的:“前有《旧约》,后有《新约》,现有《整数数列⼿册》。”在接下来的⼏年⾥,斯隆收集到了更多的数列,同时很多带有新数列的科学论⽂也不断出现。

这促使这位数学家在1995年与同事⻄蒙·普劳夫(Simon Plouffe)⼀起出版了《整数数列百科全书》(The Encyclopedia of Integer Sequences),其中包含约5500个数列。

之后相关的内容依然在不断增加,但得益于互联⽹的出现,收集更⼤量数据成为可能:1996年,“整数数列线上⼤全”(the Online Encyclopedia of Integer Sequences, OEIS)出现,⾄此其能够收录的数列数量持续增⻓。截⾄2023年3⽉,它包含了超过36万个数列。

任何⼈都可以提交数列:提交的⼈只需要解释这个数列的产⽣⽅式以及它为什么有趣,并且以数列靠前的那些数字为例对这个数列做出解释。然后,会有专⼈审核这些提交的数列,符合条件的数列就会被发布出来。

除了⾮常有名的数列,如质数(2,3,5,7,11,……)、2的幂(2,4,8,16,32,……)或斐波那契序列(1,1,2,3,5,8,13,……),OEIS条⽬中还包含⼀些奇特的例⼦,⽐如⽤n个2*4乐⾼积⽊搭建⼀个稳定塔的⽅法数(1,24,1560,119580,10166403,……);或“懒惰餐饮者序列”(lazy caterer’s sequence):即对⼀块饼进⾏n次切割可以得到的最多切块数(1,2,4,7,11,16,22,29,……)。

OEIS条⽬在精通数学的⼈群⾥已经相当有名⽓,并且已经存在了⼏⼗年,⾥⾯每个被提交的数列都会经过⼤约130个⼈的审阅,所以OEIS显然已经可以被当作所有数字序列的⼀个客观集合。也因此,OEIS⾮常适合被⽤来研究数字的受欢迎程度。⼀个数字在OEIS⾥出现的次数越多,这个数字就越有趣。⾄少,经营着法语博客Dr. Goulu的菲利普·古列尔梅蒂(Philippe Guglielmetti)是这样认为的。

在他的⼀篇帖⼦中,古列尔梅蒂回忆起⼀位数学⽼师的说法:1548是⼀个没有任何特殊性质的任意数字;但实际上,这个数字在OEIS条⽬中出现了326次。

⽐如,它出现在了“循环空间的宽度为n时,元胞⾃动机按照规则110演化后⼀个元胞的最终周期”(eventual period of a single cell in rule 110 cellular automaton in a cyclic universe of width n)形成的数列中。

哈代说出租⻋⻋牌号1729⽆趣,这也是错的:1729在OEIS中出现了918次(⽽且这个数字在电视节⽬《⻜出个未来》(Futurama)⾥⾯也经常出现)。于是古列尔梅蒂开始去寻找真正⽆趣的数字:那些在OEIS条⽬中没有出现或者⼏乎不出现的数字。⽐如,数字20067就从未出现过。

截⾄今年3⽉,它是没有出现在OEIS的数列中最⼩的数字(OEIS只收录序列前180个左右的数字,不然的话,每个数字都会出现在正整数数列⾥)。所以,20067看起来确实挺⽆趣的。相⽐之下,紧随其后的数字20068在OEIS中共出现了6次。然⽽⽆趣数并没有普遍规律,20067的地位也是可以改变的。也许就在写这篇⽂章的过程中,⼈们发现了⼀个新的数列,⽽20067正好出现在了这个新数列的前180个数字中。

尽管如此,OEIS条⽬仍然适合作为衡量某个数字有趣程度的标准。接着,古列尔梅蒂按照⾃然数的顺序,依次输出每个数字在所有条⽬中出现的次数,并绘制成图。他发现,图中的点在纵向密集分布,形成向较⼤值倾斜的宽阔曲线。这并不奇怪,毕竟OEIS条⽬只存储了数列中靠前的数字。然⽽令⼈惊讶的是,该曲线由两个条带组成,这两个条带之间有⼀条清晰可⻅的间隙。

由此得出,⾃然数在OEIS数据库中出现的频率要么特别⾼,要么特别少。根据OEIS中⾃然数的出现频率,可以确定两种⾃然数的类型:经常出现的有趣数(上⽅条带)和不常出现的⽆趣数(下⽅条带)。横轴表示⾃然数,纵轴表示每个数字在OEIS条⽬中被记录的次数。

古列尔梅蒂对这个结果⾮常着迷,于是向数学家让-保罗·德拉艾(Jean-Paul Delahaye)求助,德拉艾经常为《科学美国⼈》的法语姐妹刊读物《为了科学》(Pour la Science)撰写科普⽂章。他想知道数学家是否研究过这种现象。

事实并⾮如此,因此德拉艾与他的同事尼古拉·⼽夫⾥(Nicolas Gauvrit)和埃克托尔·泽尼尔(Hector Zenil)⼀起讨论了这个话题,并进⾏了更深⼊地调查。他们引⼊了算法信息论(algorithmic information theory)的结果,该理论通过描述⼀个对象所需要最短程序的⻓度来衡量其复杂度。

例如,⼀个任意的五位数,如47934(只能描述为“数字序列4,7,9,3,4”),就⽐16384(可以描述为214)更难描述(根据信息论的⼀个定理,具有较多特性的数字通常具有较低的复杂性)。也就是说,经常出现在OEIS条⽬中的数值可能是最容易被描述的。德拉艾、⼽夫⾥和泽尼尔的研究可以表明,通过信息理论预测的⾃然数复杂性趋势与古列尔梅蒂的曲线中所表现出来的趋势类似。

但这并不能解释该曲线中的间隙——这被命名为“斯隆间隙”(以尼尔·斯隆命名)。这三位数学家认为,这种差距是由社会因素造成的,例如对某些数字的偏好。为了证实这⼀点,他们进⾏了蒙特卡洛模拟(Monte Carlo simulation),他们设计了⼀个将⾃然数映射到⾃然数的函数——其中,较⼩的⾃然数⽐较⼤的⾃然数更频繁地输出。研究者将随机值代⼊函数中,并根据它们的频率绘制结果。

这产⽣了⼀条模糊的倾斜曲线,看起来类似于OEIS条⽬中的数据。⽽且就像信息论分析的那样,没有产⽣间隙。为了更好地理解间隙是如何产⽣的,我们必须看看属于这两个条带的分别都是哪些数字。对于300以内的⼩数值,“斯隆间隙”并不是很⼤。只有对于更⼤的数字,差距才越来越明显:在300到10000之间的所有数字中,约有18%属于“有趣”范围内,⽽其余82%属于“⽆趣”值。

事实证明,有趣条带包括⼤约95.2%的平⽅数和99.7%的质数,以及39%的具有许多质因数的数字。这三类已经占到了有趣条带的近88%。其余的数值具有很显著的特性,如1111,或者分别满⾜公式2n + 1和2n – 1。根据信息论,特别有趣的数字应该是那些复杂度低的数字,这意味着它们易于描述。

但是,如果数学家认为某些数值⽐其它同等复杂的数值更有趣,这就会导致“斯隆间隙”,就如德拉艾、⼽夫⾥和泽尼尔所认为的那样。例如:从信息论的⻆度来看,2n+1和2n+2同样复杂,但只有2n+1的值处于“有趣条带”。因为这些数字可以被⽤来研究质数,这也就是为什么它们会出现在许多不同的背景下。因此,对于有趣和⽆趣数字的区分似乎源于我们的喜好,例如对质数的重视。

如果你想在被问及你最喜欢的数字是什么时,给出⼀个⾮常有创意的数字,你可以提出像20067这样的数字,原因是它还没有出现在斯隆的数学序列百科中。

UUID: f91c0683-59dc-4439-a9e0-c0a7607e8b68

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/环球科学公众号-pdf2txt/2023/环球科学_2023-03-14_全世界都在为π庆祝的时候,建议你来看看这些最“无聊”的数字.txt

是否为广告: 否

处理费用: 0.0108 元