有这样一本神书,它的正文不包含任何字母却畅销60多年,再版了3次,在亚马逊上的评论量超过了亚马逊十大畅销书之一的《饥饿游戏》的第一部,获得了4.2/5的高评分,并引发《纽约时报》、《华尔街日报》等主流媒体报道。此书中的章节还经常出现在各种统计学教材中,它就是附录中经常出现的神秘数表的常见来源。这本书就是标志着人类核武器时代到来的著作,在个人计算机时代前被统计工作者奉为圣经的《百万随机数表》。
没错,这本书的正文就是100万个随机数。要了解这本书的划时代性,我们有必要要了解一下随机数有多么难获得。随机性看起来无处不在,但实际上,要获得高质量的随机数真的很难。计算机输出的随机数是“伪随机数”,因为给计算机什么指令,它们就会稳定进行同样的操作,输出同样的结果。也就是说,计算机无法输出真随机数。真随机数的唯一来源是自然界。
真随机数和伪随机数的对峙在20世纪40年代被推向了高潮,因为在研究核物理时,人们才意识到真随机数有多重要。后来,这个问题被洛斯阿拉莫斯国家实验室的数学家斯塔尼斯拉夫·乌拉姆破解了。乌拉姆的思路是,方程太复杂了老子不解了好伐,我直接模拟中子怎么动不就好了。这种“你动动我试试”的方法就是著名的统计学技术——蒙特卡罗方法。蒙特卡洛方法依赖大量随机数,这样才能保证模拟结果无限接近真实。
为了满足暴涨的需求,1947年,为美国军方服务的兰德公司就开始制造这种“商品”。1955年,百万的第一版开始发行。高质量的随机数很难获得,因此这本书对于教师、学生、研究者等等一系列需要和统计数字打交道的职业来说就是必不可少的。而根据兰德公司的介绍,百万这本书已经成了工程学和计量经济学教材中的标准参考书。这本书也被广泛用于游戏设计和模拟中。
兰德公司还表示,直到现在,百万这本书依旧是随机数的最大已知来源,统计学家、物理学家、市场分析师、民意测验者、品控工程师还在利用这本书里的随机数。除了百万这本书,2013年9月5日,美国国家标准技术研究所开始每60秒发布一次高质量的随机数。虽然这些随机数表又大又方又好,是重要的工具,但是对于计算机安全来说,它们是“禁书”。