北冥南海纵千貌,五岳三山横云霄。可汗三征掠西欧,英雄背水环地球。天地茫茫人海处,蓦然回首已陌路。山高水远毋烦忧,辗转六度迹可求。
——开场诗
“世界这么大,我想去看看”,几年前那张洒脱而霸气的请假条背后,是人们对这个世界的无尽好奇。但别说环游世界这等美差,就连“环游全国”在古人的笔下却都被悲观成了“颠沛流离”。
比如苏东坡足迹走遍天下,在今天看来够发好几百条朋友圈了,但实际上则是居无定所,四处漂泊。古代交通不发达,游子在外和家人都得靠家书。家书没腿,自己没法跑,只有通过驿站或飞鸽传书的方式方可传达,不像现在,李雷想给韩梅梅发信息只要敲敲键盘动动鼠标就行,还不怕吴彦煮窃取信息。安全又快捷。古人眼里的五湖四海太行王屋,在互联网时代中和隔壁老王家的小小门槛并无二致。
互联网在很大程度上增强了人与人之间的联系,世界在屏幕的那一头被浓缩成一个小世界。
说到小世界,多数读者都听说过小世界定律,它又被称作六度分隔理论。这个理论断言,世界上任意两个人之间最多隔了5个中间人(用数学语言,“平均最小路径”为6)。李雷可以通过最多五个中间人就能联系到其他任何人。这个定律最神奇的地方在于,它在互联网时代之前就已经存在了!也就是说,在交通不发达的北宋,在海南岛度假的苏东坡也最多只需要五个中间人就能吃到山东武大郎做的烧饼!
那么小世界定律是怎么被发现的呢?
它最早是由无线电之父马可尼在20世纪初所预测,并在60年由社会心理学家米尔格拉姆通过实验所验证。米尔格拉姆的实验思路很简单:在美国中部地区随机地选择300个左右居民,给他们发送附有指令的包裹,希望他们把这个包裹送到波士顿的一个指定目标那里;包裹当然不能直接送达,只能交给自己认识的人,并且需要标注具体把包裹交给了谁。这样就能统计这个包裹历经多少人之手了。
可想而知,如果收到包裹的人严格遵守指令的话,那么他们就会把包裹交给“更可能认识指定目标”的人,这是实验成功的一大前提。不过愿意乖乖听话的陌生人并不多,最后只有64个包裹成功到达指定目标,有效数据不足四分之一。米尔格拉姆发现这64个包裹经过的中间人手从1人到10人不等,中间人的中位数正好是5,从而“验证”了小世界定律。
严谨的读者们可能早已察觉到这整个验证过程还有诸多值得商榷之处,例如:这些瑕疵并不妨碍米尔格拉姆的这一实验成为社会学领域的一大经典,因为社会学涉及到的因素太多太多了,实验不可能做到完美。不过需要引起我们注意的,则是如何辨证地看待“小世界定律”——定律和数学上的定理是完全不同的,前者并不需要严格的证明,只需“大体上成立”即可。
再例如牛顿运动定律和哈勃定律等物理定律,都是通过实验观测得到的规律,而没办法用数学的方法严格证明。
既然小世界定律又很难用严格的数学手段来证明,那么如何使用更有说服力的方法来研究它呢?小编在之前的很多文章中都提到过“图论”这一概念,足见它在科学界中的重要地位。图的概念很简单,无非就是一些节点和连接节点的边构成的二元组。
我们很容易想到,社交网络中的个体都可以用节点表示;如果两个个体之间有联系,就用边把他们连起来,这样社交网络就被抽象成了图论的模型。这个看似简单的想法,却在20世纪30年代以后才逐渐引起人们的关注。
既然社交网络可以通过图表达出来,那么我们很自然会想到用图论来研究小世界现象?
1998年,美国社会学家Watts联手数学家Strogatz构思出了一个简单实用的图论模型,这在今天被称为Watts-Strogatz模型。它的算法如下:1. 把N个节点均匀地排布在一个圆周上,每个节点连接周围最近的K个节点;2. 选取一个[0, 1]区间的概率p,让步骤1中每一条边都以概率p发生“变异”,例如连接节点n_j和n_i的“短”边变异为连接n_j和n_k的“任意长度”边。
变异结果如下:如果变异概率为1,那么小世界网络就变成一团乱麻了:因为“变异”后既可能生成长边,也可以生成短边,所以还是存在不少连接相邻节点的边。
这和小世界定律又有什么关系呢?如果把六度分离现象用图论的语言表述,那么就是小世界图的平均最短路径不超过6。平均最短路径的精确定义如下:我们来计算一下在20个节点的情况下,不同变异概率p下的平均最短路径。
得到了如下散点统计:一共计算了20个小世界网络的平均最短路径,我们可以看到,在变异概率p=0时,平均最短路径接近3;而变异概率就算只有0.1,平均最短路径直接降到了2.5以下。如果我们把节点数增加到200(保持K=4不变),让变异概率从0变化到0.2,就更加符合六度分离现象了:随着p的增加,平均最短路径从25迅速下降,在p约为0.125时接近6。
或许Watts和Strogatz不会想到,他们在20年前建立的模型不仅引起了社会学家的关注,而且还引起了其他不同学科的广泛关注。例如图论在生命科学中的应用,大致总结如下:生物问题中涉及到的图论模型都非常复杂,节点非常多。但我们都知道,生命的自我调节能力非常高效——小编认为,我们每天的喜怒哀乐悲欢离合本质上都是因为受到环境影响后,神经元、基因调节和新陈代谢三大复杂网络交互影响而产生的宏观效应。
或许小世界现象理论能够较好地解释,生命为什么会能高效地“摆布”这么多的节点。
小世界网络能解释的现象还有很多,例如p2p网络的搭建、学术圈的建立和发展、总统选举的投票情况分析等。运用小世界模型的思想,我们可以更有效地搭建p2p网络。在数学领域,图论已经存在数百年之久了,这个方向在国内数学系似乎并不太受到重视。但随着不同分支间的相互融合作用与网络时代的信息多元化趋势,图论正在日渐体现出它的价值。
随机图论、拓扑数据分析、热带几何这些近期涌现出来的数学分支,正在受到越来越多的关注,而它们的基础都是图论。新生事物总是会受到不少质疑,许多数学家对这些新兴学科并不买账,部分原因是这些学科的基础“太过于简单”。不过小编一直相信,真正好的数学应该是简洁、美观而且具有高度普适性的,而并非一味的抽象和简单问题复杂化。
就像Watts-Strogatz的小世界模型那样,非常简单的理论基础就能解释很多复杂的自然现象。最后欢迎读者们各种留言、讨论、吐槽以及质疑!