为什么我朋友的朋友比我多?

作者: (意)毛里奇奥·科多尼奥

来源: 我是科学家iScientist

发布日期: 2020-07-05 12:40:07

文章通过分析Facebook的数据和日常生活中的例子,解释了为什么人们的朋友的朋友数量通常比自己的朋友数量多,这种现象在社交网络中尤为明显,且在不同的社交平台如Facebook和Twitter上表现可能不同。

《花生漫画》里的伙伴们把桌子布置好来庆祝情人节派对,孩子们手上都拿着情人节卡片。派对结束之后,孩子们都带着一叠交换来的情人节卡片回到了家里,只有查理一个人闷闷不乐,两手空空地待着。好吧,大家可能会说:查理从来都没有受到重视,没人发现每个人拥有的朋友都比查理要多。可事实上,我们中的大部分人都是查理。

我们确实有朋友,但是我们的朋友拥有的朋友比我们要多——这种像绕口令般又像悖论一般的言论是通过经验得到验证的。2011年5月,有两位博士生——约翰·尤甘德和布莱恩·卡勒,他们拿到了Facebook的完整数据,那时Facebook的注册用户仅有7.21亿。通过研究朋友关系网络,他们发现有93%的用户的朋友拥有的朋友数量比他们自己多。

一个用户平均的粉丝数是190个,而他朋友拥有的粉丝数是他的3倍多,准确地说,是635个。

可能有人怀疑:这是不是个圈套啊?数据是假的吧?问题的答案一如既往地简单,不过我们可以先放一放。我们来举一个不同类型的例子吧。为了让自己保持完美的体型,我沉迷于举重。我不敢保证我已经锻炼成了一个肌肉男,不过我的身材还是在平均水平上的。

然而,我每次走进健身房,都觉得健身房里到处都是健美运动员——这不是我最担心的东西,我对这些很在行,但是第一眼看到的时候还是觉得有点困惑。造成这种异常的原因可能是什么呢?一个健身爱好者,去健身房的次数肯定比普通人多,碰上健美运动员的概率也就更大,因此会造成经常看到这么多身材健美的运动员的感觉,事实上这些人在健身房的比例并没有想象的那么高。

第二个例子:假设你是一名老师,教授两名课程,一门是入门课程,有90名学生;另一门是进阶课程,只有10名学生。从老师的角度看,毫无疑问,平均每个班有50名学生。但从学生的角度看呢?

对于学入门课程的那90名学生来说,他们班是由90名学生组成的;而对于另外10名学生来说,他们班是由10名学生组成的,因此学生的平均数应该是(90×90+10×10)/(90+10),因此平均每个班有82名学生,又一次产生分歧了。这个模式应该更清晰:产生分歧的原因在于一个是从客观角度计算的平均数,而另一个是从主观角度来计算的。

当参考集存在差别的时候——不常去健身房的客人比较少待在那里,而健身房的常客常常出现在那里,两个班中一个班的学生很多而另一个班很少,这时会使用集合中的所有元素作为参考来计算平均值,拥有更多联系的元素在计算中占的比值会更大,从而影响整个平均水平。如下图所示,我们先用少量数字来试一下。圆圈里面表示的是人,把他们连接起来的线段表示他们相互之间的关系。

我们把每个人拥有的朋友数进行相加,就能得到2+3+3+2=10个朋友(每个关系都计算了两次),平均到4个人身上,每个人有2.5个朋友。现在我们来计算一下“朋友的朋友”的平均数。我们这样来进行定义:我们把每个人拥有的朋友都算进去,然后找出这些朋友的朋友,算平均数。约翰有两个朋友,即乔治和林戈,他们俩分别有3个朋友;对于保罗来说也是一样的情况,那么他们之间的平均数就是(3+3)/2=3。

乔治和林戈各有3个朋友,其中两个(约翰和保罗)有两个朋友,而另一个有3个朋友;他们之间的平均数是(2+2+3)/3=7/3。因此,总的平均数是(3×2+7/3×2)/4=8/3,这比我们最开始算出来的2.5要大。朋友关系网络越分散,那么算出来的两个平均值差距就越大。

如果我们在这个朋友关系图中再加一个人——埃莉诺,她只有林戈一个朋友(林戈的朋友可真多啊),那么朋友的总数就是12,平均数就降为2.4了。而朋友的朋友的平均值则为3.13,比原先还要多!

Facebook的那个调查也是类似的原理。不过,注意啦!这个表面上看起来像悖论的理论只对Facebook有效,如果在Twitter网上做同样的研究,会得到完全不一样的结果。

事实上,关注一名用户这个行为不是相对的,A可以关注B,但是B可能根本不知道A是谁。因此,在班级的例子中,班里所有的同学都和其他人对应建立了同学的关系,那么这个例子里的乘数因子就不再适用了。总之,Twitter不是简化版的Facebook,至少它们之间存在背景差异。

UUID: 28e5c388-2776-4c14-86af-7d95bf2989d0

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/中科院物理所公众号-pdf2txt/2020/中科院物理所_2020-07-05_「转」为什么我朋友的朋友比我多?.txt

是否为广告: 否

处理费用: 0.0048 元