传说四五千年前,古巴比伦人就利用星座占卜,预测命运。这种占卜的方法,跟中国古代的紫微斗数有异曲同工之妙,都是根据被占卜者和星体运行的关系,占算他一生各方面的运程。阿里巴巴集团副总裁、大数据委员会主席车品觉,就是香港紫微斗数大师王亭之的弟子。在接受媒体采访时,车品觉曾说,“紫微斗数和大数据分析在方法论上是相通的”——我们也来试试,能否用大数据的方法分析星座。
这篇文章要讨论的是,星座对我们工作和交友的影响。两年前,有一个招聘启事引起很多人的关注,启事明确要求,“设计师”必须是处女座的,“业务员”不要双鱼座的。在日本和韩国,星座在招聘中的影响比中国还大,很多企业都会把星座作为一个参考项。杜甫说:“人生不相见,动如参与商”,可见有些星座是老死不相往来的。
在百度百科能下载到一张星座交友指数表,根据那张表,作为一个白羊座的男生,我应该追求狮子座(97分),躲开摩羯座(43分)的女性。星座对工作和交友到底有没有影响呢?很多人,尤其是捧着一本《环球科学》的读者,第一反应肯定是“没有”!
但也有一些似乎可以支持反方的证据:首先,拉塞尔·福斯特(Russell Foster)和利昂·克赖茨曼(Leon Kreitzman)在《生命的节奏》一书中,列举了很多不同月份出生的人在寿命和特定疾病患病率上存在差异的例子,这说明星座不同的人,有可能在生理甚至性格上天生不同;其次,哪怕星座交友规律开始是荒谬的,只要很多人相信并按照这个规则行事,譬如白羊座男生都追求狮子座女生,那么这个规则会获得证明并且变得更加可信——这就是社会学中有名的“皮克马利翁效应”,一个预言,自己证明了自己。
电子科技大学的高见博士分析了一家互联网企业16 254名员工的绩效记录,其中12 632名员工有生日信息。分析显示,星座和绩效表现没有统计上的关联性,即便分了业务部门,也没有显著关联。所以,在招聘和人力资源管理的时候,我们不必太关注员工的星座了。
中国科学院计算技术研究所的黄俊铭博士和电子科技大学王文强合作,研究了微博交友行为和星座之间的关系。他们分析了573 795名微博用户,这些用户既填写了生日,又标注了星座,而且这两个数据都是相匹配的。他们发现,有些用户间的互动关系非常频繁。于是,他们研究了互动次数超过一定阈值的用户,结果显示,每个星座的人,都特别强烈地倾向于和同星座的人频繁互动,而对其他星座的人并没有表现出特别的兴趣。
王文强把自己计算的结果告诉了美国康奈尔大学计算机科学教授乔恩·克莱因伯格(Jon Kleinberg)。克莱因伯格很好奇,这种结果到底是因为大家喜欢和同星座的人交朋友(星座同配),还是因为人们喜欢和自己生日相近的人交朋友(生日同配)。在他的建议下,王文强画出了不同星座与生日用户间的互动关系曲线。曲线的横轴表示生日,纵轴表示该日出生的人关注巨蟹座用户的倾向。
如果两个用户之间的互动频率随着生日接近而连续增加,我们应该观测到类似(a)图的曲线,最高点应该出现在巨蟹月的正中一天(7月7日),因为这一天到巨蟹月所有30天的平均距离最短。如果星座同配性确实存在,那么我们应该观测到(b)图的曲线,因为巨蟹月出生的用户与其他巨蟹座用户的互动更多,而与非巨蟹座用户的互动较少。数据分析的结果显示,对于所有的星座,都出现了(b)图的曲线,可见星座而非生日是决定性的因素。
大数据分析发现,每一个星座的用户都对同星座的用户表现出特别强烈的兴趣。如果这一现象的本质是生日同配,应该出现(a)图;如果本质是星座同配,应该出现(b)图。真实数据呈现出(b)图特征。
对于星座的研究,科学家大多是出于好奇,而不是认为“星座也是一种科学”。虽然目前相信“星座学说”的人不在少数,但显然,所有“星座学说”认为的那些“特别匹配的关系”都不存在,更不存在星座与星座之间的那种细腻微妙的浪漫情怀或轮回恩怨。我们喜欢和同星座的人交友,不过是“臭味相投”的一种表现,或者“对自己的爱”在他人身上的投射。
星座性格的描述往往也暧昧宽泛,而让所有人看起来都觉得正确。例如白羊座的男生被认为具有“追求自由”的天性,我觉得简直说到我的心坎了,但是,不是白羊座的你们呢,就不喜欢自由了吗?