金洋:分析世界杯、降低撞衫率,谁敢说数据无聊?丨有意思博物馆
果壳
2018-11-13
以下文章来源于果壳少年,作者金洋
本文根据有意思博物馆演讲剧场——“果壳少年专场”现场演讲整理。
演讲人金洋:传说中的“别人家的孩子”,从来没有参加过中考和高考,保送到北大元培学院,目前是即将毕业的经济学博士。除了学霸,他还有一个身份,是果壳少年“最气人”作者。爱论文更爱推文,钱塘江边摸鱼出身的数据分析爱好者。
身处果壳之中,仍自以为无尽空间之王演讲人金洋:《数据分析:一种看待生活的趣味视角》
钱江摸鱼是我的笔名。取这个笔名是因为我小时候经常在钱塘江边摸鱼,那是我童年里最快乐的事情。我现在在北京大学读经济学博士。作为一个经济学博士,我日常分析的主要是数据问题,我把这些工作理解为在数据海洋里的摸鱼。在果壳期间我做了一些与生活相关的数据分析工作,发现了一些有意思的结果。
乾隆写了四万首诗没人背,我们究竟在背谁的诗今年暑假最火的电视剧无疑是《延禧攻略》,剧中的男主角是乾隆。乾隆不但是个皇帝,还是一个诗人,还是一个最悲哀的诗人:他一生写了四万首诗,却没有一首需要背。我对乾隆表示同情的同时,也被激起了好奇心:如果说乾隆是最悲哀的诗人,那么哪位诗人最幸运,用最少的写诗量实现了最大的背诵量呢?我定义了一个背诵率的概念:背诵率越高,说明诗人在实现进入课本这件事上的效率越高。
我翻遍了从小学到高中的所有语文课本,发现所有诗词来自总共74位诗人。而我国古代至少有上千名诗人的作品流传。也就是说,作品进入语文教材是一件难度非常大的事情。乾隆虽然作品的背诵率是零,但他还能排在并列第75位。
入选诗词最多的,毫无悬念是陪伴我们走过了整个青春的李白和杜甫。但这并不代表什么。按照背诵率来看,入选得多的诗人们的背诵率都不高:
(点击查看大图)
那怎样出现高的背诵率呢?我们来看一下背诵率排名前几位的诗人。
(点击查看大图)
排名第一位的诗人叫做林杰,17岁就英年早逝,一辈子只留存下来两首诗。其中一首《乞巧》就入选了我们的语文教材,背诵率高达50%。
怎么样才能实现这么高的背诵率?第一是得生得早,哪怕之前写了很多诗,流传至今的数量也不会大。这样在算背诵率的时候分母就不会太大。第二是要写得少。如果写得太多,哪怕时间再久,流传下来的诗也多。
(点击查看大图)
排名低的诗人特点是生得晚。其中清朝的赵翼和袁枚的背诵率都不到0.1%。生得晚加上话多,导致了他们的低背诵率。
我们再来反思一下为什么乾隆背诵率这么低。第一,他生得特别晚,第二,他生得特别晚的同时,废话还特别多。所以乾隆作为诗人,有这么低的背诵率,一点也不值得同情。
世界杯背后的神秘规律
今年夏天另一个大热点是俄罗斯世界杯。虽然世界杯跟我们国家的足球没有什么直接关系,但这不妨碍我们看热闹。在世界杯官网,我发现了每个参赛球员的身高数据,计算了一下每支球队的平均身高:
我把它和八分之一淘汰赛的胜负结果对比了一下,发现八场比赛里有七场是身高更高的球队赢了。
这个规律在四分之一淘汰赛里神奇地延续了:
也就是说,这届世界杯有一个神秘的规律:每一轮有且仅有一支身高更矮的队伍获胜。按照这个规律,半决赛的两场比赛中,法国对比利时的结果是更高的比利时输了,所以剩下那场比赛肯定是更高的克罗地亚赢。果然:
这是决赛的对阵,最后如我所料,确实是更矮的法国赢了。
虽然这场决赛是近年世界杯中最精彩的决赛之一,但我的内心毫无波澜,因为我已经提前两轮预测到了结果。我觉得真正值得法国队开心的不是他们有多么厉害,而是在决赛中遇到了一支比他们更高的球队。
我做了一个设想,如果他们决赛遇到中国队会怎么样?中国男足国家队队员的平均身高是181.8厘米,比法国队矮了1.5厘米。因此,按照我发现的规律,他们应该庆幸的是在决赛中没有遇到中国男足。
我们所学知识运用的可能性
生活中的实际问题也同样可以用数据分析来解决。北京夏天特别多雨,一下雨就会出现雨伞拿错的问题。这本质上是因为大家的雨伞特点差不多。如何找一把不会拿错的伞呢?我的思路是,哪些特点的雨伞销量更高、大家更容易有,那我就用逆向思维避开这些雷区。我找出淘宝卖得最多的四千多款雨伞,分析了一下它们来自哪里、它们的价格以及它们的颜色。只要避开这些特点,我买到的伞必然是不容易撞的伞。
这会是一把什么样的伞呢?我发现最罕见的颜色是绿色。所以,一把最不容易撞的伞应该是绿色的。这里没有什么科学道理,主要是文化因素。
数据分析还能回答许多问题,比如古代诗人谁的中考成绩最好?“创造101”节目中什么样的女孩更容易出道?成为支付宝锦鲤和被雷劈中,哪个可能性更大?什么时候去迪斯尼乐园人最少?为什么明星大多数是天秤座的?以及在朋友圈转发杨超越是不是有用?
解答这些问题需要的知识其实很简单,主要是加减乘除和平均值的概念,以及一点Excel的技巧。而这些知识其实一般人都有。
我做这些数据分析的目的,除了带来一些乐趣,还想传递一个信息:我们所学的知识在解决生活中的问题时,存在很多的可能性。这是我在数据分析过程中发现的像摸鱼一样的乐趣,也是我理解的果壳少年现在在做的事情。
有意思博物馆是果壳旗下科学活动IP,以流动博物馆方式,呈现各种新奇、有料、好玩的活动。
果壳少年ID:guokr_junior
果壳为中学生量身打造的知识产品
还不快关注一下!
果壳ID:Guokr42
整天不知道在科普啥的果壳
建议你关注一下