金洋:《数据分析:一种看待生活的趣味视角》
钱江摸鱼是我的笔名。取这个笔名是因为我小时候经常在钱塘江边摸鱼,那是我童年里最快乐的事情。我现在在北京大学读经济学博士。作为一个经济学博士,我日常分析的主要是数据问题,我把这些工作理解为在数据海洋里的摸鱼。在果壳期间我做了一些与生活相关的数据分析工作,发现了一些有意思的结果。
乾隆写了四万首诗没人背,我们究竟在背谁的诗
今年暑假最火的电视剧无疑是《延禧攻略》,剧中的男主角是乾隆。乾隆不但是个皇帝,还是一个诗人,还是一个最悲哀的诗人:他一生写了四万首诗,却没有一首需要背。我对乾隆表示同情的同时,也被激起了好奇心:如果说乾隆是最悲哀的诗人,那么哪位诗人最幸运,用最少的写诗量实现了最大的背诵量呢?我定义了一个背诵率的概念:背诵率越高,说明诗人在实现进入课本这件事上的效率越高。
世界杯背后的神秘规律
今年夏天另一个大热点是俄罗斯世界杯。虽然世界杯跟我们国家的足球没有什么直接关系,但这不妨碍我们看热闹。在世界杯官网,我发现了每个参赛球员的身高数据,计算了一下每支球队的平均身高:我把它和八分之一淘汰赛的胜负结果对比了一下,发现八场比赛里有七场是身高更高的球队赢了。
我们所学知识运用的可能性
生活中的实际问题也同样可以用数据分析来解决。北京夏天特别多雨,一下雨就会出现雨伞拿错的问题。这本质上是因为大家的雨伞特点差不多。如何找一把不会拿错的伞呢?我的思路是,哪些特点的雨伞销量更高、大家更容易有,那我就用逆向思维避开这些雷区。我找出淘宝卖得最多的四千多款雨伞,分析了一下它们来自哪里、它们的价格以及它们的颜色。只要避开这些特点,我买到的伞必然是不容易撞的伞。