每年到了这个时候,大家就要开始议论谁会得诺贝尔奖了。很多人和机构都会给出自己的预测结果,其中最有名的一个诺奖风向标大概是汤森路透引文桂冠了。他们是通过科学论文的引用来判断科学家影响力,并预测诺奖的。
这方法已经非常科学了,不过大家可能也知道,这些结果至少在预测当年的诺奖得主上表现还是相当失败的……2002年至今,汤森路透准确预测过出37位诺奖得主——但这些科学家都不是预测当年得奖的……如果你想预测今年的得主,至少可以根据汤森路透来排除掉一批人。预测诺奖为什么很难成功?
事实上,2008年的时候就已经有一个比较大规模的文献计量分析的论文对此进行了研究:http://arxiv.org/abs/0808.2517。
他们选择了物理和化学领域的专业期刊,通过其中的论文引用情况得出了1901-2007年每一年的科学家影响力排行榜,然后再把这些排行榜数据和这些年的诺奖得主以及被提名者(当然,因为保密50年的规定,提名者只研究到1945年)进行了比较,以此分析物理或化学领域的科学家“人气榜”是否能帮助预测诺奖得主。结果发现,那些获奖者确实差不多是在自己论文影响力达到巅峰的时候获奖的,分析引用数这个思路至少还是正确的。
然而,随着一个学科规模的扩大,以及细分领域的增加,文献计量结果对诺奖得主的预测力急剧下降。所以,就目前这个状况来看,从引用数据中准确预测出仅仅(最多)3个的诺奖得主,这基本上是没戏的(nearly impossible)……