2019年起,美国斯坦福大学医学统计学教授John PA Ioannidis团队每年都会基于爱思唯尔Scopus数据库,发布一份全球前2%顶尖科学家榜单(TOP 2% of the most influential scientists)。这份学术影响力榜单虽然“年轻”,但是被学术界接受,被认为反映了研究人员在其领域内的生产力和突出地位。
北京大学、香港大学、美国密歇根大学等许多高校的网站都曾在榜单发布后进行报道,或对自身的上榜教授名单进行详尽的统计和分析;一些学者也将入选这项榜单看作是自己职称晋升的砝码之一。
然而,一位名叫Akira Abduh的自由研究者却注意到这份榜单记录的数据存在一些异常:有学者自引率高达97%,有学者91年间只被记录了2篇论文还能入榜,还有学者的发表记录长达187年……全球前2%顶尖科学家榜单根据全球最大学术数据库Scopus的引文数据确定排名,目的是根据引文指标,为衡量科学家的学术影响力和卓越性提供更准确和更透明的标准。
根据2023年10月发布的最新版本,这份榜单将全球科学家归类为22个学科领域和174个子领域;只要一位学者发表的论文数达到或超过5篇,他就会获得一个在所属学科领域和子领域中的综合引用排名(百分位数)。但是,Akira Abduh发现,这份榜单公开的数据中存在一些不符合常理的错误。
在榜单中,共有235位科学家的论文发表生涯超过了80年。
其中,加拿大圣弗朗西斯·泽维尔大学的退休教授、生物学家William S. Marshall从1834年就开始发表论文,并且一直坚持到了2021年,这意味着他的论文出版生涯达到了惊人的187年。更离谱的是,英国剑桥大学学者Tom L. Blundell出生于1942年,但这份榜单显示1853年他就开始发表论文了,比出生时间早了快90年。
现代热力学之父、著名的开尔文勋爵1907年去世后,仍然“被发表”了一系列遗作,最新的甚至延续到了2011年。此外,法国索邦大学现任教授、麻醉学专家Francis Bonnet的论文发表生涯被错误地记录为开始于1866年,瑞士苏黎世大学现任牙科学教授Franz E. Weber遭遇了和上面这位医学同行一样的命运,也被记录为1866年就开始发表论文。
Akira Abduh还在这份榜单中发现了不少科学史上的伟大灵魂。例如,活跃在19世纪后半段的法国数学物理学家庞加莱的最后一次论文发表记录出现在了1999年,一百多年前获得诺奖的哥本哈根学派创始人尼尔斯·玻尔2019年还活跃在论文发表的第一线,阿尔伯特·爱因斯坦直到2021年还在发论文……显然,不论是187年的论文发表记录还是2021年还在发论文的爱因斯坦,大概率是因为数据记录有误。
但接下来这几位入榜人士的高产记录却很难分辨是否属于数据录入时的无心之过。1992年至今,英国利物浦大学心血管和代谢医学教授Gregory Y.H. Lip以3807篇论文的发表记录脱颖而出——平均每年要发表123篇文章。这还不是最高的,Elisabeth Mahase一年能发表212篇,Gareth Iacobucci一年能发表136篇。
但这两位都是《英国医学杂志》的记者,他们为这本著名医学期刊撰写的是新闻而非论文,却依然被榜单记录在内,而且排名十分靠前,甚至超过了2023年诺贝尔物理学奖得主Pierre Agostini。
此外,这份本应彰显科学家个人学术影响力的榜单,还包含一些“十分自恋”的学者。其中一位的自引率高达97%,还有27位的自引率超过了80%。有趣的是,一些发表量极少的学者也进入了这份榜单。
美国耶鲁大学已故教授、神经生理学家John F. Fulton在这份榜单的记录中只发表过2篇论文;1932年诺贝尔化学奖得主、美国表面化学家Irving Langmuir也只有2篇论文的记录,但全球排名还能达到606位……另外,美国疾病预防和控制中心(CDC)和世界卫生组织(WHO)等常发表论文的机构也被当成了论文作者,美国CDC还获得了全球9260位的排名……
与科睿唯安基于Web of Science数据库得到的年度高被引学者榜单,以及爱思唯尔与上海软科合作的中国高被引学者榜单相比,斯坦福2%榜单在国内的知名度相对没那么高。但是,如果在知乎等平台搜索该榜单,仍然有许多学术自媒体在发布关于这项榜单的中国学者入选情况。
根据部分自媒体的统计,2023年的斯坦福2%榜单中,清华大学上榜人次达到592,浙江大学、上海交大也都超过400人次,北京大学和哈尔滨工业大学紧随其后,分别以391和389人次排名第四和第五,其中北大附属医院有很大贡献。此外,中南大学和华中科技大学的上榜人次还超过了南京大学、中国科学技术大学等顶尖名校。
尽管目前并不清楚是否有国内高校或科研机构将这份榜单列入学者的晋升和评价体系,但确实有社交媒体用户表示,希望能将进入该榜单作为小亮点去评职称。但整体来看,大部分自媒体仅仅是利用“数人头”的排名游戏来吸引读者的点击和阅读,对榜单可信度的讨论则寥寥无几。虽然榜单制定者每次发布时都会强调,“任何引文指标都存在局限性,应该明智且有节制地使用”。
但找到了诸多问题的Akira Abduh态度则要鲜明得多:这份标准化的引文排名榜单存在诸多数据缺陷,不应该鼓励推广和使用。