以下文章来源于科研圈
图片来源: linkedin.com
撰文 Dalmeet Singh Chawla
翻译 王可
审校/编辑 魏潇
— “AI AI 告诉我,谁是现代最有影响力的生物医学研究者?”
— “麻省理工学院博德研究所(Broad Institute)的所长及创始人 Eric Lander。”
这当然不是童话故事中那个能告诉你世界上谁最美的魔镜,这是真实发生的事情:文献搜索引擎 Semantic Scholar 通过人工智能算法,将 Eric Lander 这位遗传学家和数学家放在了现代最有影响力的生物医学学者排行榜的第一位。Semantic Scholar 创建于 2015 年,是一个致力于解决信息超载的学术文献搜索引擎。
它利用人工智能(AI)技术帮助用户从浩如烟海的文献中筛选有用信息,且能在一定程度上理解这些内容。这个免费工具由华盛顿州西雅图的艾伦人工智能研究所(Allen Institute for Artificial Intelligence)研发推出。值得一提的是,这家机构是在 2014 年由微软创始人之一保罗·艾伦(Paul Allen)参与创立的。
科研圈《环球科学》杂志旗下综合性学术传播与服务平台。
Semantic Scholar 的主页面:www.semanticscholar.org
最初 Semantic Scholar 仅关注计算机科学,但在去年增加了神经科学的文献;而今它又将其关注领域扩展了到了生物医学,涵盖了数百万计收录于 PubMed 等索引平台的研究文献。目前使用者能够通过 Semantic Scholar 获取近 4000 万篇文献。
2016 年,Semantic Scholar 的程序增加了评价科研人员及研究机构的功能。这个评价体系基于引用处上下文内容、排除自引等规则来定义论文的“高影响力引用”。同年 4 月,Semantic Scholar 就曾给出过计算机科学领域内的研究者排名——最具影响力的计算机科学家是在圈外鲜为人知的人工智能先驱、加州大学伯克利分校的迈克尔·乔丹。
“大家都叫他机器学习领域的迈克尔·乔丹,”西雅图艾伦人工智能研究所的负责人,Semantic Scholar 的创造者奥伦 · 埃齐奥尼(Oren Etzioni)如此打趣。
当 2016 年 11 月它的数据库扩展到神经科学领域后,Semantic Scholar 也被用来评价脑科学和神经科学研究者的影响力;现在,它推出了生物医学领域学者影响力的排名。
Top 10 榜单如下:
1. Eric Lander 麻省理工学院(遗传学)
Eric Lander,数学家和遗传学家,生于 1957 年,24 岁即获得牛津大学数学专业博士学位,40 岁当选美国科学院院士。他是麻省理工学院博德研究所(Broad Institute)创始人、所长;也是人类基因组计划美国部分的主要贡献者,在人类基因组测序方面做出了巨大贡献。
2. Karl Friston 伦敦大学学院(神经科学)
Karl Friston 生于 1959 年,英国伦敦大学学院维康基金会神经造影中心教授。他的研究通过统计参数映象和基于体素的形态学分析对脑成像数据分析做出了重要贡献。使得对大脑的影像学及功能研究进一步深入。
3. Raymond Dolan 伦敦大学学院(神经科学)
英国伦敦大学学院维康基金会神经造影中心主任,他对阐明情绪的神经机制,以及情绪对认知和决策的影响做出了重要的研究贡献。
4. Shizuo Akira(審良静男)大阪大学(免疫学)
日本医学家,大阪大学教授,他的最主要贡献是通过敲除 Toll 样受体(TLR)基因,发现 TLR 能识别一群不相关的源于微生物的分子;以及后来对 RNA 解旋酶、RIG-I(维甲酸诱导蛋白I)以及黑色素瘤变异关联蛋白5(MDA5)的鉴别。
5. David Botstein Calico公司 (生物学)
Calico 首席科学家,曾任普林斯顿大学负责综合基因组学的刘易斯-西格勒研究所所长。1980 年提出一个以限制性片段长度多态性来建构遗传连锁图谱的方法,用于鉴别出人类疾病的基因片断,包括亨丁顿舞蹈症和第一型乳腺癌易感蛋白(BRCA1)。1998 年与同事合力研发出一套统计方法与图形界面,被广泛应用于解释基因组和生物芯片数据。
6. Dennis Smith 辉瑞公司 (药代动力学)
辉瑞全球研发中心药代动力学研究室前负责人,药物代谢方面的专家,致力于研发更安全更有效的药物。他参与研发了 8 种美国 FDA 批准的全新化学实体药物(NCEs),并发表了超过 100 篇的论文。
7. Eugene Koonin 美国国家生物技术信息中心(生物信息学)
生物信息学家,美国国家生物技术信息中心资深研究员,美国科学院院士。主要研究方向为基因组序列比对分析以及全基因组范围的基因功能解析,他还对生命进化过程中的数学建模分析有巨大贡献,是基因组进化研究领域的领头羊。
8. Walter Willett 哈佛大学公共卫生学院(流行病学)
医学家和营养学家,哈佛大学公共卫生学院和医学院教授。他曾在 2001 年出版了一本营养学著作 Eat, Drink, and Be Healthy,颠覆了许多流行的营养学观念,甚至对美国官方机构的指导意见提出了批评。这也使他成为了最著名的营养学家之一。
9. Rudolf Jaenisch 麻省理工学院(遗传学)
分子生物学家和遗传学家,通过建立小鼠转基因模型,为研究人类疾病作出了重大贡献,被认为是转基因研究领域的先驱。他的小鼠模型使我们能够深入研究癌症、神经性疾病等多种疾病发生的原因,还让我们能够观察和探讨 DNA 复制错误和 X 染色体失活带来的影响。
10. Bert Vogelstein 约翰霍普金斯大学医学院(肿瘤学)
癌症基因组学领域的先驱,基于对大肠癌的研究,他于 1988 年提出一个人类癌症模型,假设连续积累的癌基因和抑癌基因的突变可以导致癌症。p53 是首个印证这一假说的基因。1991 年他与人合作发现了另一抑癌基因 APC。这些研究为现在许多现代癌症研究扫除了道路。
不过,这份列表中女性的缺失引发了社会媒体的注意力,以至于有些研究人员怀疑这样的结果反映出 Semantic Scholar 的算法有性别偏差,不过也有人认为这反映出的是长久以来生物医学乃至科学出版界对女性的差异对待。
在一份声明中,负责监督 Semantic Scholar 项目的 AI2 高级产品经理玛丽·海格曼(Marie Hagman)表示:“我认为,这份‘高影响力引用分析’中前十名作者没有女性,恰恰反映出了人们诟病已久的科学出版行业内的‘发表偏倚’,这一问题也是现今全球对话关于性别议题的重点内容。
同时,我们也因为人们对此越来越多的关注而感到备受鼓舞——要知道,去年我们给出同样清一色的男性名单时,并没有看到这样的舆论。
如何应对“论文爆炸”时代
“粗略算来,每隔 9 年科学论文的数量就能翻一倍。在这样的增长速度下,想要跟上科学的发展变得越来越艰难,”海格曼说,“这些论文里存储着太多我们想要‘呈现出来’的信息,我们认为肯定有某些办法能够让人们从成堆的 PDF 中解脱出来。”
Semantic Scholar 每月平均使用次数达到一百万,然而她希望最终这一工具能够走得更远——比如向研究人员直接提供一些理论假说供他们检测。在她的展望中,这一工具能够提取不同论文中相似实验的数据,并将这些数据进行比较和分析。她说:“我们相信,自动化的荟萃分析(meta-analysis)将是我们期待达成的目标。”
同时海格曼也指出了 Semantic Scholar 的局限性:无法捕获需要付费的论文。然而,她的团队也正在和出版商们协商,讨论他们能在何种程度上达成对付费论文的访问。
除了 SemanticScholar,现今已有的很多其他学术搜索引擎,比如谷歌学术(Google Scholar)和微软学术搜索(Microsoft Academic Search),也都能够帮助特定领域的专业研究人员查找到他们想要的信息。但海格曼表示,如果想要探索不同领域间的联系,或者一些新的领域,那么没有任何一个工具能够像 Semantic Scholar 一样提供“发现式体验”。
Semantic Scholar能够生成科学家之间的学术交流关系,这只是它众多功能中的一条。
宾夕法尼亚大学的 AI 研究员兰迪·奥尔森(Randy Olson)认为,Semantic Scholar 的实用性远远超出了谷歌学术。他问道:“Semantic Scholar 能意识到在某一领域相对不重要的发现会在另一领域是一个重大突破吗?现在只有时间能回答,但我对这个问题抱乐观态度。”
不过对于未来这类搜索工具的发展趋势,宾夕法尼亚大学的一位数据科学家丹尼尔·希梅尔斯坦(Daniel Himmelstein)认为:“通用型的搜索引擎可能会变得更加先进,因此我们可能不再需要专门的学术搜索引擎。”他说,“(学术搜索引擎)很难打败已经经过几十年训练、从整个互联网中检索信息的搜索引擎。”
相关阅读:
它或许会取代影响因子,它的名字叫 Semantic Scholar
原文链接:https://www.sciencemag.org/news/2017/10/who-s-most-influential-biomedical-scientist-computer-program-guided-artificial
本文转载自公众号“科研圈”(ID:keyanquan)