拉斯克奖(Lasker Awards)是医学界仅次于诺⻉尔奖的⼀项⼤奖,旨在表彰那些在⼈类疾病的理解、诊断、治疗或预防⽅⾯取得重⼤进展的科学家。拉斯克奖也常常被称作“诺⻉尔奖⻛向标”。2023年拉斯克基础医学研究奖获得者。
2023年拉斯克奖中的基础医学研究奖授予了DeepMind的两位科学家,Demis Hassabis和John Jumper,以表彰他们发明了⼈⼯智能(AI)系统AlphaFold,解决了从氨基酸的⼀维序列预测蛋⽩质三维结构的挑战。由他们带领的AlphaFold团队将结构预测的准确性和速度都提升到了前所未有的⽔平,迅速推进了我们对基本⽣物过程的理解,以及促进药物设计的发展。
⼈体的蛋⽩质在细胞内扮演着诸多重要的⻆⾊。它们的功能与它们从线性氨基酸链折叠成三维结构后所形成的形态密切相关。因此,理解蛋⽩质的结构可以阐明它们的功能,进⽽揭开众多⽣物学之谜。60多年前,科学家就已经证明,未展开的蛋⽩质可以在没有帮助的情况下恢复其形状,因此,氨基酸序列编码了蛋⽩质的最终组织。对于科学家来说,他们希望⾄少能在理论上,理解是什么引导了氨基酸链形成正确结构。
1994年,对蛋⽩质折叠感兴趣的科学家组织了学术论坛CASP(蛋⽩质结构预测的关键评估),⽬的是让相关领域的研究⼈员能更好地分享和交流研究进展。每隔两年,参与CASP⽐赛的选⼿就会收到已确定结构、但还没有对外公布的蛋⽩质氨基酸序列,他们要做的就是利⽤他们所开发的系统,对蛋⽩质的结构进⾏预测,然后将预测结果与实验测得的结果进⾏⽐较。最终根据预测的准确性进⾏打分。
在2018年的第13届CASP竞赛上,来⾃DeepMind的科学家正式带着机器学习参与到了这场⽐赛中。与依赖于预先设想的逻辑的传统AI不同,Hassabis和Jumper团队的系统是以机器学习作为其蛋⽩质结构预测的核⼼组成部分,能⾃发地从数据中发现模式。最终,他们赢得了CASP13的第⼀名,⽽且他们的准确性远远领先于第⼆名,同时也⽐CASP12的最佳成绩提⾼了近50%。
AlphaFold2会从⼀个序列开始,然后在数据库中搜索与之相似的序列。它将这些演化家族的成员以氨基酸链的形式排列出来。它还创建了⼀个信息矩阵,其中包含的是蛋⽩质中的每⼀对可能的氨基酸的线性距离以及相对⽅位的信息。这两个数据集——多序列排⽐(MSA)和成对表征会在AlphaFold2的第⼀阶段(被称为Evoformer)中并⾏处理。如果相关蛋⽩质的结构已经确定,系统也可以使⽤它们。
在早期,EvoFormer发展出⼀个粗略的结构假设,并对其进⾏检验和完善。
在2020年的CASP14上,AlphaFold2再次超越竞争对⼿,它的预测结果已经精确到原⼦精度,⽽且它能在⼏分钟的时间内,对即使缺乏模板的蛋⽩质也⽣成极好的结果。这是第⼀个可以在没有类似结构的情况下构建⾼分辨率预测的⽅法。2021年7⽉,Hassabis和Jumper发表了他们的⽅法以及对⼏乎所有⼈类蛋⽩质的结构预测。
在短短两年的时间⾥,这些结果的影响⼒已经超过了⾃1900年以来发表在《⾃然》杂志上的⼏乎全部的10万篇研究论⽂,排名第50位,在顶级期刊上被引⽤7000多次。
除了基础医学研究奖,拉斯克奖还有另外两个重要奖项——临床医学研究奖和特殊成就奖。
James Fujimoto、David Huang、Eric Swanson因发明了⾰新眼科研究、可快速检测出损害视⼒的视⽹膜疾病的光学相⼲断层扫描技术,⽽分享了2023年的临床医学研究奖。2023年的特殊成就奖授予了Piet Borst,以表彰他50年来卓越的科学发现,他的⼯作揭示了寄⽣⾍如何逃避⼈类免疫系统,并为癌症耐药性的分⼦泵提供了⻅解。
他揭示了⼀种意想不到的代谢途径,揭示了⼀种新的DNA构建块,并确定了⼀种遗传性疾病的⽣化基础。