2021年度十大科学突破:AI助力蛋白质结构预测

作者: 朱哼哼

来源: Science

发布日期: 2021-12-17 07:30:42

2021年,Science杂志公布的年度科学突破中,AlphaFold和RoseTTA-fold两种基于人工智能预测蛋白质结构的技术位列榜首。这些技术解决了困扰生命科学近50年的蛋白质折叠问题,并通过开源和免费使用,极大地推动了蛋白质结构研究的发展。

2021年11月17日,Science杂志公布了2021年的年度科学突破榜单,AlphaFold和RoseTTA-fold两种基于人工智能预测蛋白质结构的技术位列榜首。

除此之外,年度科学突破还包括:开发针对COVID-19的抗病毒药、μ子的新测量、火星地震观测、从土壤恢复古代人类DNA、CRISPR体内应用、对早期人类发展的新见解、使用迷幻类药物治疗PTSD、开发用于治疗传染病的单克隆抗体以及聚变能生成的进步。

此外,Science杂志还评选了三个年度科学故障(breakdowns),包括实现气候目标的希望渺茫、阿尔茨海默病药物引发愤怒,以及科学家们因新冠疫情受到排斥和攻击。本文主要介绍本年度最重要的科学突破——基于人工智能的蛋白质结构预测。

结构生物学持续50多年的困惑我们都知道,蛋白质是生命活动的主要承担者,甚至毫不夸张的说,没有蛋白质就没有生命。因此,长期以来蛋白质都是生命科学工作者研究的重点。

而其中,蛋白质的结构更是众多生命科学工作者研究的热点,毕竟其主要功能是由结构决定的。1957年,John C. Kendrew和Max F. Perutz通过X射线晶体学确定了第一个蛋白质结构。不久之后,Christian B. Anfinsen Jr.提出蛋白质的结构在热力学上是稳定的,似乎可以根据蛋白质的氨基酸序列来预测蛋白质的三维结构。然而,蛋白质的结构复杂性远超人们的想象。

依据中心法则,蛋白质主要是由DNA转录成RNA,再翻译成肽链后组装而来,一个蛋白质分子是由一条或几条多肽链组成,多肽链则折叠成特有的形状。同时,蛋白质分子的专一形状是由4个层次的结构决定的,包括一级、二级、三级和四级结构,前一级结构决定后一级结构。

AI助力解决蛋白质结构预测难题随着计算机科学的发展,此前曾有学者提出利用计算机模型解决蛋白质折叠问题。

虽然这一想法是可行的,但是在随后数十年的时间里,人们开发的各种计算机模型预测蛋白结构的准确性始终有限。在过去25年中,国际蛋白质结构预测大赛(CASP)一直关注这个领域的进展,试图寻找能够完美解决蛋白质折叠问题的计算机模型。直到第14届大赛CASP14大赛成功举办,DeepMind旗下的AlphaFold系统在蛋白质结构预测方面表现出了无与伦比的准确性。

该比赛的评价方式是将参赛者提供的解决方案与“黄金试验标准”进行对比,用GDT评分衡量准确性,范围为0-100,GDT分数在90分左右,即可视为对人类实验方法具备竞争力。而DeepMind旗下的AlphaFold系统总分竟然达到了92.4,和实验的误差在1.6,即使是在最难的没有同源模板的蛋白质上面,这个分数也达到了了恐怖的87.0。

同时,AlphaFold的神经网络能在几分钟内预测出一个典型蛋白质的结构,还能预测较大蛋白质(比如一个含有2180个氨基酸、无同源结构的蛋白质)的结构。该模型能根据每个氨基酸对其预测可靠性进行精确预估,方便研究人员使用其预测结果。

随后,在今年7月份,华盛顿大学医学院生物化学系教授、蛋白质设计研究所所长David Baker领导一支计算生物学家团队,成功开发一款名为RoseTTAFold的工具,基于深度学习,能够根据有限的信息快速准确地预测出目标蛋白质的结构,达到与AlphaFold2不相上下的准确度。

不仅如此,RoseTTAFold所需的计算耗能与计算时间均比AlphaFold2还要低:仅用一台游戏计算机,在短短十分钟内就可以可靠地计算出蛋白质结构。更值得注意的是,RoseTTAFold的代码和服务器完全免费提供给科学界!自7月以来,相关程序已被140多个独立科研团队从GitHub免费下载,来自世界各地的科学家现在正在使用RoseTTAFold来构建蛋白质模型,以加速相关领域的研究。

同样在今年7月份,DeepMind创始人兼首席执行官Demis Hassabis也在Nature杂志上分享了AlphaFold的开源代码,并发表了系统的完整方法论,详尽细致说明AlphaFold是如何做到精确预测蛋白质3D结构的。也就是说,这款强大蛋白质结构预测模型已经是完全免费的。

至此,两种强大的基于人工智能的蛋白质结构预测模型全部免费开放,科研工作者可以随时利用这两款模型获取蛋白质的空间结构,而无需对蛋白质进行结晶或使用昂贵的冷冻电镜进行研究。

UUID: 5cf78aa2-693a-465b-b888-5872f7bc6995

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/学术头条公众号-pdf2txt/学术头条2021年/学术头条_2021-12-17_Science公布2021年度十大科学突破,AI这项前所未有的突破上榜.txt

是否为广告: 否

处理费用: 0.0047 元