AI精准预测蛋白质结构,结构生物学何去何从?

作者: 颜宁、张阳等

来源: 返朴

发布日期: 2021-07-31 12:00:00

谷歌旗下的DeepMind公司宣布其新一代AlphaFold人工智能系统在国际蛋白质结构预测竞赛(CASP)上精确预测了蛋白质的三维结构,引发了全球媒体关注。这一成就被认为是“划时代的进步”,并引发了关于结构生物学家未来角色的讨论。

2020年12月1日,谷歌旗下的DeepMind公司宣布,其新一代AlphaFold人工智能系统在国际蛋白质结构预测竞赛(CASP)上击败了其余的参会选手,精确预测了蛋白质的三维结构,准确性可与冷冻电子显微镜(cryo-EM)、核磁共振或 X 射线晶体学等实验技术相媲美。

这一消息引发了全球媒体关注,前Genentech首席执行官Arthur D. Levinson博士盛赞这一成就是“划时代的进步”。人工智能的“进击”对生物学、对其他学科会有什么影响?有人提出:AI都能解蛋白质结构了,结构生物学家是不是该失业了?《返朴》总编、结构生物学家颜宁特邀几位同仁对这一新闻各抒己见,回答大家的疑问。

AlphaFold2显然是个大突破,这是从1969年第一篇Journal of Molecular Biology论文用比较建模方法预测蛋白质结构的51年来的真正突破。

最近四年来,有共同进化预测contact map(氨基酸接触图谱),并引入深度学习之后,原来的ITASSER/Rosetta/RaptorX等算法都有了很大进步,比原来提升了计算精度一倍以上,只不过AlphaFold2进步更多,说他们接近解决了这个问题没错。

2020年第14届国际蛋白质结构预测竞赛(CASP14)共有84个常规题目,其中有14个题目因为生物实验没给出确定结构等原因被取消或延缓,其他70个题目的单体和复合物蛋白质所含有的氨基酸个数从73到2180不等。19个国家的215个小组参加了CASP14。

最终,谷歌旗下DeepMind公司的人工智能系统AlphaFold2在2018年的Alphafold基础上迭代创新,超常发挥,一枝独秀,基本解决了“从氨基酸序列预测蛋白质结构”这个困扰人类50年的生物学第二遗传密码问题。

首先,简单说一下,什么是生物学里的“结构”。用个不太恰当的类比:变形金刚。比如擎天柱是辆车还是个机器人,这就是不同的结构了,机器人能打架大车做运输,功能也不一样。而不同的汽车人组成成分可能差不多,都有合金、玻璃、橡胶,但是形态各异,特长也不一样。生物分子的组成成分和基本单元就那么几种,但是组装起来,不同的序列不同的结构,于是功能各异、五花八门。

根据现在披露的结果,AlphaFold2已经基本达到实验解析结构的精度。前天AlphaFold2团队的报告展示了新冠病毒SARS-COV-2的预测结果,说明RNA聚合酶这么大的蛋白也能基本预测准确。理论上,这会对结构生物学有很大冲击,尤其是以后单颗粒cryo-EM的实验方法上,是否还需要把分辨率做得那么高?低分辨率的电子密度图,甚至SAXS数据结合预测结果应该就能解决问题了。

UUID: b7f47f09-d098-4b0c-88af-cc5b7ad77065

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/格致论道讲坛公众号-pdf2txt/2021/格致论道讲坛_2021-07-31_「转」AI精准预测蛋白质结构,结构生物学何去何从? | 观点.txt

是否为广告: 否

处理费用: 0.0061 元