2024年5月8⽇,⾕歌DeepMind AlphaFold团队联合Isomorphic Labs公司在《⾃然》杂志上发表了题为“Accurate structure prediction of biomolecular interactions with AlphaFold?3”的论⽂,推出了全新的能够准确预测蛋⽩质、DNA、RNA、⼩分⼦配体结构以及它们相互作⽤模式的结构预测⼯具AlphaFold3,并期望能够转变科学界对于⽣物世界以及药物发现的理解。
在每⼀个植物、动物和⼈类细胞内部,都存在着数⼗亿个分⼦机器。这些机器由蛋⽩质、DNA及其他分⼦组成,但没有任何单⼀部分可以独⽴⼯作。只有观察它们如何在数百万种组合中相互作⽤,我们才能开始真正理解⽣命的过程。
AlphaFold3是⼀个具有⾰命性的新模型,它的⾰命性体现在两个⽅⾯:⼴泛性和准确性。
⾸先,在先前的结构预测⼯作当中,结构预测⼯具往往只针对某种特定的⽣物分⼦,⽐如蛋⽩质结构预测或者RNA结构预测,但AlphaFold3具有预测⼏乎所有⽣命分⼦的结构和相互作⽤的功能,其⼴泛性可⻅⼀斑。
其次,在实现了⼴泛性的同时,对于结构预测的准确性也有⻓⾜的进步,对于蛋⽩质与其他分⼦类型的相互作⽤,与现有预测⽅法相⽐,实现了⾄少50%的改进,⽽对于⼀些重要的相互作⽤类别,AlphaFold3的预测准确度实现了翻倍。
⽬前,AlphaFold3向科学界免费开放了AlphaFold Server,其中包含了AlphaFold3的⼤部分功能,供科学家进⾏结构预测。
Alphafold Server的链接如下:https://golgi.sandbox.google.com/about。总体来说,Alphafold Server的界⾯使⽤简单,可视化程度良好,⽤户可以在⽹站上提交各种不同的⽣物分⼦的序列,轻松地进⾏结构预测。
本篇⽂章将解答三个问题:1. AlphaFold3做了哪些改进?2. AlphaFold3的预测结果提升⼤吗?3. AlphaFold3还有哪些需要改进的问题?
AlphaFold3的改进在2021年7⽉15⽇,⾕歌DeepMind AlphaFold2的论⽂发表在《⾃然》杂志上。AlphaFold2作为基于深度学习的结构预测⼯具,能够以很⾼的准确度预测蛋⽩质的结构。
蛋⽩质的功能主要取决于蛋⽩质的结构,确定蛋⽩质折叠成何种形状被称为“蛋⽩质折叠问题”,这⼀问题在过去50年⾥⼀直是⽣物学中的⼀个重⼤挑战。⽽AlphaFold2在结构预测⽐赛CASP中,取得了令⼈眼前⼀亮的成绩,不仅展现了⼈⼯智能在结构预测上的巨⼤潜⼒,也掀起了使⽤⼈⼯智能对蛋⽩质进⾏建模的浪潮,使得蛋⽩质建模和设计的应⽤范围⼤⼤扩展。
AlphaFold3也是基于AlphaFold2进⾏了改进,⽬标则是将针对不同⽣物分⼦的⼯具统⼀到⼀个神经⽹络中,实现单⼀神经⽹络框架预测所有⽣物分⼦结构。基于这个⽬标,研究团队做了如下改进,以便包含更⼴泛的化学结构并提⾼数据的使⽤效率。
AlphaFold3的预测结果AF3能够从输⼊的聚合物序列、残基修饰和配体SMILES预测结构。为了衡量AF3在预测不同⽣物分⼦结构上的表现,研究者分别在蛋⽩质-配体相互作⽤、蛋⽩质-核酸复合体、RNA结构、共价修饰、蛋⽩复合体四个任务上对AF3的准确性进⾏了测量。
AlphaFold3的局限性不可否认,AF3在结构预测⽅法取得了很⼤的突破,但同时也存在⼀些局限性。局限性主要体现在四个⽅⾯:⽴体化学、幻觉效应、动态性以及对某些⽬标的准确性。
讨论分⼦⽣物学的核⼼挑战是理解并最终调控⽣物系统的复杂原⼦相互作⽤。AlphaFold3在这⽅⾯迈出了⼀⼤步,证明了在统⼀的框架中准确预测各种⽣物分⼦系统的结构是可能的。AlphaFold3减少了对MSA的依赖,所以可以很快完成结构预测。AlphaFold3也有⼀些局限,之后的提升⼀⽅⾯需要计算机领域的进展,另⼀⽅⾯也需要实验结构解析⽅⾯的进步,例如冷冻电⼦显微镜和冷冻电⼦断层成像。