新⼀代AlphaFold发布,它⽐AlphaFold 2有哪些提升?最新Nature刊⽂显示,新模型能预测含有蛋⽩质数据库(Protein Data Bank)内⼏乎所有分⼦类型的复合物的结构,不只是蛋⽩质,还包括⼩分⼦(配体)、核酸(DNA和RNA)等。
2024年5⽉9⽇,Alphabet旗下⼈⼯智能(AI)药物发现公司Isomorphic Labs与⾕歌(Google)旗下DeepMind共同宣布推出新⼀代AI⽣物分⼦结构模型AlphaFold 3。与许多AI蛋⽩结构预测模型不同的是,AlphaFold 3能够针对多种蛋⽩质、DNA、RNA和⼩分⼦配体之间的交互作⽤进⾏复合物结构预测,并可预测翻译后修饰(PTM)和离⼦对这些分⼦系统结构的影响。
根据新闻稿,AlphaFold 3具有原⼦级结构的精准度,能够加强针对难以靶向靶点的药物理性设计,有望为未来药物发现带来崭新的⼀⻚。AlphaFold 3相关论⽂同步发表于顶尖科研杂志《⾃然》当中。AlphaFold 3的开发建⽴在AlphaFold 2蛋⽩质结构预测模型的基础之上。2020年,AI蛋⽩结构预测模型AlphaFold 2的推出引发了科学界的震动。
基于氨基酸序列,该模型能准确地预测蛋⽩质的3D结构,其精准程度可与常规实验技术解析的3D结构相媲美。其诞⽣也“解决了⽣物学50年来的⼀个重⼤挑战”。⽽AlphaFold 3则在此基础上进⾏进⼀步的突破,科学家可以在模型中输⼊⼀个⽣物分⼦复合体的描述,并在⼏秒内获得该复合体3D结构的准确预测。输⼊的⽣物分⼦系统可以包含多种蛋⽩质、核酸(DNA和RNA)、⼩分⼦配体和离⼦。
AlphaFold 3是⼀种采⽤神经⽹络架构的⽣成式AI模型,该神经⽹络架构建⽴在定制化Transformer架构之上,并使⽤扩散模型以⽣成输⼊系统中每个原⼦的位置。该模型以蛋⽩质数据库(PDB)中的全球分⼦结构数据为基础,对其中99%以上已知的⽣物分⼦复合体进⾏分析。PDB记录了科学家通过不同⽅法(如X射线晶体学和冷冻电⼦显微镜)精⼼测量的蛋⽩质及其他分⼦的结构信息。
论⽂摘要指出,与以往许多预测模型相⽐,AlphaFold 3显示出显著提⾼的准确性。包含对蛋⽩质-配体相互作⽤、蛋⽩质-核酸相互作⽤,以及抗体-抗原预测的准确性皆显著提升。此外,该模型的预测能⼒和准确性也在⼴泛的测试中得到了验证,包括许多全新系统和分⼦界⾯。以免疫检查点蛋⽩TIM3为例,研究团队发现并设计了能够与TIM3以⾼亲和⼒结合的⼩分⼦。
研究⼩组通过实验解开了三种TIM3蛋⽩与配体结合的晶体结构,以阐明其结构与活性关系。在此之前,TIM3的⼩分⼦结合晶体结构并不存在于PDB当中,因此没有进⼊AlphaFold 3的训练数据内。此外,研究⼈员通过实验发现这些配体与TIM3结合于⼀个之前未被发现的⼝袋当中。
接着,研究⼈员将TIM3蛋⽩质的原始序列和每个配体的SMILES信息输⼊⾄AlphaFold 3当中进⾏评估,除此外并没有提供AlphaFold 3任何关于蛋⽩质的结构、⼝袋等额外资讯。SMILES是⼀种化学符号系统,使得科学家能够以计算机可以辨认的⽅式表示化学结构。令⼈兴奋的是,AlphaFold 3对TIM3-配体复合物的结构预测与实验结果⼀致,并发现在实验中所观察到的结合⼝袋。
重要的是,AlphaFold 3所预测的结合模式⼏乎与实验中的晶体结构完全⼀致,⽽所预测的⽆配体结构则显示了⼀个呈扁平和开放状态的不同⼝袋构象。AlphaFold 3在蛋⽩质有⽆配体的状态下显示不同的结构预测,表明它能够根据其他分⼦的存在,情境性地调整蛋⽩质结构。“AlphaFold 3的确是⼀项重⼤突破。它能够有效模拟多种不同类型的分⼦相互作⽤,这是包括精准确定药物靶点在内众多研发项⽬的核⼼。
”哈佛医学院⽣物医学信息学助理教授Marinka Zitnik博⼠说道。Zitnik博⼠并未参与AlphaFold 3的测试与开发。Isomorphic Labs的药物发现团队已经使⽤AlphaFold 3进⾏基于结构的药物理性设计。此外,Isomorphic Labs已经与礼来(Eli Lilly and Company)和诺华(Novartis)开展药物研发合作。
学术机构的科学家也可以通过AlphaFold Server这⼀由DeepMind开发的免费研究⼯具使⽤AlphaFold 3模型,以对他们想要研究的分⼦序列进⾏结构预测。然⽽就如同许多⽣成式AI模型,AlphaFold 3也容易出现“幻想(hallucination)”和偏⻅,且其知识范围也局限于训练所⽤的PBD数据。
此外,伯克利实验室⽣物科学副主任Paul D. Adams博⼠表示:“AlphaFold 3的进展是否具有变⾰性,还需要经过时间来验证。他指出,尽管模型的能⼒令⼈印象深刻,但该模型所显示的静态图像⽆法解答⽣物学中⼀些更棘⼿的问题。“蛋⽩质不是以静态形式发挥作⽤的,”Adams博⼠说道,“它们通过动态变化和多种构象状态实现功能。⽬前还没有技术能够解决这个问题。
”⽆论如何,AlphaFold 3的问世⽆疑为整个科学界与⽣物医药产业的⾛向带来深远影响。让我们期待在不久的将来,我们能够⼀同⻅证该预测模型如何加速药物开发进程,造福众多患者。