在每一个植物、动物和人类的细胞中,都包含了数以亿计的分子机器。这些分子机器由蛋白质、DNA和其他分子组成,但这些分子没有一个能够独立运转。科学家只有通过观察它们的相互作用,才能够真正理解复杂的生命过程。
在一项新发表于《自然》杂志的研究中,DeepMind的研究人员与谷歌旗下的人工智能药物公司Isomorphic Labs,发布了人工智能系统AlphaFold 3,它能够以前所未有的精度,预测所有生命分子的结构和相互作用。与现有的预测方法相比,AlphaFold 3在预测蛋白质与其他分子的相互作用时,精确度至少有50%的改进;对于一些重要的相互作用,预测精确度甚至提高了一倍。
2020年,由谷歌DeepMind开发的人工智能系统AlphaFold可以根据氨基酸序列,准确地预测蛋白质的3D结构,为生物学中的一个主要挑战提供了解决方法。到2021年中,它已经绘制出了人体中98.5%的蛋白质。在这几年里,全球数以百万计的研究人员也已经利用这个强大的人工智能系统,在疟疾疫苗、癌症治疗和酶设计等多个领域取得了重大发现。
尽管已经取得了如此巨大的成功,但AlphaFold团队并没有止步,他们一直试图进一步扩展这个工具的潜能。
现在,AlphaFold的最新版本——AlphaFold 3不仅可以预测蛋白质的形状和结构,还可以预测蛋白质、DNA、RNA、配体(小分子)和其他生物分子的结构,以及这些分子以不同的形式结合在一起形成的复合物。
相较于之前的版本,AlphaFold 3经历了一些重大的升级,例如新版本更少地依赖于与目标序列相关的蛋白质信息。另外,还有一个较为重大的变化是,AlphaFold 3使用了被称为扩散模型的机器学习网络。这种扩散网络被人工智能图像生成器所使用,扩散过程从原子云开始,经过许多步骤后,最终汇聚成最精确的分子结构。
AlphaFold 3对分子相互作用的预测,已经超过了现有的所有系统的精确度。
研究人员指出AlphaFold 3优于另一个人工智能算法RoseTTAFold All-Atom。例如,在预测与配体相互作用的蛋白质结构时,AlphaFold 3的精确度达到了约76%,而RoseTTAFold All-Atom的精确度为42%。对于药物研究来说,AlphaFold 3可以预测药物中常用的分子(如配体和抗体)的相互作用,这包括蛋白质与配体的结合以及抗体与靶蛋白的结合。
在不需要输入任何结构信息的情况下,AlphaFold 3比最优的传统方法的精确度要高出50%,这使得AlphaFold 3成为第一个超越基于物理的生物分子结构预测工具的人工智能系统。预测抗体-蛋白结合的能力,对理解人类免疫反应的各个方面和设计新的抗体,都至关重要。
总的来说,AlphaFold 3将生物学带入了一个更清晰的世界,将科学家带到了蛋白质之外的更广泛的生物分子领域。它使科学家能够看到细胞系统的所有复杂性。从研发生物可再生材料到开发更具韧性的作物,从加速药物设计到基因组学研究,AlphaFold 3的飞跃性进展将开启更多的科学研究领域。