蛋白质是大而复杂的分子,在所有活细胞中起着至关重要的作用,是生命活动的执行者,它们会自然地构建、修饰和分解我们细胞内的其他分子,蛋白质还广泛用于工业过程和产品以及我们的日常生活中。以蛋白质为基础的药物也非常普遍,例如治疗糖尿病的胰岛素,就是最常用的处方药之一,一些昂贵的抗癌药物也是基于蛋白质的抗体药。
如果想改造出与自然界发现的蛋白质或酶不同的蛋白质和酶,目前使用的蛋白质工程的方法,依赖于将随机突变引入蛋白质序列,但是,每引入一个额外的随机突变,蛋白质活性就会下降。而且,整个过程非常缓慢,需要进行多轮非常昂贵且耗时的实验,以筛选出数百万个蛋白变体。
瑞典查尔姆斯理工大学等单位的研究人员在Nature子刊Nature Machine Intelligence发表了题为:Expanding functional protein sequence spaces using generative adversarial networks的研究论文。
研究团队开发了一种名为ProteinGAN的基于AI的生成式深度学习方法,该方法能够产生新型的、有功能活性的蛋白质,而且整个过程非常快,仅需几周时间就能从计算机设计到得到有功能活性的蛋白。这项研究代表了合成蛋白质领域的新突破,有助于更快速、更经济地开发基于蛋白质的治疗药物。
生成式对抗网络(Generative Adversarial Networks,GAN)是一种深度学习模型,该模型之前因用于生成以假乱真的照片和视频而闻名。但是在这项研究中,研究团队尝试用GAN产生具有类似天然蛋白质的物理特性的高度多样化的蛋白质变体,并对这些蛋白质进行测试。研究团队通过为AI提供大量来自经过深入研究的蛋白质的数据,让AI研究了这些数据后,开始尝试根据它创建新的蛋白质。
同时,AI的另一部分尝试弄清楚新合成蛋白是否是假的,蛋白质在系统中来回循环,直到AI无法区分其是天然蛋白质还是合成蛋白质为止。实际上,我们日常广泛使用的蛋白质并不总是完全天然的,有很多是通过合成生物学和蛋白质工程技术制成的。使用这些技术,对天然蛋白质序列进行了修饰,以期创建合成新型蛋白质变体,希望这些变体更加有效、稳定。
但是传统方法最大的问题在于效率低下,昂贵且耗时,因此,基于AI的新方法加快对蛋白质的改造,能够大大降低研发成本,对于开发基于蛋白质的药物(例如抗体和疫苗)以及工业酶非常重要。这项研究由瑞典查尔姆斯理工大学、立陶宛维尔纽斯大学,以及一家位于立陶宛的创业公司Biomatter Designs合作完成。Biomatter Designs创立于2021年,于2021年1月份获得了50万欧元的种子轮投资。
研究团队表示,下一步将探索如何将该技术用于蛋白质特性的特定改进,例如提高稳定性,这可能会给工业技术、以及疾病治疗中使用的蛋白质产生极大改进和提升。