麻省理工新成果:哼唱一段旋律,AI就能创造一种“全新”蛋白质

作者: 学术君

来源: 学术头条

发布日期: 2020-03-18

麻省理工学院科学家通过将蛋白质结构转化为乐谱,利用人工智能设计出自然界中从未见过的“全新”蛋白质,该研究为蛋白质制造提供了新方法。

蛋白质在生命中的重要作用不言而喻,它是生命的基石。而我们机体内合成蛋白质的过程也是相当复杂,不仅涉及到氨基酸活化等一系列过程,还受体内各种生化物质的调控。此外,蛋白质复杂的三维折叠结构,让想要人工合成蛋白质的科学家们也望而却步。

当地时间3月17日,麻省理工学院科学家们给带来了一个新成果,他们通过将蛋白质的复杂结构转化成乐谱,随后给予电脑一个种子序列,人工智能系统就能设计出一种自然界中从未见过的“全新”蛋白质。他们发现这个“全新”蛋白质不仅具有折叠结构,而且比较稳定。此外,这种“全新”蛋白在自然界中从未发现。可以说,该研究为制造蛋白质提供了一种独特的方法。该研究成果发表在APL Bioengineering中。

该研究作者,麻省理工学院的Markus J. Buehler表示,这样一种方法为制造全新的生物材料铺平了道路。比如人们在自然界中发现了一种蛋白酶,就可以通过这种方法改进催化效率或产生新的蛋白变异。

众所周知,氨基酸是构成蛋白质的基本单位,要想人工制造出蛋白质,要么模仿现有的蛋白质,要么手工编辑组成蛋白质的氨基酸序列,但是这两个过程都十分耗时,而且改变氨基酸序列后对整个蛋白质结构和功能会产生什么影响,也很难预测。

“蛋白质一定有它自己的语言。” Buehler说。鉴于此,该团队尝试将蛋白质语言翻译成人们更容易理解的另一种形式 - 音乐,与音乐一样,蛋白质的结构也是分层的,在不同的长度或时间尺度上有不同的结构层次。鉴于构成蛋白质的20种氨基酸,都有一个独特的振动频率(量子化学理论计算),因此整个蛋白质的化学结构能够通过音乐理论中的音符、音量、旋律和节奏来描述。

该团队已于去年6月份成功开发出一套可以将蛋白质分子结构转化为声音的系统,该研究当时发表在ACS Nano杂志。该系统能够将自然界20种氨基酸转换成20个音调的音节,也就是说,构成任何一种蛋白质的氨基酸序列都能转换成一串音符。而蛋白质复杂的结构和功能信息也就编码在一段旋律的音调、音量和持续时间等维度中。

通过音乐来设计由氨基酸组成的蛋白质,然后,研究人员使用人工智能系统来研究多种不同蛋白质产生的旋律,他们让人工智能系统在音乐序列中引入微小的变化,随后将声音翻译回相对应的氨基酸序列。在生成蛋白的过程中,不同音乐的变化可通过控制温度参数来实现。通过这个过程,研究人员能够创造出现有蛋白质的变体,例如基于在自然界最强材料之一的蜘蛛丝中发现的一种蛋白质,来制造出不同于任何生物进化产生的更强大的蛋白质。

而在今天发表的这项研究中,研究人员使用蛋白质折叠方式产生的特定声音来训练人工智能系统,当系统学会理解折叠蛋白的复杂语言后,他们给予系统一个种子序列,随后人工智能系统根据这个初始序列推断并设计出一种“全新”蛋白。那么这个“全新”的蛋白是否存在与自然界中,是我们认识的已知蛋白质呢?

该研究团队通过将这个“全新”蛋白与所有目前已知蛋白信息的大型数据库进行比较,并使用普通模式分析其分子动力学和特征,最终证实通过人工智能设计的“全新”蛋白在自然界中尚未发现,而且这种“全新”蛋白质具有稳定的折叠结构。

此外,研究人员发现,通过阐明蛋白质的节奏和音调,也有助于在古典音乐中创造新的作曲技巧,这个方法被Buehler称为materiomusic。他表示,“在蛋白质数成千上万的进化过程中,自然界也给我们提供了声音如何组合的新思路”。大家也可以一起听一下研究人员合成的一些蛋白质音乐:https://soundcloud.com/user-275864738

UUID: 587eda3b-778e-4e49-b62e-a5d05c43c452

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/学术头条公众号-pdf2txt/学术头条2020年-上/2020-03-18_麻省理工新成果:哼唱一段旋律,AI就能创造一种“全新”蛋白质.txt

是否为广告: 否

处理费用: 0.0037 元