去年,DeepMind开发的“AlphaFold 2.0”,在权威蛋白质结构预测评估竞赛(CASP),准确度排名第一。这一重要进展振奋人心,我们仍在等待详细的技术论文披露。在论文披露之前,本文是我们看到最好的一篇完整介绍该突破的技术科普文章,出于科学传播目的,现翻译全文如下:
如何向公众介绍蛋白质折叠问题?一种的常见方法是将其与人类的日常宏观行为进行比较。具体来说,蛋白质折叠类似于人类的折纸活动。折纸是一种用相对简单的二维纸张制作复杂三维形状的创造性尝试。网络漫画xkcd也做了和我们相同的比较。
尽管我们做了简单的比喻。但是实际上,蛋白质折叠是一个比大多数人想象的要难得多的问题,而且这种困难要数倍于大家想象的程度。折纸问题从二维变化到三维,相差一个维度;但是蛋白质折叠是从一维到三维,足足相差了两个维度。用一张普通的白纸折叠成千纸鹤可能很困难,但如果是从一块松软的绳子开始呢?
DeepMind的AlphaFold 2.0进展一经披露,蛋白质结构自动预测问题被解决这一新闻被学术界和工业界广泛讨论,其中包括赞誉,也包括批判。这是一项重大进步,正如《麻省理工科技评论》(MIT Technology Review)文章中引用约翰・穆尔特(John Moult)教授所说,这是“首次使用AI技术解决重大科学问题“。
在2020年蛋白质结构预测竞赛(CASP14)中,DeepMind的AlphaFold 2取得了92的GDT_TS。这意味着,对于超过90%的蛋白质结构,AlphaFold 2都给出了准确的预测。