生物计算是什么?为什么中国不能落后?

作者: 汪诘

来源: 科学有故事

发布日期: 2021-03-06 11:26:44

生物计算涉及利用计算机技术预测蛋白质的三维结构,这对于新药研发和疫苗研发具有重大意义。中国在这项科学事业中应积极参与,以保持在生物医学技术领域的竞争力。

什么是生物计算?如果有一位科学家跟你说,他是做蛋白质结构研究的,我想绝大多数人脑海中会浮现出这样的景象:他穿着白大褂,聚精会神地坐在显微镜前观察。这似乎已经成了生物化学家的标准形象。然而有一天你去他办公室,却发现根本看不到显微镜和试管,只看到他穿着宽大舒服的便装,在电脑上噼里啪啦地敲代码,这个景象必然会让很多人大吃一惊。

实际上,准确地说,这位科学家是一位生物计算学家(或计算生物学家)。他的研究对象的确是像蛋白质或者DNA这样微小的生物活性物质,但他和传统的生物化学家不同的是,他的研究工具不是试管和显微镜,而是计算机。

很多人在初次看到类似“某某公司进军生物计算”这样的新闻标题时,往往会产生强烈的不明觉厉的感觉。甚至有人以为是该公司要用生物活性物质来制造计算机,就像科幻电影中出现的那种插满电极的一摊软乎乎的脑组织。这真是一个天大的误会。这些新闻其实说的是:某公司要设计一种AI算法,它能够根据有限的蛋白质信息,准确地绘制出蛋白质的三维结构。

绘制出某个蛋白质的三维结构对于新药研发,例如新冠病毒的疫苗研发有着极其重大的意义。但是,这个问题也极为困难,它是当今人类科学面临的几个至关重要的挑战之一。蛋白质折叠问题蛋白质从微观上来说,就是一团有机大分子。它是构成生命的基本零件,每一种蛋白质都有一个特定的三维结构,但这种三维结构有一个特殊之处:它一定是由一根长长的链条折叠而成的。

组成蛋白质的基本单元是氨基酸,它就像魔尺的一个“节”。蛋白质刚刚生成时,就像一根长长的几十到几百节的魔尺。然后,它会在几微秒到几毫秒的时间内,迅速地折叠成一个特定的形状。因此,在电子显微镜中,每一个蛋白质就像是一团乱麻。因此,决定一个蛋白质性状和功能的,就是构成蛋白质的氨基酸序列和蛋白质最终折叠成的形状。

序列信息相对容易获得,但结构信息却极难获得。偏偏结构信息又更重要,因为知道了一个未知蛋白质的结构,就可以更准确地理解它在细胞中的作用。如果这个蛋白质与某种疾病相联系,那么科学家们就能根据它的结构形状,开发出相应的药物。1972年,诺贝尔化学奖获得者克里斯蒂安·安芬森提出了一个假说:其实我们只需要知道一个信息就足够了。

所以,蛋白质在三维空间中该如何折叠,这些信息其实已经包含在了它的氨基酸序列中。换句话说,如果我们知道了一个蛋白质的氨基酸序列,理论上我们就应该能推测出它的三维结构。安芬森的这个假说得到了全世界同行的认可。然而科学家们很快就发现,好像知道了这个理论也没什么用。虽然我们能在实验室中相对容易地测出一个蛋白质的氨基酸序列,但拿到这个序列,我们依然无法根据某条物理法则准确推测出它的三维结构。

现在的科学家想要弄清楚一个蛋白质的三维结构,唯一的办法只能是耗费巨大的人力、物力,用极其笨拙的方法,通过大量的重复性实验来找到蛋白质的三维结构。需要的实验设备如冷冻电镜、X射线晶体衍射仪、核磁共振仪等都价格昂贵。例如一台冷冻电镜的价格就高达数百万至几千万人民币。解析结构的过程是否顺利有很大的运气成分。

从上世纪末开始,以IBM为首的一些计算机技术公司就提出了一个大胆的设想:可以通过蛋白质的氨基酸序列,利用超级计算机来预测蛋白质的三维结构。这相当于把原先在试管中进行的实验,转移到电脑的数字空间中进行。这个想法在当时非常大胆和前卫,因为它的运算量对于当时的计算机来说是天文数字。

中国理应入场到此你对“生物计算”应该已经有了一个初步的概念。不知道你发现没,前文讲了这么多,居然没有一次提到中国。具有如此重要意义的一项科学事业,过去的几十年基本上都是老外在玩儿,没我们中国人什么事,这真的让我感到揪心。对于未来的新药研发、疫苗研发、精准医疗等等生物医学技术,我几乎可以肯定地说:得生物计算者得天下。

UUID: f58b553e-ea29-4626-a698-03095e6ad451

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/科学有故事公众号-pdf2txt/2021/科学有故事_2021-03-06_“生物计算”是什么?为什么中国不能落后?.txt

是否为广告: 否

处理费用: 0.0050 元