仅用十几分钟,就能找到新冠疫苗的“最佳配方”,LinearDesign到底是什么黑科技?

来源: 果壳

发布日期: 2020-10-14

LinearDesign是一种通过算法直接设计稳定mRNA序列的技术,能够在短时间内找到新冠疫苗的“最佳配方”,显著提高疫苗研发的效率和安全性。该技术不仅适用于新冠病毒疫苗,还可用于流感疫苗、肿瘤疫苗等多种疫苗及抗体和药物的研发,预示着医学技术的重大飞跃。

著名诗人布莱希特在1940年发表了一首诗歌,名字叫《这是人们会说起的一年》,开篇的两句是“这是人们会说起的一年,这是人们说起就沉默的一年。”我想,数千万人感染了新冠病毒的2020年,也会成为今后人们“说起就沉默的一年”。新冠肺炎的传播速度之快、波及范围之广、病情影响之重,对经历过无数大灾大难的人类来说,仍然是始料未及的。

截至视频制作时,新冠病毒累计确诊已经突破3650万例,并且还在以每天30万例的速度增加。研发疫苗,无异于和死神赛跑。如何设计更加安全且更为有效的疫苗?有没有办法让疫苗研发变快?这些问题,让我们通过这支视频为你解答。

看完视频后,你知道mRNA是何方神圣了吗?“mRNA”其实是messenger RNA的缩写,中文名叫“信使核糖核酸”。

与我们熟知的、存在于细胞核当中的DNA双螺旋结构不同,它是广泛分布于细胞质内的单螺旋结构,主要的工作就是携带着合成蛋白质的信息,与蛋白质的制造工厂——核糖体相结合。之后tRNA负责将相应的氨基酸带到核糖体与mRNA配对,翻译mRNA上的信息,最后制成人体所需的蛋白质。简单来说,mRNA疫苗中的mRNA与我们自身的大体类似,但不同点在于mRNA疫苗是经过人工重新设计得到的。

只要通过特定的递送系统将这段mRNA导入人体内,它就会和人体自身的mRNA一样,与核糖体结合制造出含有病毒特征但不具备致病性的蛋白质,刺激人体产生免疫反应。

不光要战胜疾病,还得跑赢时间。乙肝疫苗的研发经历了十年时间,如今面临更加汹涌的新冠病毒时,所有人都希望看到更快更安全有效的疫苗技术来“救人于水火”。

此次新冠疫情中,mRNA基因疫苗,就以更高的安全性和有效性,以及更快的研发和生产速度,在诸多技术中被寄予厚望。与之前的疫苗相比,mRNA疫苗最显著的优势在于研发和生产速度快,理论上只要我们知道了病原体的基因,就可以较快速的设计出可能的mRNA疫苗序列,并易于大规模生产。

而且mRNA疫苗工艺简单,成本相对低廉,不需要生物介质,天然具有激活人体免疫反应的佐剂作用,它所生成的抗原将由人体自身的细胞产生,属于更自然的免疫生成方式,更加安全。

看到这里,或许你已经在为世界即将被拯救而热泪盈眶了,请稍稍屏住泪水,因为如同电影里一波三折的剧情一样,这针被寄予厚望的超级疫苗,缺点也是显著的。

现有mRNA 疫苗研发存在一个世界性难题,那就是mRNA疫苗普遍稳定性低,致使它非常“脆弱”,在保存、运输甚至生产过程中就会因为降解而失效,对温度、酸碱度要求也较为苛刻。唯一的破解之道,就是设计出那条能量低、不易降解、又有效的“具有稳定二级结构的mRNA序列”。解决路径虽然找到了,但是要想破局谈何容易,这项设计所需要的庞大的计算量,成为研发过程中最严峻的拦路虎。

举个例子,与新冠病毒刺突蛋白对应的mRNA,有多达2.4乘以10的632次方种可能的序列,而研发疫苗的科学家们需要从中找到最稳定的序列。假如一台超级计算机每秒计算一个序列,在宇宙诞生到现在的138亿年时间里,可能连这些序列亿万分之一都无法计算完成,又如何找到那个适合做mRNA疫苗的序列?

很显然,要想从这场战争中突围,传统模式显然是指望不上了,因此许多知名学术机构和药物研发企业纷纷开始尝试不同的手段。

如RNA设计领域世界知名专家、斯坦福大学生物化学系Rhiju Das教授,针对这一问题提议一种解决方案:使用百度研究院两年前研发的RNA二级结构预测算法 LinearFold为RNA二级结构分析引擎, 发起疫苗设计的公开竞赛(OpenVaccine Challenge),通过人海战术找到一些潜在的可能作为疫苗的mRNA序列。

百度研究院则提出了一种更为直接的解决方案,即通过算法直接设计稳定的mRNA序列。也就是视频里所说的LinearDesign。提高效率,延长生命。百度研究院提出的解决方案为mRNA疫苗序列设计提供了一种崭新的思路。与依靠穷举法搜索稳定mRNA序列的思路不同,LinearDesign是通过动态规划算法实现的,将原先海量的搜索空间,压缩为三次方空间。

借助线性化算法,进一步将寻找最稳定mRNA序列的三次方时间复杂度压缩到线性时间。这样通过动态规划算法,短短十几分钟就能找出比天然序列稳定得多的mRNA序列。

LinearDesign追求的战绩远远不止于速度,其优越性更是体现在能够在最短时间内用最高的效率得出最优化的方案。

LinearDesign将衡量mRNA序列蛋白质翻译效率的指标,密码子适应指数(CAI),与序列稳定性指标(MFE)进行联合优化。这样我们就可以设计出理论上二级结构稳定且蛋白质翻译效率高的疫苗序列了。图片左侧那条蓝线,就是通过LinearDesign算法得到的最优mRNA上界。上图的那条曲线就是通过LinearDesign算法得到的最优mRNA序列设计的上界。

虽然这项研究听上去很简单,但在LinearDesign算法出现之前,我们并不知道这条曲线的具体位置。同时借助次优解算法以及增加更多的设计要求,LinearDesign可以设计位于曲线右下方的更多位置的mRNA序列。这些更为多样性的序列为我们研究mRNA疫苗提供了更多的研究用例。

百度研究院提出LinearDesign这个算法后,引起了世界顶级RNA专家、美国罗彻斯特大学David Mathews教授的兴趣。他加入到这个研究项目当中,并在算法研发过程中提出了很多宝贵的意见。至此,LinearDesign实现了一件之前被普遍认为不可能实现的事情,而这项突破的意义也不仅仅是技术上的,它或许能让在疫情中垂头丧气的人们重拾对于医学进步的信心。

步履不停,技术进步推动医疗革新。

百度研究院的科学家们正在与全球科研机构与企业一同通过生物实验验证LinearDesign设计的序列的稳定性和蛋白质表达水平等。如果进展顺利,相信在不久的未来生命科学将会广泛使用LinearDesign 技术。更令人欣喜的是, LinearDesign不仅能用于新冠病毒 mRNA 疫苗的研发,还能用于流感疫苗、肿瘤疫苗等多种疫苗,以及抗体和药物的研发。这意味着医学技术将会发生质的飞跃和颠覆。

也许某天,我们能够迅速设计并生产出定制化的高效安全的基因药物,不论是应对流感,恶性肿瘤,还是下一次完全不同的新冠肺炎,我们都能有更高效的技术响应,在疾病和流感肆虐时,更好的守护人类的健康。

UUID: a951c2c7-82d9-4d40-af04-75b223d25372

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/果壳公众号-pdf2txt/2020/2020-10-14_仅用十几分钟,就能找到新冠疫苗的“最佳配方”,LinearDesign到底是什么黑科技?.txt

是否为广告: 否

处理费用: 0.0054 元