近日,同济大学生物信息学教授刘琦对人工智能用于新药研发的范式转变提出了自己的看法。他认为,人工智能用于新药研发的范式发生了转变:从以靶点为核心到综合表型的筛选,从大规模大样本训练到小样本的学习。人工智能这把“好刀”,其实非常锋利,但回归到从药物发现到疾病治疗,仍旧是漫长的路程,道路曲折,前途光明。
药物研发的转变:从以靶点为核心到综合表型筛选。首先,正如黄牛老师所说,新药研发是一个系统工程,从靶点的发现、验证,到先导化合物的发现与优化,再到候选化合物的挑选及开发,最后进入到临床研究,可谓九死一生。传统药物研发的起点,在于发现疾病相关的有效靶点,靶点已知,后续的药物研发路径相对明确。
但药物靶点的发现,其本质上是由分子生物学和系统生物学学科驱动的。疾病的靶点、突变基因以及功能蛋白的鉴定是一个系统工程,在笔者的知识体系中,是和药物研发同等复杂的过程。换句话说,药物靶点的确实是联系分子生物学以及药物研发的一个桥梁,但其本身归属于分子生物学范畴。
从这个角度上说,我们谈人工智能是否可用于新靶点的发现,其实是一个伪命题。我们既可以说人工智能够应用于新靶点的发现:因为人工智能的相关技术已大量应用于疾病的靶点预测、高通量数据的分析以及系统生物学的建模过程中。同样,我们也可以说人工智能并不是新靶点发现的核心手段,因为靶点发现本身属于分子生物学的研究范畴,但我们并不能否认人工智能在靶点发现上,已产生以及将要产生的重要作用。
当前药物研发的范式正在从单一的以靶点为核心(Target-centric)的模式向整合表型筛选(phenotypic-screening)的模式进行转换。
传统的药物研发以靶点为核心,但是我们越来越认识到,复杂疾病是一个综合系统,单一或者若干个靶点的突变,可能并非是这个疾病发生发展的根本原因,癌症的靶向药会产生抗性,因为肿瘤系统不断地进化并且具有高度的异质性;老年痴呆症(AD)至今为止也没有发现较为明确的靶点。大多数复杂疾病的发病机制并不清晰,靶点也不明确。
这种情况下,整合表型筛选进行药物研发越来越受到学术界和工业界的关注。
表型筛选系指在不明确疾病靶点以及相关的Mechanism of Action(MoA)的情况下,基于疾病的表型数据(Phenotype Data)进行药物的筛选和设计。直观的理解是,我们如果发现某种小分子可逆转疾病的表型,那么这个小分子针对于这个疾病即具有潜在成药性,可进行后续的进一步验证。同时,小分子的确定反过来也可以帮助疾病靶点的筛选。
对于大规模标记样本的依赖,到底是不是药物研发中应用AI的阿喀琉斯之踵(The Achilles' heel of AI)?笔者个人认为不是。其原因如下:(1)药物研发是一个大量多源多层面数据共存的场景,多源数据的整合分析非常重要,同时也可以弥补单一样本源的小样本问题;(2)小样本学习的发展是人工智能发展的重要方向,我们期待也相信新的学习范式能够在药物研发领域落地。
正如黄牛老师所说,药物研发的每一个阶段都有多种可用的方法和技术,各自优缺并存,“择其善者而用之”。而人工智能技术,可应用于药物研发的各个层面(这里特指靶点筛选,小分子筛选、设计、合成,成药性评估等实验验证前阶段。大分子药物设计较为复杂,不在此次讨论范畴)。在这里,有必要说明一下笔者对于现代人工智能技术和传统计算机辅助药物设计(CADD)之间区别的理解。
由上可见,人工智能技术几乎涵盖药物研发实验前所有的步骤。药明康德公司曾经提出药物研发的VIC模式,即“VC(风险投资)+IP(知识产权)+CRO(研发外包)”。在这里,笔者对于VIC提供另外一种解读,即“Virtual(虚拟)+IP(知识产权)+Capital(资本)”。
我个人认为,未来的药物研发,可在资本的介入和知识产权的保护下,在实验验证前最大程度的虚拟化、人工智能化,由计算机来评估药物成药的各个指标,最大程度的降低失败率,通过选取最可能成药的小分子进入后续的实验和临床验证,来节省药物研发成本,缩短药物研发时间,而后续的实验和临床验证,又可外包至CRO公司批量化完成。