去年7月人类蛋白质组98.5%的蛋白质结构被AlphaFold破译,就有一些网友向知乎提出了这一问题。还有一些投资者干脆直接询问上市公司,是否有涉及人工智能在生命科学领域的发展计划和技术储备。虽然蛋白质组学研究并非新鲜的概念,但随着AI技术的突破,蛋白质组学相关应用开发与市场化正在发酵。今年年初,西湖欧米(杭州)生物科技有限公司于1月13日宣布完成数亿元Pre-A轮融资。
他们所开发的用于甲状腺结节诊断的临床实验室自建项目(LDT)产品也问世在即。谁又能说它会不会是下一个市场焦点?AlphaFold的出现,无疑让科学界看到了曙光。2021年7月,人工智能公司DeepMind和欧洲生物信息研究所合作,发布由AlphaFold预测的蛋白结构数据库,完成了人类蛋白质组98.5%的蛋白质结构预测。这被认为是本世纪最重要的科学突破之一。
随后,DeepMind在《自然》杂志上公布了AlphaFold2的源代码。AlphaFold2可在几分钟内破译一般蛋白质的三维结构,还能预测一个由2180个氨基酸相连的大蛋白质的结构。如果没有AI技术,人类的理解力不可能企及如此多的蛋白质动态。因为它实在是太复杂了。‘基因相对稳定,一个人一辈子做一次基因测序就够了,但蛋白质无时无刻不在发生变化。就算是一个感冒发生,都会改变很多细胞、蛋白质。
而精准医学就是根据病人当前的情况,给他最合适的诊断和治疗方法。有了蛋白质组学+AI,精准医学将会提高到另一个层面。’郭天南说。十几年前,郭天南在武汉协和医院血液科学习、工作,他记得非常清楚,格列卫一盒30多万元,科室把它买下来,一颗一颗卖给病人。后来,他远赴苏黎世联邦理工学院,师从蛋白质组学领域的开拓者之一Ruedi Aebersold。2017年归国后,他把高通量质谱技术带到了西湖大学实验室。
这一技术简而言之,就是给数以万计的蛋白质‘测体重’,通过精确到小数点后30位,去辨别A君、B君。要知道在微观世界,蛋白质始终处于变化之中,尚无任何技术可以通过分子表面特征去做识别;给蛋白质的运动‘拍电影’,当药物进入细胞后,记录蛋白质变化所产生的大数据。‘质谱是记录分子量,高通量要求快,从中推断出它是什么样的蛋白质、有多少量。’郭天南告诉《中国科学报》。
精准医疗主要涉及诊断与治疗两方面,西湖欧米在两方面均有布局。甲状腺结节是人群中的高发病,有30%的甲状腺结节无法识别恶性、良性,病人在心理压力之下挨了不必要的一刀,而失去甲状腺的病人更须终身服药。西湖欧米将蛋白质组结合AI技术,开发出的LDT产品,能够让这30%的病人中的绝大部分避免挨不必要的一刀。
郭天南还有一个‘小目标’,那就是通过研发降低10倍左右成本的LDT产品,让其成为物美价廉、病人可接受价格的诊断方法。而更让科学家与市场兴奋的是,AI也赋予制药更多想象空间。‘蛋白质组学理论上可以复刻基因组在诊断上的路线,甚至走得更加深入。更进一步看蛋白质组学的应用,从诊断迈向治疗,想象空间可能更大。’乐贝林说,这也是对郭天南在该阶段尝试AI制药的信心和期待所在。
能否步入深水区,发现有代表性的药物靶点,并把它做成全新的药物,是科学家孜孜以求的目标。如中国科学院院士、军事医学科学院院长贺福初在肝癌方向发现了很好的靶点,在靶点上进行了药物筛选。‘下一步,蛋白质组学的技术积累能否在药物的创新性研发上有所突破,我们拭目以待。’乐贝林说。如果将视野再拓展一些,除了重大疾病之外,蛋白质与生活中的慢病、代谢类疾病也有紧密关系。
与蛋白质组学相结合的药物、食品、保健品等终端产品,均未来可期。