个性化癌症治疗再进一步!科学家通过图卷积神经网络技术发现165个新的致癌基因

作者: 刘芳

来源: Nature Machine Intelligence

发布日期: 2021-04-19

德国科学家通过图卷积神经网络技术开发出名为EMOGI的机器学习算法,成功识别出165个新的致癌基因,为个性化癌症治疗带来新契机。该研究分析了上万个病人样本数据,揭示了癌症基因组的复杂性和肿瘤异质性对治疗的影响,为开发更精准的靶向药物提供了理论基础。

作为对人类健康造成最重大威胁的疾病之一,癌症一直是各国科学家们重点研究的对象。据世界卫生组织国际癌症研究署(IARC)发布的全球最新癌症预估数据显示,2020年全球新发癌症病例1929万例,死亡病例996万例。其中,中国新发癌症457万人,占全球23.7%,癌症新发人数远超世界其他国家。因此,寻找癌症预防和治疗的有效手段,已成为前沿科技的主要方向。

近日,德国柏林马克斯·普朗克分子遗传学研究所(MPIMG)联合慕尼黑亥姆霍兹联合研究中心计算机生物学研究所(ICB),开发了一款名为“EMOGI”的机器学习算法——“可解释的多基因组图像集成”(Explainable Multi-Omics Graph Integration)。EMOGI算法利用病人样本数据和图卷积神经网络(GCN)技术,可以在细胞突变之前对致癌基因进行识别。

最终,科学家们利用该算法成功识别出了165个新的致癌基因,这将为开发个性化靶向抗癌药,揪出癌症背后的“真凶”带来重要契机。

在癌症发生过程中,肿瘤细胞会失去控制。它们不断疯狂增殖并进入组织,破坏器官,从而损害基本的生命功能。目前人们对癌症的病因尚未完全了解。但从分子生物学的角度来说,癌变意味着由一连串DNA受损而引发的细胞分裂速率失控。当调控细胞生长的基因发生突变或损坏时,细胞便开始了持续的、不受控制的生长及分裂。因此,对癌症进行基因组分析便成为了解开癌症之谜、找到治疗方法的关键。

与化疗等传统治疗方法不同,个性化治疗方案强调根据肿瘤类型量身定做精准药物。近年来,通过基因组数据分析来精确预测每个肿瘤的复杂性、进而开发出适合临床环境的个性化治疗手段已经成为最新研究趋势。虽然个性化靶向药为患者们带来了希望,但以往的研究存在着一定缺陷。

癌症治疗的一个主要挑战,就是并非肿瘤内的所有细胞都对大多数治疗方法具有同等的敏感性或者有效的靶向性。而未被消除的癌细胞往往成为癌症复发的关键驱动因素。可以说在很大程度上,就是肿瘤异质性在“从中作祟”。

对于上述研究,此次研究的论文作者之一Roman Schulte-Sasse表示认同:“到目前为止,大多数研究都集中在基因序列的致病性变化,即细胞蓝图(blueprint of the cell)上。但是,近些年的研究已经证明,表观遗传干扰或基因活性失调也可能导致癌症。”这就是为什么在此次研究中,科学家们将反映蓝图中故障的基因序列数据与代表细胞内事件的信息合并在一起。

说到这里,就不得不提到机器学习领域中大名鼎鼎的图卷积神经网络技术。这个概念首次提出于ICLR2017(成文于2016年),作为被设计用来针对图结构的神经网络,它能够利用图的信息,从之前的网络层中聚合信息的,同时在图中这种机制能够对节点产生有用的特征表示。正是因为采用了这种全新的技术和思维模式,科学家们才能在基因序列没有改变的情况下发现这165个基因与已知致癌基因的联系和其在蛋白质交互作用中的功能。

而这使得有致癌基因名录上增加了165个新条目,至此,人类所认知的致癌基因已经达到了700-1000个。只有通过生物信息学分析和最新的AI算法相结合,研究人员才能追踪到隐藏的基因。Schulte-Sasse说:“蛋白质交互作用可以被绘制成一个数学网络,也就是图形。你可以把它想象成一个铁路网,每个车站都对应着一个蛋白质或基因,它们之间的每一个相互作用都可以用列车连接。

”在图卷积神经网络技术的帮助下,研究人员甚至能够发现那些以前没有被注意到的列车链接。这次的研究共分析了16种不同肿瘤类型,上万个不同数据网络图,而每个图内包含了12000-19000个数据点。

此外,Annalisa Marsico也强调,EMOGI算法并不局限于预测癌症,数据中显然隐藏着更多有趣的细节。从理论上讲,它可以用来整合不同的生物数据集,并找到规律和模式。“将我们的算法应用于类似的有大量数据且和基因关系密切的复杂疾病可能会很有用。例如,糖尿病等复杂的代谢性疾病等。”

UUID: a37549a6-ebc2-487f-ad27-1548b047b52d

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/学术头条公众号-pdf2txt/学术头条2021年/2021-04-19_个性化癌症治疗再进一步!科学家通过图卷积神经网络技术发现165个新的致癌基因.txt

是否为广告: 否

处理费用: 0.0053 元