近年来,由于图的强大表达能力,利用机器学习分析图的研究越来越受到关注。图作为一种数据结构,由节点和边组成,如果赋予节点和边不同的含义,那么看似简单的图就可以组成非常庞大的信息。例如,若图中的节点代表商品,边表示购买顺序,那么连起来就代表了一个用户的购物网络。如今,在图领域机器学习中,图神经网络(Graph Neural Network, 简称 GNN)又成为新的研究热点。
由于 GNN 对图节点之间依赖关系进行建模的强大能力,它在社交网络、知识图、推荐系统甚至生命科学等各个领域都得到了越来越广泛的应用。近日,清华大学研究团队就针对 GNN 的最新发展,于 AI OPEN 发表了题为 “Graph neural networks: A review of methods and applications” 的研究综述。
文中详细总结了构建 GNN 模型的 “四步” 框架并作理论分析,展示了 GNN 在各学科中常见的应用,并最后提出四个开放性问题,表明了图神经网络的主要挑战和未来研究方向。GNN 是基于图的深度学习方法,作为神经模型的一种,它通过图节点之间的消息传递来捕获图的依赖性。GNN 的设计流程通常包含四个步骤:找出相应的图结构、指定图类型与规模、设计损失函数、使用计算模块构建模型。
在此次的研究中,作者就详细描述这四个步骤的操作框架。接下来,作者们还对当前 GNN 的热点应用一一进行阐释,并根据结构化场景和非结构化场景对其进行分类。尽管 GNN 在不同领域取得了巨大成功,但值得注意的是,GNN 模型还不足以为大多图任务提供令人满意的解决方案。于是,研究人员通过综述已有研究,总结了以下四个未解决的问题:稳健性、可解释性、图预训练、复杂的图结构。
关于 AI OPEN 于 2020 年 3 月创刊,专注于分享有关人工智能(AI)理论及其应用的可行知识和前瞻性观点。期刊主编为智源研究院学术副院长、清华大学计算机系唐杰教授。