在计算机技术飞速发展的今天,机器处理现实生活中复杂任务的能力也越来越强大。其中,从现实世界网络中挖掘有效、相关的信息在许多新兴应用中起着至关重要的作用。例如,在社交网络中,根据个人资料和社交关系将用户进行分类,而后应用于社交推荐、目标广告、用户搜索等功能。
然而,传统的网络表示方式所能提供的相关信息往往有限,于是近年来,网络表示学习算法(Network representation learning,NRL)应运而生,而且发展迅速。近日,由清华大学计算机系唐杰教授领导的团队对 NRL 进行了详细综述,深入探究和对比了每个类别下最先进的算法,并系统地研究了这些算法背后的理论基础,最后还提出了该领域可能的发展方向。
该综述以 “Network representation learning: A macro and micro view” 为题发表在专注 AI 开放获取的新期刊《AI OPEN》上。
实际上,NRL 也被称为图嵌入方法(graph embedding method,GEM),旨在学习神经网络中各个节点的低维度表示,所学习到的特征表示可以用作基于图的各种任务,例如分类,聚类,链路预测和可视化任务等等。
而根据本次的研究,现有的 GEM 算法可以分为三类:浅层嵌入模型(Shallow Embedding Models)、异构网络嵌入模型(Heterogeneous Embedding Models)、基于图神经网络的模型(Graph Neural Networks,GNN)。在文中,作者对三种模型的优缺点进行了对比分析,并提出可能的解决方法。
未来发展方向包括动态性、鲁棒性、生成真实世界网络、GNN 的推理能力。AI OPEN 于 2020 年 3 月创刊,专注于分享有关人工智能(AI)理论及其应用的可行知识和前瞻性观点。期刊主编为智源研究院学术副院长、清华大学计算机系唐杰教授。