最优时间复杂度的single-target PPR算法 | 作者带你读论文(KDD2020)

作者: 王涵之

来源: 学术头条

发布日期: 2020-08-07

本篇论文提出了一种高效计算单宿 PPR 的算法 RBS,改进了单宿 PPR 计算的时间复杂度,达到了最优计算复杂度。该算法可以提高频繁命中节点的查询问题、单源 SimRank 的计算问题、图嵌入和图神经网络中的 PPR 矩阵计算问题等的运行效率。

前言:Personalized PageRank(简称 PPR)是一种图节点邻近度的度量方法,被广泛应用于图挖掘和网络分析等领域。本篇论文关注 single-target PPR(单宿 PPR)的计算问题,提出了一种高效计算单宿 PPR 的算法 RBS,改进了单宿 PPR 计算的时间复杂度。

当以相对误差进行结果约束时,RBS 首次将单宿 PPR 问题的计算复杂度降低至理论下界,即达到了最优计算复杂度。同时,单宿 PPR 的广泛应用也使得 RBS 算法可以进一步改进这些应用问题的运行效率,如频繁命中节点的查询问题(heavy hitters PPR query)、单源 SimRank 的计算问题、图嵌入和图神经网络中的 PPR 矩阵计算问题等。

1. PageRank 和 Personalized PageRank:PageRank 最早由 Google 创始人 Larry Page 和 Sergey Brin 在 1998 年提出,用于度量 web 网络中各网页的重要性,其核心思想为:被很多网页所链接的网页重要性较高;被重要的网页所链接的网页重要性较高。

如果我们将 web 网络转化为图结构 G=(V,E),将 web 网络中的网页看作图结构中的节点,将网页间的链接关系转化为图结构中的连边(如果网页 A 有一条指向网页 B 的链接,图结构 G 上对应有一条从节点 A 指向节点 B 的边),则可对应写出 PageRank 的定义式。

2. 问题定义:

在本篇论文中,我们重点关注单宿 PPR(single-target PPR)的计算问题,即给定图上某一节点 t 作为宿点,计算节点 t 关于图上所有节点的 PPR。单宿 PPR(single-target PPR)和单源 PPR(single-source PPR)相对应,提供了 PPR 重要性的两种考量方式。

单源 PPR 希望计算图上所有节点相对给定源节点 s 的 PPR,即希望找到所有相对源节点较为重要的节点;而单宿 PPR 则希望找到相对图上任意节点,使宿节点的重要性较高的节点。综上所述,如果可以改进单宿 PPR 的计算效率,则可进一步提高这些问题的计算速度。

3. RBS 算法:

4. 实验评估:

UUID: 7473b3c3-8617-47fc-a0df-a7d11f3556a9

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/学术头条公众号-pdf2txt/学术头条2020年-下/2020-08-07_RBS最优时间复杂度的single-targetPPR算法作者带你读论文(KDD2020).txt

是否为广告: 否

处理费用: 0.0028 元