TuckER:基于张量因式分解的知识图谱补全

作者: 李成江

来源: 学术头条

发布日期: 2019-07-06

本文介绍了基于二元张量塔克分解的线性模型TuckER,用于知识图谱的链接预测。TuckER模型具有完全表达能力,参数规模线性增长,并且可以特例化为当前先进的线性模型。实验结果表明,TuckER在链接预测任务上表现优异,主要归功于塔克分解在相似关系间的参数共享和多任务学习。

由于知识库的不完备性,知识图谱补全成为众多学者的研究焦点,而链接预测是度量知识图谱补全方法效果的有效评测方式。本文作者提出一个基于二元张量塔克分解的线性模型TuckER来进行链接预测。作者证明了所提出的TuckER是一个完全表达模型,并且其获得完全表达能力所需要的参数下界比其他完全表达模型要小几个数量级,且一些当前最先进的线性模型均可视为TuckER的特例。

在链接预测的评测任务上TuckER取得了很好的效果。

知识图谱可以表示为一个三阶二元张量,每一个元素对应一条事实三元组。RESCAL,DistMult,ComplEx和SimplE都是对这个三阶二元张量运用不同的分解方法来解决链接预测问题的线性模型。作者基于二元张量的塔克分解,提出了新的线性模型TuckER来学习KG表示。TuckER有如下优点:模型具备完全表达能力,模型是线性的,模型可特例为一些当前最先进模型。

塔克分解是Ledyard R. Tucker于1964年提出并在1966年得到完善的一个分解方式。在三阶的情况下,塔克分解将展开为一个核心张量和三个分部矩阵。塔克分解并不唯一,但可以通过对核心张量增加限制来提高分解的唯一性。将塔克分解运用在被定义为三阶二元张量的知识图谱上,作者令实体的embedding矩阵等价于主体和客体的表示,即关系的embedding矩阵。

作者在链接预测常用的数据集上对模型进行了评测,评价指标为MRR和Hits@k,Baseline方面,与张量分解方法和当前流行的非线形方法均进行了对比。通过表2和表3的结果,可以看到TuckER在链接预测任务上有很好的效果。作者将模型的有效性归结于:塔克分解利用相似关系之间的参数共享,通过多任务学习的方式提高了预测能力。

UUID: 446cb986-94fd-4e68-b242-3d2901828dbb

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/学术头条公众号-pdf2txt/学术头条2019年/2019-07-06_ICML2019Workshop短文TuckER:基于张量因式分解的知识图谱补全.txt

是否为广告: 否

处理费用: 0.0040 元