由于知识库的不完备性,知识图谱补全成为众多学者的研究焦点,而链接预测是度量知识图谱补全方法效果的有效评测方式。本文作者提出一个基于二元张量塔克分解的线性模型TuckER来进行链接预测。作者证明了所提出的TuckER是一个完全表达模型,并且其获得完全表达能力所需要的参数下界比其他完全表达模型要小几个数量级,且一些当前最先进的线性模型均可视为TuckER的特例。
在链接预测的评测任务上TuckER取得了很好的效果。
知识图谱可以表示为一个三阶二元张量,每一个元素对应一条事实三元组。RESCAL,DistMult,ComplEx和SimplE都是对这个三阶二元张量运用不同的分解方法来解决链接预测问题的线性模型。作者基于二元张量的塔克分解,提出了新的线性模型TuckER来学习KG表示。TuckER有如下优点:模型具备完全表达能力,模型是线性的,模型可特例为一些当前最先进模型。
塔克分解是Ledyard R. Tucker于1964年提出并在1966年得到完善的一个分解方式。在三阶的情况下,塔克分解将展开为一个核心张量和三个分部矩阵。塔克分解并不唯一,但可以通过对核心张量增加限制来提高分解的唯一性。将塔克分解运用在被定义为三阶二元张量的知识图谱上,作者令实体的embedding矩阵等价于主体和客体的表示,即关系的embedding矩阵。
作者在链接预测常用的数据集上对模型进行了评测,评价指标为MRR和Hits@k,Baseline方面,与张量分解方法和当前流行的非线形方法均进行了对比。通过表2和表3的结果,可以看到TuckER在链接预测任务上有很好的效果。作者将模型的有效性归结于:塔克分解利用相似关系之间的参数共享,通过多任务学习的方式提高了预测能力。