Locality-aware subgraphs for inductive link prediction in knowledge graphs

Locality-aware subgraphs for inductive link prediction in knowledge graphs

a b s t r a c t

最近的知识图(KG)归纳推理方法将链接预测问题转化为图分类任务。 他们首先根据目标实体的 k 跳邻域提取每个目标链接周围的子图,使用图神经网络 (GNN) 对子图进行编码,然后学习将子图结构模式映射到链接存在的函数。 尽管这些方法取得了巨大的成功,但增加 k 通常会导致邻域呈指数扩张,从而因过度平滑而降低 GNN 的表达能力。 在本文中,我们将子图提取制定为局部聚类过程,旨在基于个性化 PageRank (PPR) 方法对目标链接周围紧密相关的子图进行采样。 根据经验,在三个现实世界的 KG 上,我们表明,对基于 PPR 的局部聚类提取的子图进行推理可以产生比依赖固定跳距离内的邻居更准确的链接预测模型。 此外,我们研究了平均聚类系数和节点度等图属性,并表明这些属性与基于子图的链接预测的性能之间存在关系。

1. Introduction

GNN 在集成节点特征和捕获大型复杂图中的拓扑模式时存在一些局限性 [19-22]。 因此,增加目标链接周围邻域的大小不会提高(或可能降低)GNN 的预测性能。 在本文中,我们试图解决对目标链路周围的局部感知子图进行推理是否可以比对通过固定跳数提取的子图进行推理产生更高的链路预测精度。

我们使用 PPR 围绕给定种子节点(目标链接的头部和尾部)执行局部偏置随机游走,这使我们能够对目标链接图中节点的重要性进行排名。 然后,我们依靠 PPR 分数来提取目标链接附近的局部和密集子图,用于所提出的基于 GNN 的链接预测模型的训练和推理阶段。

本文贡献:

  1. 引入一种名为 LCILP(归纳链接预测的局部聚类)的新策略,通过对基于 PPR 的局部聚类技术提取的局部感知子图进行推理来进行归纳链接预测。
  2. 研究图属性和我们提出的方法之间的关系。 我们证明了图的平均聚类系数、平均节点度和链路预测的性能之间存在关系。

3. Approach

在这里插入图片描述

(1)使用基于 PPR 的局部聚类技术提取 u 和 v 周围的子图,
(2)标记提取的子图节点,
(3)使用 GNN 模型对子图进行编码 ,
(4)对子图进行评分。

3.1. Step 1: subgraph extraction

在这里插入图片描述

子图提取由两个步骤组成:首先,根据节点与给定种子集(代表目标实体)的接近度对节点进行评分。 其次,按节点得分的降序考虑节点以创建嵌套的本地集群,然后可以使用优度度量对其进行评估。 PPR,也称为随机游走与重启,是衡量节点重要性的最常见的评分方法之一。 我们使用近似 PPR 来克服 PPR 计算成本昂贵的问题。 如算法 1 所示,我们根据种子集 = { u , v }(两个节点) 对图 G 的顶点进行排序。 近似参数维护两个向量:解向量 p 和残差向量 r,其中 p 向量是 PPR 向量的近似值,向量 r 包含近似误差。 隐形传态概率 α 控制我们从种子集的邻域中合并的信息量。 也就是说,当 α 的值接近 1 时,随机游走传送到种子节点的频率更高,因此我们更加重视节点的直接邻域。 随着 α 值的减小,我们反而更加重视种子节点的扩展(多跳)邻域。

3.2. Step 2: node labeling

们为子图中的每个实体(节点)定义一个与实体无关的嵌入。 按照 [15] ,目标关系的 u 和 v 节点周围的子图中的每个节点 i 都用元组 (d(i, u ) , d(i, v )) 标记,其中 d(i, u ) 是 节点 i 和 u 之间的最短距离(对于 d(i, v ) 也是如此)。 两个目标节点 u 和 v 被标记为 (0, 1) 和 (1, 0),以便模型可识别。 该方案捕获子图中每个节点相对于目标链接的位置。 在这里插入图片描述

3.3. Step 3: subgraph embedding

在这里插入图片描述在这里插入图片描述

3.4. Step 4: scoring and loss function

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/682726.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

鸿蒙轻内核M核源码分析系列六 任务及任务调度(2)任务模块

任务是操作系统一个重要的概念,是竞争系统资源的最小运行单元。任务可以使用或等待CPU、使用内存空间等系统资源,并独立于其它任务运行。鸿蒙轻内核的任务模块可以给用户提供多个任务,实现任务间的切换,帮助用户管理业务程序流程。…

鸿蒙北向开发 IDE DevEco Studio 3.1 傻瓜式安装闭坑指南

首先下载 安装IDE 本体程序 DevEco Studio 下载链接 当前最新版本是3.1.1,下载windows版本的 下载下来后是一个压缩包, 解压解锁包后会出现一个exe安装程序 双击运行安装程序 一路 next ( 这里涉及安装文件目录,我因为C盘够大所以全部默认了,各位根据自己情况选择自己的文件…

我的创作纪念日--我和CSDN一起走过的1825天

机缘 第一次在CSDN写文章,是自己在记录学习Java8新特性中Lambda表达式的内容过程中收获的学习心得。之前也有记录工作和生活中的心得体会、难点的解决办法、bug的排查处理过程等等。一直都用的有道笔记,没有去和大家区分享的想法,是一起的朋…

MotionEditor_ 通过内容感知扩散编辑视频运动

图1. MotionEditor:一种基于扩散的视频编辑方法,旨在将参考视频的运动转移到源视频中。 摘要 现有的基于扩散的视频编辑模型在随时间编辑源视频的属性方面取得了显著进展,但在修改运动信息的同时保持原始主角的外观和背景方面存在困难。为…

WordPress 插件推荐:菜单缓存插件——Menu Caching

今天在缙哥哥博客上发现了一个 WordPress 速度优化插件的优化感觉很不错,明月自己装上也体验了一番, WordPress 菜单的载入速度无论是 PC 端和移动端都非常不错,并且这个叫 Menu Caching 的菜单缓存插件还完美的兼容 WPRocket,W3 …

三.一布局和布局切换的实践与探索

在前端开发中,灵活的布局切换是一项非常实用的功能。今天,我想和大家分享一下如何在主组件中通过更换 Layout 目录下的组件来实现布局切换。 首先,我们有一个主组件 index.vue,它承担着整个页面的主要逻辑和展示。 而在 Layout …

PHP序列化、反序列化

目录 一、PHP序列化:serialize() 1.对象序列化 2.pop链序列化 3.数组序列化 二、反序列化:unserialize() 三、魔术方法 ​四、NSSCTF相关简单题目 1.[SWPUCTF 2021 新生赛]ez_unserialize 2.[SWPUCTF 2021 新生赛]no_wakeup 学习参考&#xff1…

使用 Logback.xml 配置文件输出日志信息

官方链接:Chapter 3: Configurationhttps://logback.qos.ch/manual/configuration.html 配置使用 logback 的方式有很多种,而使用配置文件是较为简单的一种方式,下述就是简单描述一个 logback 配置文件基本的配置项: 由于 logba…

优化 mac 储存空间的方法 只需一招为你的苹果电脑提速

在职场中,许多人都对苹果电脑情有独钟。苹果电脑以其简洁美观的设计、流畅稳定的性能以及出色的用户体验,成为了众多职场人士的得力助手。无论是处理文档、制作演示文稿,还是进行创意设计等工作,苹果电脑都能展现出其独特的优势&a…

HCIP-Datacom-ARST自选题库__多种协议简答【11道题】

1.BGP/MPLSIP VPN的典型组网场景如图所示,PE1和PE2通过LoopbackO建立MP-IBGP,PE1和PE2之间只传递VPN路由,其中PE1BGP进程的部分配置已在图中标出,则编号为0的命令不是必须的。(填写阿拉伯数字) 3 2.在如图所示的Hub&Spok…

蒙层(css)

如何在 Vue 中实现一个包含图像和蒙层效果的组件?这个组件根据某个条件显示或隐藏蒙层,用于表示图像是否已读。 1. 创建基础模板 首先,我们在模板中使用 div 包裹我们的图像组件 GraphImage,并为最外层 div 设置 position: relat…

OTTO、亚马逊、Temu卖家如何运用测评补单来提高购买率?

在跨境电商的广阔舞台上,测评补单无疑是一股不可或缺的强劲动力。商家们深知,通过补单这一手段,能够快速为产品注入活力,使销量迅猛攀升,评论如潮涌至,进而在激烈的竞争中脱颖而出,勇攀销量之巅…

【Python数据预处理系列】Pandas 数据操作实战:掌握 .loc[] 方法进行高效数据选取

文章将详细介绍.loc[]方法的各种使用场景,帮助读者深入理解并掌握这一核心功能。 在Pandas库中,.loc[]方法是一种强大而灵活的数据选取工具。本文将通过详细的步骤和示例,手把手教您如何利用这一工具进行高效的数据操作。 首先,我…

【数据集划分】假如你有超百万条oracle数据库数据(成真版)

【数据集划分】假如你有接近百万条oracle数据库数据(成真版) 写在最前面小结 数据集划分原因注意事项 1. 留出法(Hold-out Method)原理算法复杂度代码示例Scikit-learn的train_test_split分布式计算框架(如Apache Spar…

信不信,马上教会你Purple Pi OH开发板之ADB常用命令

开源鸿蒙硬件方案领跑者 触觉智能 本文适用于在Purple Pi OH开发板进行分区镜像烧录。触觉智能的Purple Pi OH鸿蒙开源主板,是华为Laval官方社区主荐的一款鸿蒙开发主板。 该主板主要针对学生党,极客,工程师,极大降低了开源鸿蒙开…

【保姆级讲解Outlook邮箱的使用技巧】

🎥博主:程序员不想YY啊 💫CSDN优质创作者,CSDN实力新星,CSDN博客专家 🤗点赞🎈收藏⭐再看💫养成习惯 ✨希望本文对您有所裨益,如有不足之处,欢迎在评论区提出…

代码随想录第25天|回溯part5 通用的去重法:set

491.非递减子序列 中等题 这个题给出的实例很有陷阱性,之前的题是通过排序来对于相同树层的元素去重,而本题是求非递减子序列,如果排序了那就已经是自增子序列了,达不到题目的要求。 看图 可以看出,对于一个集合[4,…

超实用的新闻稿撰写模板分享,纯干货

一篇优秀的新闻稿,能为企业带来良好的口碑和传播效果。本文伯乐网络传媒将深入探讨新闻稿撰写前的准备工作,并提供一套实用的新闻稿结构模板,助你轻松打造高质量新闻稿。 一、新闻稿撰写前的准备 1. 明确新闻稿的主题和目的 在动笔之前&…

免费开源图片转文字识别软件:Umi-OCR

目录 1.介绍 2.项目亮点 3.项目功能(已实现) 4.功能体验 5.项目集成(调用接口) 6.项目地址 1.介绍 Umi-OCR:免费,开源,可批量的离线OCR软件,目前适用于 Windows7 x64 及以上。…

Unity开发Cosmos使用BNG Framework获取按键信息

Unity开发Cosmos使用BNG Framework获取按键信息 1、新建一个脚本&#xff0c;复制下面代码 using BNG;[Header("Input")]//[Tooltip("The key(s) to use to toggle locomotion type")]public List<ControllerBinding> locomotionToggleInput new …