【Kimi帮我看论文(四)】TransE:Translating Embeddings for Modeling Multi-relational Data

一、论文信息

1 标题

Translating Embeddings for Modeling Multi-relational Data

2 作者

Antoine Bordes, Nicolas Usunier, Alberto Garcia-Durán, Jason Weston, Oksana Yakhnenko

3 研究机构

Université de Technologie de Compiègne – CNRS Heudiasyc UMR 7253 Compiègne, France; Google

二、主要内容

这篇论文主要研究了如何将多关系数据中的实体和关系嵌入到低维向量空间中。作者提出了一个名为TransE的方法,该方法通过将关系解释为在实体的低维嵌入上进行的平移来建模关系。TransE的目标是提供一个易于训练、参数数量减少且能够扩展到非常大数据库的规范模型。

三、相关研究

相关研究包括社交网络分析、推荐系统、知识库(如Freebase、Google Knowledge Graph或GeneOntology)中的多关系数据建模。以往的方法多是基于潜在属性的关系学习框架,例如非参数贝叶斯扩展的随机块模型、基于张量分解或集体矩阵分解的模型。这些模型虽然表达能力强,但复杂性高,难以解释,且计算成本高。

四、解决方案

TransE通过一个基于能量的框架来学习嵌入,其中关系被表示为嵌入空间中的平移。如果关系 ( h , ℓ , t ) (h, ℓ, t) (h,,t)成立,那么尾实体 t t t的嵌入应该接近头实体 h h h的嵌入加上某个依赖于关系 ℓ ℓ 的向量。TransE的参数集较小,因为它只为每个实体和关系学习一个低维向量。
在这里插入图片描述

TransE方法的核心在于将实体和关系表示为低维空间中的向量,并通过关系作为实体间向量的平移来学习嵌入。以下是TransE方法训练方式的详细介绍:

算法细节

  1. 初始化:对于每个实体 e e e和每个关系 ℓ ℓ ,随机初始化一个 k k k维向量,其中 k k k是模型的超参数,代表嵌入的维度。

  2. 归一化:对每个关系 ℓ ℓ 的向量进行单位化处理,以保证其长度为1。

  3. 优化循环:在每次迭代中,首先对所有实体的嵌入向量进行归一化处理。然后,从训练集中随机抽取一个小批量样本(minibatch)。

  4. 样本扰动:对于每个选中的三元组 ( h , ℓ , t ) (h, ℓ, t) (h,,t),通过替换头实体 h h h或尾实体 t t t(但不是同时替换)来生成一个扰动的三元组 ( h ′ , ℓ , t ′ ) (h',ℓ,t') (h,,t)

  5. 更新嵌入:计算原始三元组和扰动三元组之间的能量损失,并通过梯度下降更新实体和关系的嵌入向量。

能量损失函数的构建与含义

能量损失函数是TransE方法的核心,它基于边缘(margin-based)的排名标准构建。损失函数的形式如下:

L = ∑ ( h , ℓ , t ) ∈ S ∑ ( h ′ , ℓ , t ′ ) ∈ S ′ ( h , ℓ , t ) [ γ + d ( h + ℓ , t ) − d ( h ′ + ℓ , t ′ ) ] + L = \sum_{(h,ℓ,t) \in S} \sum_{(h',ℓ,t') \in S'(h,ℓ,t)} [ \gamma + d(h + ℓ, t) - d(h' + ℓ, t') ]_+ L=(h,,t)S(h,,t)S(h,,t)[γ+d(h+,t)d(h+,t)]+

其中:

  • [ x ] + [x]_+ [x]+表示 x x x的正部分,即 x x x大于0时取 x x x,否则取0。
  • γ \gamma γ是一个大于0的边界超参数。
  • d d d是不相似度度量,可以是L1或L2范数。
  • S S S是训练集中的三元组集合。
  • S ′ ( h , ℓ , t ) S'(h,ℓ,t) S(h,,t)是由原始三元组生成的所有扰动三元组的集合。

损失函数的目标是最小化训练三元组的能量,同时确保扰动三元组的能量大于训练三元组的能量至少一个边界 γ \gamma γ。这样,模型会倾向于将头实体和尾实体的嵌入向量通过关系向量平移后彼此靠近,而对于不正确的实体关系组合,则会将它们的嵌入向量分隔得更远。

通过这种方式,TransE能够有效地学习到实体和关系的嵌入表示,使得对于任何给定的关系三元组 ( h , ℓ , t ) (h, ℓ, t) (h,,t),头实体 h h h的嵌入向量加上关系 ℓ ℓ 的向量应该接近尾实体 t t t的嵌入向量。这种简单的假设在实验中显示出了强大的性能,尤其是在大规模知识库的链接预测任务中。

五、实验环节

实验在Wordnet和Freebase数据集上进行,与多种现有方法进行比较。实验结果显示,TransE在链接预测任务上显著优于现有最先进的方法,并且能够在包含1M实体、25k关系和超过17M训练样本的大规模Freebase数据集上成功训练。

六、进一步探索点:

  • 分析TransE模型的进一步应用,例如在自然语言处理中的词表示学习。
  • 结合知识库和文本数据进行更广泛的应用探索,例如关系抽取。

七、总结

TransE是一种新颖的知识库嵌入方法,它通过将关系视为实体嵌入向量间的平移来建模多关系数据。这种方法在参数数量上更为精简,易于训练,且在大规模数据集上表现出色。尽管TransE在处理某些特定类型的三元关系时可能存在局限性,但其在多关系数据建模领域显示出巨大的潜力,并为未来的研究提供了新的方向。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/452615.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

C# SM2加解密 ——国密SM2算法

SM2 是国家密码管理局组织制定并提出的椭圆曲线密码算法标准。 本文使用第三方密码库 BouncyCastle 实现 SM2 加解密,使用 NuGet 安装即可,包名:Portable.BouncyCastle,目前最新版本为:1.9.0。 using Org.BouncyCastl…

Docker部署黑马商城项目笔记

部署后端 创建mysql目录如下,上传对应的文件 运行以下命令 docker run -d \--name mysql \-p 3306:3306 \-e TZAsia/Shanghai \-e MYSQL_ROOT_PASSWORD123 \-v ./mysql/data:/var/lib/mysql \-v ./mysql/conf:/etc/mysql/conf.d \-v ./mysql/init:/docker-entry…

swagger踩坑之请求类不显示具体字段

swagger踩坑之请求类不显示具体字段 省流:枚举字段需要加上ApiModelProperty注解 过程复现: TestEnum 枚举不加注解,swagger的UI类不显示详细字段 Data Accessors(chain true) ApiModel(value "test对象", description &quo…

管理交换机

文章目录 本地管理交换机物理交换机如何本地管理ensp上的虚拟交换机如何本地管理认证模式的三种方式 远程管理交换机配置通过Telnet登录设备配置通过STelnet登录设备 --推荐的方式检查配置结果使用Cloud管理多个交换机时 华为官网配置信息 本地管理交换机 当交换机首次使用时&…

语音合成技术:从概念到应用的全面解析

目录 前言1 语音合成技术简介2 技术解析2.1 语音合成的基本流程2.2 传统语音合成技术2.3 基于深度学习的语音合成 3 语音合成技术应用3.1 虚拟助手与聊天机器人3.2 无障碍通信3.3 语言学习3.4 媒体和娱乐 4 语音合成技术的挑战4.1 自然性的提升4.2 情感表达的深化4.3 多样性与包…

Docker自建蜜罐系统【失陷检测、外网威胁感知、威胁情报】

项目地址: https://hfish.net Hfish是一款基于Docker的网络钓鱼平台,它能够帮助安全团队模拟各种网络钓鱼攻击,以测试和提高组织的安全防御能力。 Hfish的优点 为什么选择Hfish? 蜜罐通常被定义为具有轻量级检测能力、低误报率…

【3GPP】【核心网】【5G】NG接口介绍(超详细)

目录 1. NG接口定义 2. 接口原则和功能 3. NG 接口控制面 5. NG接口主要信令流程 6. NG SETUP过程 1. NG接口定义 NG接口指无线接入网与5G核心网之间的接口。在5G SA网络中,gNB之间通过Xn接口进行连接,gNB与5GC之间通过NG接口进行连接。NG接口分为NG-C接口和NG…

O2OA开发的新版考勤管理

O2OA(翱途)开发平台对考勤管理重新进行了开发,全新的版本更好用,更直观。 考勤管理对员工的工作出勤情况进行记录、分析和报告的过程。它是对员工工作表现评估的重要依据,也是企业管理中的重要组成部分。考勤管理包括对员工的工作时间、迟到…

【NR 定位】3GPP NR Positioning 5G定位标准解读(十三)-DL-AoD定位

前言 3GPP NR Positioning 5G定位标准:3GPP TS 38.305 V18 3GPP 标准网址:Directory Listing /ftp/ 【NR 定位】3GPP NR Positioning 5G定位标准解读(一)-CSDN博客 【NR 定位】3GPP NR Positioning 5G定位标准解读(…

绝地求生:PUBG官方公布2024工作计划

大家好,我是闲游盒。 首先今天官方公布了2024工作计划,下面我们一起来了解一下2024工作重点,官方提到的2点:一是通过对PUBG的维护和优化来改善线上服务的质量,二是为玩家们提供更加多姿多彩的游戏体验。我个人看完了全…

新品发布:广州大彩科技COF系列2.1寸480*480 IPS 串口屏发布!

一、产品介绍 该产品是一款2.1寸分辨率为 480480的医用级工业组态串口屏,拥有2.1寸IPS液晶屏,分辨率有480480(实际显示为R240内切圆区域),支持电容触摸。采用COF超薄结构工艺设计,用户安装便捷灵活&#x…

离子束铣削(Ion Beam milling)

离子束铣削 (Ion Beam milling) 是一种利用离子源在基板上进行材料去除工艺的薄膜技术。Ion Beam milling 是一种离子束溅射,无论是用于预清洁还是图案蚀刻,它都有助于确保出色的附着力和 3D 结构的精确形成。主要用于微电子制造、光学元件制造和材料科学…

python讲解(2)

目录 一.变量与赋值 二.字符串类型 引号: 三引号: 字符串拼接 三.len函数 四.注释 注释的方法 一.# 二.文档字符串 注释的要求 群体注释 五.python的报错 六.bool类型 一.变量与赋值 python中的变量是不需要声明的,直接定义即…

牛客网 MYSQL进阶挑战 详细知识点总结(一)

目录 前言: 一.插入记录 1.1普通插入(全字段): 1.2普通插入(限定字段): 1.3多条一次性插入: 1.4从另一个表导入: 1.5 replace 二.更新记录 2.1设置为新值: 图 2-1…

岩土工程渗流问题之有限单元法:理论、模块化编程实现、开源程序应用

有限单元法在岩土工程问题中应用非常广泛,很多商业软件如Plaxis/Abaqus/Comsol等都采用有限单元解法。尽管各类商业软件使用方便,但其使用对用户来说往往是一个“黑箱子”。相比而言,开源的有限元程序计算方法透明、计算过程可控,…

制造行业大数据应用:四大领域驱动产业升级与智慧发展

一、大数据应用:制造行业的智慧引擎 随着大数据技术的不断突破与普及,制造行业正迎来一场前所未有的变革。大数据应用,如同智慧引擎一般,为制造行业注入了新的活力,推动了产业升级与创新发展。 二、大数据应用在制造行…

2.Windows平台Python的下载、安装和配置环境变量——跟老吕学Python编程

2.Windows平台Python的下载、安装和配置环境变量——跟老吕学Python编程 一、下载Windows版Python1.Python官网2.Windows版Python下载网址 二、在Windows安装Python1.全自动安装Python(不推荐)1.1 启动安装1.2 安装进度1.3 安装完成1.4 查看版本 2.自定义…

EMQX+InfluxDB+Grafana 构建物联网可视化平台

EMQXInfluxDBGrafana 构建物联网可视化平台 本文以常见物联网使用场景为例,介绍了如何利用 EMQ X MQTT 服务器 InfluxDB Grafana 构建物联网数据可视化平台,将物联网设备上传的时序数据便捷地展现出来。 在物联网项目中接入平台的设备数据和数据存储…

DataGrip工具使用技巧

文章目录 一、设置同时查看多个SQL控制台1.1、设置同时查看多个SQL控制台1.2、还原多个窗口为一个窗口 二、设置分别显示多次查询结果 以下整理DataGrip工具使用过程中的一些快捷方式或使用技巧。 一、设置同时查看多个SQL控制台 有时候我们需要同时查看多个SQL编辑器、SQL控制…

Java中出现中文乱码浅析与问题解决

一、编码介绍 字符编码是一种将字符映射到数字代码的规则或方式。在计算机中,所有的数据最终都以二进制形式存储,包括文本数据。因此,要在计算机中存储和处理文本,就需要将字符转换为对应的数字编码。 字符编码可以分为两种基本…