A Novel Negative Sample Generating Method for KnowledgeGraph Embedding

摘要

为了有效地提取知识图中的关系和原因,将实体和关系编码到一个连续的低维语义空间中。在负样本生成阶段,大多数知识图嵌入方法更注重替换头或尾实体以提高训练效率,很少替换关系。这些负样本生成方法对关系预测的贡献不大。本文提出了一种新的负三重组生成方法。与仅替换TransE、TransH、TransR等实体的方法相比,本文提出的方法以适当的比例替换实体和关系。在WN18和FB15K等经典数据集上的实验结果表明,该方法在关系链路预测精度上明显优于原始方法,对实体链路预测影响较小。根据实验结果,我们还发现,随着关系替换概率比例的增加,关系链接预测能力增强,实体链接预测能力减弱。

2 Related Work

在TransG[18]中,负三元组不仅通过替换头或尾实体生成,而且通过将关系r替换为从关系集r中均匀抽样的随机关系生成,即

 

它们只是简单地用等概率替换实体和关系来生成负三元组,而忽略了实体和关系替换概率的比例对实体和关系预测性能的影响。

为了提高负训练样本的质量,Type-Constraints[9]采用了约束实体范围生成负样本的策略。受生成式对抗网络(generative adversarial networks, GANs)[7]的启发,KBGAN[5]采用一些知识嵌入模型作为生成器来构造质量更好的负样本。为了获得优异的训练效率,ComplEx[16]研究了正、负样本比例的影响。研究表明,每阳性样本产生更多的阴性样本可以获得更好的结果,每阳性样本产生50个阴性样本是准确性和训练时间之间的良好权衡。

在此工作中,我们将关系替换引入到负样本生成中,并为实体和关系设置不同的替换概率,以获得更好的实体和关系预测结果。

3 The Proposed Negative Samples Generating Method

在本节中,提出了一种新的生成负样本的方法来改进知识表示模型的训练过程。在本文提出的方法中,通过替换正三元组(h;r;t)∈S中的头部实体h、尾部t或关系r来生成负样本集S’,并且每次只替换每个观察三元组中的一个项目。如何设置关联概率和实体替换概率是本文研究的重点。我们分两步解决这个问题。首先,根据知识图中实体和关系的数量设置实体替换概率和关系替换概率,然后根据关系r的所有三元组中的两个统计量设置正尾部实体替换概率:1)每个头部实体的平均尾部实体数量,2)每个尾部实体的平均头部实体数量。详细描述如下。

在许多知识表示模型中,通常采用基于边际的分数函数,以负抽样作为训练目标:

与其他损失函数认为负例为假的假设不同,这个损失函数只是假设负例不如正例有效。它使消极的例子比积极的例子得分低。

在小批量模式下,可采用随机梯度下降法(SGD)对式(3)进行优化[14]。详细的培训程序如下。首先,所有实体和关系的嵌入向量从均匀分布随机初始化。接下来,在每次迭代中,对实体和关系的嵌入向量进行规范化。然后,从集合S中抽取一小部分正事实,对于每一个正事实,相应地生成一个负三元组。将正面事实和生成的负面事实作为小批量的训练样例。然后用恒学习率梯度下降法更新小批量中实体和关系的嵌入向量。

为了改进TransE、TransH和TransR等知识图嵌入方法的训练过程,我们通过用关系替换破坏三元组来扩展负例空间。因此我们的负三重集也可以用第2节中的公式(2)来描述。然后,提出了一种新的生成负三元组的方法,并将其应用于transse、TransH和TransR三种表示模型。受TransH方法的启发,我们对正三元组中的关系、头实体或尾实体设置了不同的替换概率。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/490064.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

《深入理解计算机系统》学习(4):过程(如函数)和栈存储

目录 过程1 运行时栈2 转移控制3 数据传送4 栈上局部存储 过程 过程中是软件中一种很重要的抽象,提供了一种封装代码的方式,用一组指定的参数和一个可选的返回值实现了某种功能。然后,可以在程序的不同的地方使用这个功能。设计良好的软件用…

FLUOR DE LYS® HDAC fluorometric activity assay kit组蛋白去乙酰化酶荧光活性检测试剂盒

FLUOR DE LYS HDAC fluorometric activity assay kit组蛋白去乙酰化酶荧光活性检测试剂盒 目前,组蛋白去乙酰化酶抑制剂已经显示出其作为抗肿瘤药物的前景,这也自然激发了研究者们对于筛选HDAC(Histone deacetylase,组蛋白去乙酰化…

【AI】使用Azure OpenAI创建自己的AI应用!

【AI】使用Azure OpenAI创建自己的AI应用! 目录 【AI】使用Azure OpenAI创建自己的AI应用!创建工作区模型介绍部署模型API参数计算Token使用Python SDK调用补全模型调用对话模型流式调用异步调用提示技巧生成对话分类推荐超级课程: Docker快速入门到精通Kubernetes入门到大师…

超越Sora!StreamingT2V AI视频模型,轻松打造120秒视觉盛宴

近日,来自美国德克萨斯大学奥斯汀分校(UT奥斯丁)等机构的研究人员提出了一项名为StreamingT2V的AI视频生成技术,引起了业界的广泛关注。这项技术打破了传统视频生成的局限,实现了高度一致且长度可扩展的视频生成&#…

使用 nodejs + zx 编写脚本更新本地 hosts

在日常的开发和运维工作中,我们经常需要修改本地的 hosts 文件来实现一些特定的网络配置,比如将某个域名指向特定的 IP 地址。而使用 Node.js 结合 zx 工具可以让我们更轻松地编写和运行脚本来更新本地的 hosts 文件。 一、功能介绍 目标: 通…

黑马头条day5总结

1、surefire-reports for the individual test results. 借鉴:【已解决】surefire-reports for the individual test results.-CSDN博客 Please refer to D:\javashizhan01\heima-leadnews\heima-leadnews-service\heima-leadnews-article\target\surefire-report…

【jenkins+cmake+svn管理c++项目】Windows环境安装以及工具配置

一、目标和环境 目标:搭建一个jenkins环境,实现jenkins调用cmake和svn和VS编译c项目,并将生成的库上传svn。 环境:win10虚拟机(练习流程用,正式用的话还是放到服务器),VS2017. 二、…

54、Qt/对话框、事件机制相关学习20240325

一、完善对话框,点击登录按钮,如果账号和密码匹配,则弹出信息对话框,给出提示”登录成功“,提供一个Ok按钮,用户点击Ok后,关闭登录界面,跳转到其他界面 如果账号和密码不匹配&#…

四大AI神器,助你开启智慧家居新生活

曾经,人工智能还只是科幻电影里的未来幻想,而今,它已悄然融入我们生活的方方面面。不再只是工厂里的自动化手臂,或是电影中的情感机器人,AI技术已经走进了寻常百姓家,让家居生活也焕发出智慧的光彩。 想象…

并发-多线程

目录 进程 线程 线程的串行 区别 多线程 进程 是指计算机中已执行的程序,曾经是分时系统的基本运作单位在面向进程设计的系统(如早期的UNIX,Linux 2.4及更早的版本)中,是程序的基本执行实体在面向线程设计的系统…

【PL理论】(1) 语法与语义:归纳的定义 | 推理规则 | 推导树 | 数学归纳法证明 (MI)

💭 写在前面:在学习编程的过程中,我们经常会听到 "语法" 和 "语义" 这两个词,这对于理解和编写高质量的代码至关重要。在本博客中,我们将深入探讨这两个概念,从而帮助读者更好地理解编…

趣味算法,猴子算法。python如何实现猴子算法

给一只猴子一台打印机,虽然这只猴子根本不识字,但会乱按,经过一段时间后,在它乱按出来的单词里总能找到一些至少看起来是有意义的部分,比如一两个简短的单词,由此可以推出:只要给它足够长的时间…

vite+vue3动态模块化导入并使用pinia

一、安装引入pinia 1.安装 pnpm install pinia # 或者使用 yarn yarn add pinia # 或者使用 npm npm install pinia 2.在main.js里引入 import { createApp } from vue import App from ./App.vue import { createPinia } from pinia createApp(App).use(createPinia()).mo…

辽渤湾海现已加入2024第七届燕窝天然滋补品博览会

参展企业介绍 大连辽渤湾海产品有限公司,是一家主营海参、鲍鱼、海胆等大连海产品的加工和销售的综合型水产企业,拥有国内精良的整条加工流水线,拥有上千平米的现代化加工办公场地的现代化企业。现已发展成为大连海参产品的主导型深加工基地。…

如何清理释放群晖客户端缓存?

任正菲说:企业最大的浪费,是经验的浪费! 而一个一个的经验,又都来自企业的每一个工作者。 因此当我们在工作过程中遇到一些问题时,我们就应该下意识的把解决问题的经验沉淀下来,从而可以与大家进行分享。…

软件设计师19--文件管理

软件设计师19--文件管理 考点1:文件相关概念例题: 考点2:树形目录结构(绝对路径与相对路径)例题: 考点3:位示图例题: 考点4:索引文件索引文件结构例题: 考点1…

武汉星起航:跨境电商行业的领军者,互帮互助共创佳绩

武汉星起航电子商务有限公司,作为跨境电商行业的领军者,以其出色的业绩和卓越的团队实力,在业内赢得了广泛的赞誉。公司自运营团队在亚马逊平台上成功开设了多家店铺,凭借着深耕跨境电商行业多年所积累的经验,取得了令…

[自研开源] 数据集成之分批传输 v0.7

开源地址:gitee | github 详细介绍:MyData 基于 Web API 的数据集成平台 部署文档:用 Docker 部署 MyData 使用手册:MyData 使用手册 试用体验:https://demo.mydata.work 交流Q群:430089673 介绍 本篇基于…

面试笔记——Java集合篇

Java集合框架体系 重点:单列集合——ArrayList、LinkedList;双列集合——HashMap、ConcurrentHashMap。 List相关 数组(Array) 是一种用连续的内存空间存储相同数据类型数据的线性数据结构。 数组获取其他元素: 为什…

为什么在vite中使用eslint报错‘__dirname‘ is not defined?

问题分析 发生这种情况是因为 ESLint 不知道 vite.config.js 中的代码在 Node.js 中使用,__dirname 未在浏览器中定义,也未在 ES 模块中定义。因此要告诉 ESLint 代码将作为 CommonJS 模块在 Node.js 中运行。 解决方案 请打开 ESLint 配置并在该 env …