《人工智能导论》知识思维导图梳理【第6章节】

文章目录

  • 第六章 知识图谱
    • 1 知识图谱概述
    • 2 知识图谱相关概念
    • 3 知识图谱的逻辑结构
    • 4 知识图谱的数据存储
    • 5 知识图谱的构建过程
    • 6 例题
  • markdown内容的分享

第六章 知识图谱

在这里插入图片描述

1 知识图谱概述

在这里插入图片描述

2 知识图谱相关概念

在这里插入图片描述

3 知识图谱的逻辑结构

在这里插入图片描述

4 知识图谱的数据存储

在这里插入图片描述

5 知识图谱的构建过程

在这里插入图片描述
在这里插入图片描述

6 例题

在这里插入图片描述

markdown内容的分享

  • 需要的小伙伴,直接创建markdown文件导入xmind食用即可!
# 第六章 知识图谱

## 1 知识图谱概述

### 知识图谱本质上是一种结构化的语义网络

- 其节点代表实体或概念

- 边代表实体/概念之间的各种语义关系

### 知识图谱(Knowledge Graph)也叫语义网络(Semantic NetWork)。其初衷是为了提升搜索引擎的能力,增强用户的搜索质量以及搜索体验。

## 2 知识图谱相关概念

### 知识图谱的定义

- 知识图谱又称科学知识图谱,用各种不同的图形等可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互关系。

- 知识图谱是用图谱的形式表示知识

### 知识图谱可以看作一张图,节点表示实体或概念、边表示属性或关系构成

- 实体:具有可区别性且独立存在的某种事物

- 概念(语义类):具有同种特性的实体构成的集合

- 内容:通常作为实体和语义类的名字、描述、解释等,可以由文本、图像、音视频等来表达

- 属性值:描述资源之间的关系,即知识图谱中的关系

- 关系:把k个图节点(实体、语义类、属性值)映射到布尔值的函数

## 3 知识图谱的逻辑结构

### 逻辑划分为两个层次

- 数据层

	-  数据层主要由一系列的事实组成,知识以事实(fact)为单位存储在图数据库,通常以“实体1-关系-实体2”或者“实体-属性-属性值”三元组作为事实(fact)的基本表达方式。存储在图数据库中的所有数据将构成庞大的实体关系网络,形成知识的“图谱”。

- 模式层

	- 模式层在数据层之上,是知识图谱的核心。在模式层存储的是经过提炼的知识,通常采用本体库来管理知识图谱的模式层。数据模型是按照本体论的思想勾画出来的数据组织模式,数据模型可以展示数据的组织方式和相互关系。例如:创建动植物的数据模型,可以按照动植物的通用分类标准,使用七个主要级别:界、门、纲、目、科、属、种 。

### 逻辑结构的构建方式 

- 根据是先确定数据模型再收集具体数据,还是先收集具体数据再确定数据模型,将知识图谱分为自顶向下和自下向上的构建方式

- 自顶向下的构建方式,指先确定知识图谱的数据模型,再根据模型去填充具体数据。

	- 数据模型的设计,是知识图谱的顶层设计,根据知识图谱的特点确定数据模型,就相当于确定了知识图谱收集数据的范围,以及数据的组织方式。

	- 适用于行业知识图谱的构建,对于一个行业来说,数据内容,数据组织方式相对来说比较容易确定。比如对于法律领域的知识图谱,可能会以法律分类,法律条文,法律案例等的方式组织。

- 自下向上的构建方式,是指先按照三元组的方式收集具体数据,然后根据数据内容来提炼数据模型。 

	- 一般公共领域的知识图谱采用这种方式。

	- 先把所有的数据收集起来,形成庞大的数据集,然后再根据数据内容,总结数据的特点,将数据进行整理、分析、归纳、总结,形成数据模型

## 4 知识图谱的数据存储

### 知识图谱的存储方式

- 知识图谱的原始数据类型一般来说有三类

	- 结构化数据(Structed Data):如关系数据库

	- 半结构化数据(Semi-Structed Data):如XML、JSON、百科

	- 非结构化数据(UnStructed Data):如图片、音频、视频、文本

- 如何存储这三类数据类型

	- 基于表结构的存储采用二维数据表的方式存储数据,例如三元组表、属性表以及关系数据库

	- 基于图结构的存储可以使用图数据库

- RDF(Resource Description Framework)存储

	- RDF本质是一个数据模型,它提供了一个统一的标准,用于描述实体/资源。RDF形式上表示为主谓宾SPO三元组。表示实体与实体间的关系(实体1-关系-实体2),或者实体的某个属性的值是什么(实体-属性-属性值)

		- Subject:通常是实体、事实或者概念中的任何一个。

		- Predicate:通常是关系或者属性。

		- Object:既可以是实体、事件、概念,也可以是普通的值。

- 图数据库存储

	- 图数据库的结构定义相比RDF数据库更为通用,实现了图结构中的节点\边以及属性来进行图数据的存储,典型的开源图数据库就是Neo4j。

		- 节点(node):通常表示实体,例如人员、账户、事件等,节点可以有属性和标签

		- 边(edge):又被称为关系(relationships),具有名字和方向,并有开始节点和一个结束节点,边是图数据库中最显著的一个特征,在RDBMS中没有对应实现。

		- 属性(properties):类似KV数据库中的键值对,节点和边都可以有属性

## 5 视图图谱的构建过程

### 从原始的数据到形成知识图谱,经历[知识抽取、知识表示、知识融合和知识推理]四个过程

### 1 知识抽取

- 从不同来源、不同结构的数据中进行知识提取,形成知识(结构化数据)存入到知识图谱

- 结构化数据处理

	- 结构化数据,通常是关系型数据库的数据,把关系型数据库中的数据转换为RDF数据(linked data),普遍采用的技术是D2R技术。D2R主要包括D2R Server,D2RQ Engine和D2RRQ Mapping语言。

- 半结构化数据处理

	- 采用包装器的方式进行处理

	- 包装器是一个能够将数据从HTML网页中抽取出来,并且将它们还原为结构化的数据的软件程序

	- 包装器归纳主要包括网页清洗、网页标注、包装器空间生成、包装器评估、包装器归纳结果等步骤

- 非结构化数据处理

	- 实体抽取(命名实体识别):实体包括概念,人物,组织,地名,时间

	- 关系抽取:实体和实体之间的关系

	- 属性抽取:实体的属性信息

### 2 知识融合

- 将多个来源的关于同一个实体或概念的描述信息融合起来

- 知识融合的目的就是将不同知识库对实体的描述进行整合,从而获得实体的完整描述。

### 3 知识加工

- 知识加工主要包括三方面内容:本体抽取、知识推理和质量评估

- 本体抽取

	- 本体(ontology)是指公认的概念集合、概念框架,如“人”、“事”、“物”等

	- 人工编辑

	- 自动化本体构建

		- 实体并列关系相似度计算 → 实体上下位关系抽取 → 本体的生成。

- 知识推理

	-  知识推理的对象也并不局限于实体间的关系,也可以是实体的属性值,本体的概念层次关系

- 质量评估

	- 可以对知识的可信度进行量化,通过舍弃置信度较低的知识来保障知识库的质量

## 6 例题

### 1 在知识图谱的构建中,知识提取包括

- [实体抽取]

- [关系抽取]

- [属性抽取]

### 2 在知识图谱中先搜集数据然后建立本体的构建过程,采用了[自下向上]的构建方式 

### 3 知识图谱在逻辑上可以由“实体—关系—实体”三元组,或者“实体-属性—属性值”构成,实体间通过关系相互联结,构成网状的知识结构

### 4 从知识图谱数据组织的架构来看,可以把知识图谱的数据分为两个层次,一个是[模式层],另一个是[数据层]

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/249580.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

论文阅读——Mask DINO(cvpr2023)

DINO是检测,Mask DINO是检测分割。 几个模型对比: 传统的检测分割中,检测头和分割头是平行的,Mask DINO使用二分图匹配bipartite matching提高匹配结果的准确性。 box对大的类别不计算损失,因为太大了,会…

Gitee:远程仓库步骤

第一步:新建仓库 第二步:初始化本地仓库,git init 创建分支 git branch 新分支名 第三步:git add . :添加到暂存区 第四步:git config –global user.email关联邮箱,user.name用户名 第…

UE5 Landscaping MapBox 学习笔记

1. Landscaping MapBox 操作录屏 https://www.bilibili.com/video/BV113411U7T9/?spm_id_from333.337.search-card.all.click&vd_source707ec8983cc32e6e065d5496a7f79ee6 安装Landscaping与LandscapingMapbox两个插件 打开Landscaping窗口,这里应该要在Proj…

【CDP】CDP 集群通过Knox 访问Yarn Web UI,无法跳转到Flink Web UI 问题解决

一、前言 记录下在CDP 环境中,通过Knox 访问Yarn Web UI,无法跳转到Flink Web UI 的BUG 解决方法。 二、问题复现 登录 Knox Web UI 找到任一 Flink 任务 点击 ApplicationMaster 跳转 Flink WEB UI 出问题 内容空白,无法正常跳转到…

python 小程序学生选课系统源码

开发工具: PyCharm,mysql5.7,微信开发者工具 技术说明: python django html 小程序 功能介绍: 学生: 登录,选课(查看课程及选择),我的成绩,…

Unity 使用AddTorque方法给刚体施加力矩详解

给刚体施加力,除了使用AddForce方法,我们还可以使用AddTorque方法。该方法是通过施加力矩给刚体以力。AddTorque方法从形式上跟AddForce差不多,它也有4个重载方法: 1、AddTorque(Vector3 torque);使用Vector3类型参数…

kakfa实战指引-实时海量流式数据处理

前言 我们最终决定从头开始构建一些东西。我们的想法是,与其专注于保存成堆的数据,如关系数据库、键值存储、搜索索引或缓存,不如专注于将数据视为不断发展和不断增长的流,并围绕这个想法构建一个数据系统——实际上是一个数据架…

基于YOLOv8深度学习的高精度车辆行人检测与计数系统【python源码+Pyqt5界面+数据集+训练代码】目标检测、深度学习实战

《博主简介》 小伙伴们好,我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源,可关注公-仲-hao:【阿旭算法与机器学习】,共同学习交流~ 👍感谢小伙伴们点赞、关注! 《------往期经典推…

zync spi flash 频率配置

spi flash的频率配置 代码流程及最终的频率值。 驱动目录 基于4.14.55 内核, \drivers\spi\spi-dw-fmsh.c (控制器) \drivers\spi\spi-dw.c \drivers\mtd\devices\m25p80.c (设备) \drivers\spi\spi.c spi dts配置说明 spi0: spie000100…

3、Kafka 线上集群部署方案怎么做?

文章目录 1、操作系统的选择1.1、I/O 模型的使用1.2、数据网络传输效率1.3、社区支持度 2、磁盘的选择3、磁盘容量的规划3.1、举例思考本问题:3.2、计算一下:3.3、规划磁盘容量时你需要考虑下面这几个元素: 4、带宽规划4.1、计算 总结 1、操作…

提供一个数据库的表,然后,分页显示表中所有信息,一页10个,此表130条信息。最后再以饼图显示男 女 未知 人数的情况。

运行之后显示的效果&#xff1a; 如果是新项目&#xff0c;建立项目后&#xff0c;把mysql驱动放到指定的目录下即&#xff1a; WebContent\WEB-INF-lib 我用的驱动是 mysql-connector-j-8.0.33.jar 展示页 listpage.jsp <%page import"java.util.Map.Entry"%&g…

break用法

break他是用于从循环语句中跳出一层循环体的&#xff0c;提前结束循环 但是值得注意的点事break只能用在循环语句和switch当中 那么我们上代码进行具体的理解&#xff1a; 如果圆的面积大于100就会终止循环&#xff0c;那么如何体现出他只能终结一个循环呢&#xff0c;请看下…

独立站低成本流量:优化用户体验,实现精准营销

在当今的数字化时代&#xff0c;获取流量是每个网站成功的关键。然而&#xff0c;随着竞争的加剧&#xff0c;流量获取的成本也在逐渐上升。对于许多独立站来说&#xff0c;如何低成本的获取流量变得越来越具有挑战性。本文Nox聚星将和大家探讨独立站如何通过网站优化和精准营销…

3. 内容模块管理 - 异常处理与校验

文章目录 内容模块管理一、自定义异常1.1 全局异常处理器1.2 自定义异常1.3 异常统一响应类1.4 封装通用异常信息 二、JSR303校验2.1 Maven坐标2.2 校验规则2.3 代码示例2.4 捕捉校验异常2.5 分组校验2.6 备注 三、全局异常处理23.1 全局异常处理器3.2 结果集3.3 常用注解3.3.1…

拷贝的艺术:深拷贝与浅拷贝的区别与应用(上)

&#x1f90d; 前端开发工程师&#xff08;主业&#xff09;、技术博主&#xff08;副业&#xff09;、已过CET6 &#x1f368; 阿珊和她的猫_CSDN个人主页 &#x1f560; 牛客高级专题作者、在牛客打造高质量专栏《前端面试必备》 &#x1f35a; 蓝桥云课签约作者、已在蓝桥云…

虚拟电厂 能源物联新方向

今年有多热&#xff1f;据上海市气象局官微消息&#xff0c;5月29日13时09分&#xff0c;徐家汇站气温达36.1℃&#xff0c;打破了百年来的当地5月份气温*高纪录。不仅如此&#xff0c;北京、四川、江西、湖南、广东、广西等地也频频发布高温预警。 伴随着居民用电急剧攀升&am…

LED 底层原理 和 GPIO引脚、寄存器操作

目录 LED 原理 LED 的驱动方式 普适的 GPIO 引脚操作方法 GPIO 寄存器操作 LED 原理 当我们学习 C 语言的时候&#xff0c;我们会写个 Hello 程序。 那当我们写 ARM 程序&#xff0c;也该有一个简单的程序引领我们入门&#xff0c;这个程序就是点亮 LED。 我们怎样去点亮…

Java 中 IO 流

目录 前言 1. 字节流&#xff08;Byte Streams&#xff09;&#xff1a; 1.1 输入字节流&#xff1a; 1.2 输出字节流&#xff1a; 2. 字符流&#xff08;Character Streams&#xff09;&#xff1a; 2.1 输入字符流&#xff1a; 2.2 输出字符流&#xff1a; 3. 转换流&…

如何一键生成多个文件二维码?批量文件二维码制作技巧

文件能批量生成二维码吗&#xff1f;现在的二维码用途范围越来越广&#xff0c;比如常见的有图文、文件、问卷、音频或者视频等内容生成二维码图片&#xff0c;扫码查看内容。那么当需要将很多的文件每个都单独生成一个二维码时&#xff0c;有没有比较简单快捷的操作方法吗&…

SELinux介绍

本章主要介绍在RHEL8中如何使用 SELinux。 了解什么是 SELinux了解 SELinux 的上下文配置端口上下文了解SELinux的布尔值了解SELinux的模式 在 Windows系统中安装了一些安全软件后&#xff0c;当执行某个命令时&#xff0c;如果安全软件认为这个命令对系统是一种危害&#…