第1章 理解知识图谱(一)

💗💗💗欢迎来到我的博客,你将找到有关如何使用技术解决问题的文章,也会找到某个技术的学习路线。无论你是何种职业,我都希望我的博客对你有所帮助。最后不要忘记订阅我的博客以获取最新文章,也欢迎在文章下方留下你的评论和反馈。我期待着与你分享知识、互相学习和建立一个积极的社区。谢谢你的光临,让我们一起踏上这个知识之旅!
请添加图片描述

文章目录

  • 🥦1.1 知识图谱概述
    • 🥦1.1.1 知识定义及分类
    • 🥦1.1.2 知识图谱定义
    • 🥦1.1.3 知识图谱分类
    • 🥦1.1.4 知识图谱发展阶段
  • 🥦1.2 知识图谱架构
    • 🥦1.2.1 构建方法
    • 🥦1.2.2 逻辑架构
    • 🥦1.2.3 技术架构

在学习本书前,我想在此夸一夸本书的作者,作者在每一大章的前面都会送读者一段励志话。

临渊羡鱼,不如退而结网。 — 《汉书 董仲舒传》

🥦1.1 知识图谱概述

🥦1.1.1 知识定义及分类

哲学家柏拉图先生曾经指明,知识的三个条件

  • 合理性
  • 真实性
  • 被相信

从大白话来讲就是知识是人类通过观察学习等行为进而获得总结的产物或者说是集合。


如果我们从不同的研究视角、研究目的以及多知识的不同认识程度对知识进行分类的话,可以分为以下几种:

首先是层次划分

  • 零级知识:最基本的知识,定义、定理等,问题求解的常识性和原理性知识。
  • 一级知识:第二层知识,启发式知识,可弥补零级知识的不足,提高求解的效率。
  • 二级知识:第三层知识,控制性知识,对低层知识起到指导作用,组织,运用零级和一级知识。
  • 高层次知识:像回忆,综合,概况,抽象,也可以反映人类的心理。

其次是性质划分

  • 叙述性知识:状态,概念,条件,事实
  • 过程性知识:求解过程中用到的操作,演算,行动的知识
  • 控制性知识:求解过程中决定选用哪种操作,演算,行动的知识

最后是来源划分

  • 共识知识:来自教科书刊物,已经被专业人士承认。
  • 个性知识:来自现场有经验的专业人士,包括大量的经验知识或启发式知识。它描述问题的轮廓,知识严格性差。

作者在这总结了一下,无论采用何种划分方式,目的都是为了构建知识实体之间的结构化关系网络的知识图谱,毕竟我们的目的还是搞出知识图谱的。

🥦1.1.2 知识图谱定义

知识图谱:以结构化的形式描述显示世界中的实体机器关系,将互联网庞大的信息网转化为更接近人类去认知的形式。

这里我仅仅简单概述了一下,想了解更多概念的可以参考百度百科。

知识图谱的相关概念有几个分别是:

  1. 概念
  2. 实体
  3. 关系
  4. 属性

我们可以理解为知识图谱就是将世界中的不同的种类的事物连接在一起而得到一个关系网络。
在这里插入图片描述
可以从上图看出,实体包括小李,小丁,跑步等,关系包括喜欢,同学等,概念就是人,运动之类的,属性就是面积:3000平方米。整张图还是很好理解的。当然这里面的细节我们也是要知道的。


比如:如果两个节点之间存在关系的话,那么它们之间就会被一条有向边连接在一起。本质来讲:知识图谱就是一种揭示实体之间关系的语义网络,可以对现实世界的事物及其相互关系进行形式化描述。组织形式:有向图

🥦1.1.3 知识图谱分类

书中在知识图谱分类上分为了两类,一种是通用知识图谱,一种是领域知识图谱

  • 通用知识图谱(General Knowledge Graph): 这种知识图谱致力于涵盖各种主题,包括常识性的信息、人物、地点、历史事件等。通用知识图谱的目标是为用户提供广泛的知识,以满足各种查询和信息检索需求。例如,Google的知识图谱就是一个通用知识图谱的实例。

  • 领域特定知识图谱(Domain-specific Knowledge Graph): 这类知识图谱专注于特定的领域或行业,以深入挖掘该领域的专业知识。领域特定知识图谱有助于更深入地理解特定领域的实体、关系和属性,支持专业性的应用。例如,在医学领域使用的医学知识图谱就是领域特定知识图谱的一个例子。当然还有可多的应用,书中还介绍了生活类知识图谱、社交类知识图谱、电商类知识图谱、金融类知识图谱等

作者还提到,不同的知识图谱并不是一蹴而就的,而是经过漫长的发展和积累进行得到的,这里面包括了前人的不断积累,值得我们去学习与敬佩。

🥦1.1.4 知识图谱发展阶段

早期阶段:

概念形成(2000年前): 早期的知识图谱概念主要体现在人工智能和语义网等领域。研究者们开始探索如何以图形结构的方式表示和组织知识。

语义网阶段(2001-2010年):

语义网的提出: 在这个阶段,Tim Berners-Lee提出了语义网的概念,强调在互联网上创建具有明确含义的数据链接。RDF(Resource Description Framework)和OWL(Web Ontology Language)等标准被引入,用于表示和推理关于网络资源的知识。

知识图谱概念的兴起(2012年前后):

Google知识图谱: Google于2012年推出了知识图谱,将知识图谱引入主流。这一阶段的重要事件包括谷歌的知识图谱以及百度、微软等公司对知识图谱概念的采纳。

知识图谱的应用拓展(2015年后):

应用扩展: 知识图谱在搜索引擎、虚拟助手、自然语言处理、推荐系统等领域得到广泛应用。各种知识图谱的建设和应用逐渐增多,包括通用知识图谱和领域特定知识图谱。

领域特定知识图谱的兴起(2018年后):

领域特定应用: 随着对于更深入领域知识的需求增加,领域特定知识图谱得到更广泛的应用,如医学知识图谱、金融知识图谱等。

知识图谱与AI的融合(2020年后):

知识增强的AI: 知识图谱与人工智能、机器学习的结合越来越深入。知识图谱被用于丰富机器学习模型的输入,帮助模型更好地理解语境和关系。

这里作者是通过一张图进行展示,并对未来国内对于此行业进行了一定的展望。

🥦1.2 知识图谱架构

🥦1.2.1 构建方法

从两个角度去看的话,可以分为自底向上和自顶向下
构建知识图谱可以从自底向上和自顶向下两个角度来考虑,这两种方法分别强调从细节逐步构建整体和从整体指导细节的方式。
自底向上(Bottom-Up)的构建方式:

  • 数据收集与整理: 从各种数据源中收集结构化和非结构化的信息。这可能包括从文本中提取实体和关系,解析数据库中的数据等。

  • 实体识别和关系抽取: 使用自然语言处理技术,从文本数据中识别实体和抽取实体之间的关系。这可以包括命名实体识别(NER)、关系抽取等任务。

  • 数据清洗和预处理: 处理数据中的噪声、错误和不一致性,确保数据的质量。

  • 知识表示和建模: 将数据表示成图结构,定义实体、属性和关系。这可能涉及到为不同实体设计模型和属性,以及识别关系类型。

  • 关联实体: 在图中建立实体之间的连接,形成知识图谱的结构。这可能需要使用算法来推断或预测一些关联关系。

  • 知识图谱的增量构建: 可能采用增量式的方式,逐步将新的信息添加到已有的知识图谱中。

自顶向下(Top-Down)的构建方式:

  • 需求分析: 首先明确定义知识图谱的目标和应用场景,确定需要包含的实体、关系和属性。

  • 知识建模和设计: 定义知识图谱的整体结构,包括实体的分类、属性的定义和关系的建模。这一步可以借助领域专家的知识进行设计。

  • 数据获取和注入: 根据知识图谱的设计,获取符合设计要求的数据。这可能涉及到购买、合作获取、或者使用已有数据集。

  • 数据清洗和转换: 对获取的数据进行清洗和预处理,以符合知识图谱的标准。

  • 知识图谱的实际建立: 将清洗过的数据注入到知识图谱中,建立实体、属性和关系的具体关联。

  • 知识图谱的优化和维护: 反馈知识图谱的实际应用情况,进行优化和调整,确保知识图谱的持续有效性。

作者总结到,自顶向下是指为知识图谱定义好本体模型,根据本体模式的约束,再将实体加入知识库。
自底向上是指从一些通用知识图谱中提取出实体,选择其中置信度较高的实体加入知识库,再构建顶层的本体模式。
注意:这里的本体库可以理解为面向对象中的“类”,作者这里形容的十分妙~

🥦1.2.2 逻辑架构

逻辑架构可以划分为两个层次:概念层和数据层

概念层的构建是在数据层之上的,这是知识图谱的核心,用来规定知识图片中包含哪些领域的知识、知识的类
别、每种类别知识的关系与属性。

如果从一个例子来展示的话,如下:
概念层:人物1-关系-人物2,人物-属性-属性值
数据层:李娜-丈夫-姜山,李娜-冠军-法网

我相信这样大家理解起来就会轻松许多了吧

🥦1.2.3 技术架构

在这里插入图片描述
本小节内容较多,不进行一一描述,大家可以通过上图进行大概理解知识图谱的整个构建过程。

请添加图片描述

挑战与创造都是很痛苦的,但是很充实。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/196519.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

vue3默认插槽、具名插槽以及作用域插槽实现父子组件通信

默认插槽与具名插槽 父组件 <template><div><h1>我是父组件</h1><child><div style"color: red">我是从父元素插入的值(默认插槽)</div><template #juming><div style"color: green">我是从父元素…

【沁恒蓝牙mesh】CH58x 将RTC时钟切换为LSE外部低速时钟

本文主要记录了【沁恒蓝牙mesh】CH58x 如何将RTC时钟切换为外部时钟 &#x1f496; 作者简介&#xff1a;大家好&#xff0c;我是喜欢记录零碎知识点的小菜鸟。&#x1f60e;&#x1f4dd; 个人主页&#xff1a;欢迎访问我的 Ethernet_Comm 博客主页&#x1f525;&#x1f389;…

SpringCloud之服务网关Gateway组件使用——详解

目录 一、网关介绍 1.什么是服务网关 2. 为什么需要网关 3.网关组件在微服务中架构 二、服务网关组件 1. zuul 1.x 2.x(netflix 组件) 1.1 zuul版本说明 2. gateway (spring) 2.1 特性 2.2 开发网关动态路由 2.2.1.创建项目引入网关依赖 2.2.2 快捷方式配置路由 2.2…

基于HTML+CSS+JavaScript的登录注册界面设计

一、界面效果: 二、HTML代码: 登录注册html: 登录成功html: <!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title></title> </head> <body> <h1>登录成功!</h1> </body> <…

群晖NAS基础设置

群晖NAS基础设置 最近一直在玩群晖NAS系统&#xff0c;有一些基础的配置跟大家分享一下 开启ssh登录 1.开启方法 控制面板—>终端和SNMP—>终端机 2.使用ssh软件登录 这里我用SecureCRT登录 进入ssh 3.进入root用户 starstar-nas:~$ sudo su -l root Password: ro…

【学习草稿】pid控制基础实现--往水桶注水

pid 1&#xff09;非常通俗易懂的PID控制&#xff08;1&#xff09;https://zhuanlan.zhihu.com/p/37515841 球场上运动至指定地点&#xff08;比例控制&#xff09;&#xff1a;有图【很直观的帮助理解】&有文字分析 2&#xff09;初识PID-搞懂PID概念 https://zhuanlan.…

CMake构建一个转换为3d tile的开源代码成功

之前CMake构建一个转换为3d tile的开源代码&#xff0c;生成解决方案之后&#xff0c;从VS2019打开&#xff1b; 总是报一个错误&#xff0c;跟 mocs_compilation_Debug.cpp 这个QT相关文件有关&#xff0c;它生成的obj&#xff0c;总是报模块计算机x64和目标计算机x86冲突&am…

HTTP/3 为什么正迅速崛起

超文本传输协议&#xff08;HTTP&#xff09;作为互联网的基石&#xff0c;一直在网页加载、视频流传输、应用获取数据等方方面面发挥重要作用。 去年&#xff0c;负责定义互联网技术的互联网工程任务组&#xff08;IETF&#xff09;将该协议的最新版本 HTTP/3 定为标准。在此…

leetcode:495. 提莫攻击

一、题目 链接&#xff1a;495. 提莫攻击 - 力扣&#xff08;LeetCode&#xff09; 函数原型&#xff1a;int findPoisonedDuration(int* timeSeries, int timeSeriesSize, int duration) 二、思路 遍历数组timeSeries&#xff0c;如果 元素值duration < 下一元素值 &#x…

反射、枚举以及lambda表达式

1. 反射 1.1 定义 java的.class文件在运行时会被编译为一个Class对象&#xff0c;既然是对象&#xff0c;那么我们就可以通过一定的方式取到这个对象&#xff0c;然后对于这个对象进行一系列操作&#xff08;改变原本类的属性、方法&#xff09;。 这个操作就是反射&#xf…

PyQt6 QPlainTextEdit纯文本控件

​锋哥原创的PyQt6视频教程&#xff1a; 2024版 PyQt6 Python桌面开发 视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili2024版 PyQt6 Python桌面开发 视频教程(无废话版) 玩命更新中~共计28条视频&#xff0c;包括&#xff1a;2024版 PyQt6 Python桌面开发 视频教程(无废话…

Nodejs+vue基于微信小程序的高校餐厅食品留样管理系统uniapp

任何系统都要遵循系统设计的基本流程&#xff0c;本系统也不例外&#xff0c;同样需要经过市场调研&#xff0c;需求分析&#xff0c;概要设计&#xff0c;详细设计&#xff0c;编码&#xff0c;测试这些步骤&#xff0c;基于nodejs小程序技术设计并实现了小程序。采用B/S结构,…

Vue中的过滤器了解吗?过滤器的应用场景有哪些?

​&#x1f308;个人主页&#xff1a;前端青山 &#x1f525;系列专栏&#xff1a;Vue篇 &#x1f516;人终将被年少不可得之物困其一生 依旧青山,本期给大家带来vue篇专栏内容:vue-filter过滤器 目录 一、是什么 二、如何用 定义filter 小结&#xff1a; 三、应用场景 四…

[Linux]进程创建➕进程终止

文章目录 1.再谈fork()函数1.1fork()创建子进程 OS都做了哪些工作?1.2对上述问题的理解1.3写时拷贝进行父子进程分离的优势1.4了解eip寄存器和pc1.5了解进程的上下文数据1.6对计算机组成的理解1.7fork常规用法1.8fork调用失败的原因 2.进程终止2.1进程终止时操作系统要做的工作…

在Anaconda中用命令行安装环境以及安装包

一、下载Anaconda 下载地址 二、创建环境 1. 打开Anaconda命令行 2.创建环境 conda create -n 环境名称 python3.10(需要的python版本号) 3.激活环境 activate 环境名4.下载安装包 pip install 模块名 -i https://pypi.tuna.tsinghua.edu.cn/simple5.下载torch 官网&…

线程池在Java中的应用实践

摘要&#xff1a;在实际业务场景中&#xff0c;线程池发挥着重要作用。本文将详细解答在高并发、任务执行时间短、并发不高、任务执行时间长以及并发高、业务执行时间长的业务场景下&#xff0c;如何使用线程池进行优化。 一、高并发、任务执行时间短的业务场景 在高并发、任务…

AI 重构工业制造的故事 我们从大模型开始讲起

在数字化浪潮的推动下&#xff0c;工业制造领域正经历着一场前所未有的变革。人工智能&#xff08;AI&#xff09;作为这场变革的关键推动者之一&#xff0c;正以惊人的速度颠覆传统制造业。而大模型作为AI时代最先进的科技工具之一&#xff0c;或将成为引领这场变革的利器&…

js 获取数组的最大值与最小值

let arr [1, 2, 5, 8, 10, 100, -1] 1. 使用Math的静态方法max/min Math.max()函数返回给定的一组数中的最大值。 它的语法&#xff1a;Math.max(value1[, value2, ...]) 使用此方法&#xff0c;需要注意&#xff0c;如果没有参数的话&#xff0c;则返回-Infinity。如果有任一…

走近“中国深度-深海探索主题展”,带你探索深海远洋

深海&#xff0c;自古以来给予了人类无限的遐想&#xff0c;随着时代的进步和科学的发展&#xff0c;海洋的神秘面纱被一点点揭开&#xff0c;呈现在我们面前的是一个资源宝库&#xff0c;“可上九天揽月&#xff0c;可下五洋捉鳖”已经成为现实&#xff0c;21世纪是海洋的世纪…

1和0的故事-MISC-bugku-解题步骤

——CTF解题专栏—— 题目信息&#xff1a; 题目&#xff1a;1和0的故事 作者&#xff1a;Eas0a 提示&#xff1a;无 解题附件&#xff1a; 解题思路&#xff1a; 哦&#xff1f;1和0的故事&#xff1f;&#xff08;奸笑.jpg&#xff09;&#xff0c;打开看看啊。 emmm...j…