【8】知识加工

一、概述

信息抽取/知识融合后得到的“事实”进行知识推理拓展现有知识、得到新知识。

知识加工主要包括三方面内容:本体构建、知识推理和质量评估。

二、本体构建

1.本体

定义:本体是用于描述一个领域的术语集合,其组织结构是层次结构化的。简而言之本体是用于描述一个领域的数据集合,是知识库的骨架。

作用:获取、描述和表示相关领域的知识,提供对该领域知识的共同理解,确定领域内共同认可的词汇,提供该领域特定的概念定义和概念之间的关系,提供该领域中发生的活动以及该领域的主要理论和基本原理,达到人机交流的效果

2.领域本体

定义:领域本体(Domain ontology) 是描述指定领域知识的一种专门本体,它给出了领域实体概念及相互关系领域活动以及该领域所具有的特性和规律的一种形式化描述

作用: 明确专业术语、关系及其领域公理, 使其形式化;在人与人之间、人与机器之间达到共享;实现一定程度的领域知识复用。如:企业本体、医学概念本体、酶催化生物学本体、陶瓷材料机械属性本体等。

3.本体构建的意义:

知识图谱分为数据层和模式层,数据层是由一系列事实数据构成,而模式层则用来从数据中构建实体、属性、关系,是知识图谱的核心。本体库被广泛用于构建知识图谱数据层,由本体库构建的知识图谱冗余较小 ,结构层次强。

4.本体的构成:

由5个基本构成元素(建模元语),即

类(Classes)或概念(Concepts):是对象的集合;概念是广义的概念,除了可以是一般意义上的概念以外,也可以是任务、功能、行为、策略、推理过程等,其定义一般包括概念的名称,以及对该概念的自然语言描述。本体中的这些概念通常构成一个继承的分类层次。

 关系(Relations):是领域中概念之间的交互作用,形式上定义为n维笛卡儿积的子集:

 函数(Functions):是一种特殊的关系,关系的前n1个元素可以惟一确定第n个元素。一般地,函数采用FC1×C2×…×Cn-1→Cn的形式表示,如MotherOf就是一个函数,MotherOf(x,y)表示yx的母亲,即x确定y

 公理(Axioms):是一些永真式的描述。更具体地说,公理是领域中在任何条件下都成立的断言

 实例(Instances):代表属于某概念/类的基本元素,即某概念/类所指的具体实体。

5.本体的分类

根据本体应用主题,本体划分为五种类型:领域本体、通用或常识本体、知识本体、语言学本体和任务本体

根据本体对领域的依赖程度由高到低,可分为四个类别:顶级本体(top-level Ontologies)、领域本体(domain Ontologies)、任务本体(task Ontologies)和应用本体(application Ontologies)

6.本体的构建工程思想

(1)IDEF-5方法

IDEF5创建本体的5个主要步骤是:① 定义课题、组织队伍;② 收集数据;③ 分析数据;④本体初步开发;⑤ 本体优化与验证

(2)Skeletal Methodolody骨架法(Uschold方法)

Mike Uschold & Micheal Gruninger的骨架法(Skeletal Methodology),又称Enterprise法,专门用来创建企业本体(Enterprise ontology,是有关企业建模过程的本体)

(3)Methontology方法

Methontology方法是在结合了骨架法和GOMEZ-PEREZ方法后,提出的一种更为通用的本体建设方法。更接近软件工程开发方法。它将本体开发进程本体生命周期两个方面区别开来,并使用不同的技术予以支持。专用于创建化学本体(有关化学元素周期表的本体)

流程包括:

①管理阶段:这一阶段的系统规划包括任务的进展情况、需要的资源、如何保证质量等问题。

②开发阶段:分为规范说明、概念化、形式化、执行以及维护五个步骤。

③维护阶段:包括知识获取、系统集成、评价、文档说明、配置管理五个步骤。

(4)七步法

斯坦福大学医学院开发的七步法,主要用于领域本体的构建

7个步骤分别是: ① 确定本体的专业领域和范畴;② 考查复用现有本体的可能性;③ 列出本体中的重要术语;④ 定义类和类的等级体系(完善等级体系可行的方法有:自顶向下法、自低向上法和综合法);⑤ 定义类的属性;⑥ 定义属性的分面;⑦ 创建实例

(5)深度学习下的本体构建

a.领域概念识别。 训练领域内语料的字向量和词向量作为特征输入到深度神经网络,识别领域内概念,区分出领域内个体的概念。

b. 层级关系划分。BIRCH 算法用于聚类领域内概念,初步划分领域本体中各概念的层级关系。

c. 属性抽取。 输入词向量和词位置,采用卷积神经网络结合远程监督抽取实体关系模型,抽取领域本体类间关系,构成领域本体属性,划分出类与属性关系,完成领域本体基本框架。

三、知识推理

通过各种方法获取新的知识或者结论知识推理主要是利用现有知识图谱已存在的事实或者语料,运用算法工具,推理出实体之间的关联的关系,自动产生新的知识,补充缺失的事实,完善知识图谱。

知识推理的主要方法

1、基于符号逻辑的推理——本体推理

传统的符号逻辑推理中主要与知识图谱有关的推理手段是基于描述逻辑的本体推理。

描述逻辑主要被⽤来对事物的本体进⾏建模和推理,⽤来描述和推断概念分类及其概念之间的关系。

主要方法:

基于表运算(Tableaux)及改进的⽅法: FaCT++RacerPellet Hermit

基于Datalog转换的⽅法如KAONRDFox

基于产⽣式规则的算法(如rete): Jena SesameOWLIM

2、基于图结构和统计规则挖掘的推理

主要方法:
基于路径排序学习⽅法(PRAPath ranking Algorithm)
基于关联规则挖掘⽅法(AMIE)

3、基于知识图谱表示学习的关系推理

主要方法

将实体和关系都表示为向量

通过向量之间的计算代替图的遍历和搜索来预测三元组的存在,由于向量的表示已经包含了实体原有的语义信息,计算含有⼀定的推理能⼒。

可应⽤于链接预测,基于路径的多度查询等

4、基于概率逻辑的方法

概率逻辑学习有时也叫Relational Machine Learning (RML),关注关系的不确定性和复杂性。
通常使用
Bayesian networks or Markov networks

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/397355.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

设计模式四:适配器模式

1、适配器模式的理解 适配器模式可以理解为有两个现成的类Adaptee和Target,它们两个是不能动的,要求必须使用B这个类来实现一个功能,但是A的内容是能复用的,这个时候我们需要编写一个转换器 适配器模式 Adaptee:被适…

Java Web(一)--介绍

Java Web 技术体系图 三大组成部分: 前端: 前端开发技术工具包括三要素:HTML、CSS 和 JavaScript;其他高级的前端框架,如bootstrap、jquery,VUE 等。 后端: 后端开发技术工具主要有&am…

剑指offer刷题笔记-链表

少年何妨梦摘星 敢挽桑弓射玉衡 解决与链表相关的问题总是有大量的指针操作,而指针操作的代码总是容易出错的。很多面试官喜欢出与链表相关的问题,就是想通过指针操作来考察应聘者的编码功底。 题目链接来自于 AcWing 、Leetcode(LCR&#xf…

燃气企业须知 :智慧燃气信息化管理平台的作用 ?

关键词:智慧燃气、燃气信息化、智慧燃气平台、智慧燃气建设、智慧燃气解决方案 智慧燃气信息化管理平台通过城市输气管网作为主要基础,各个终端用户进行协调,依托信息化数据进行管理,从而让整个工作环节流程达到高效智能优势。通…

【LeetCode】树的BFS(层序遍历)精选6题

目录 1. N 叉树的层序遍历(中等) 2. 二叉树的锯齿形层序遍历(中等) 3. 二叉树的最大宽度(中等) 4. 在每个树行中找最大值(中等) 5. 找树左下角的值(中等&#xff09…

leetcode(动态规划)53.最大子数组和(C++详细解释)DAY12

文章目录 1.题目示例提示 2.解答思路3.实现代码结果 4.总结 1.题目 给你一个整数数组 nums ,请你找出一个具有最大和的连续子数组(子数组最少包含一个元素),返回其最大和。 子数组 是数组中的一个连续部分。 示例 提示 2.解答思…

数论 - 博弈论(Nim游戏)

文章目录 前言一、Nim游戏1.题目描述输入格式输出格式数据范围输入样例:输出样例: 2.算法 二、台阶-Nim游戏1.题目描述输入格式输出格式数据范围输入样例:输出样例: 2.算法 三、集合-Nim游戏1.题目描述输入格式输出格式数据范围输…

vue使用Nprogress进度条功能实现

下图中的这种顶部进度条是非常常见的,在vue项目中有对应的插件:Nprogress。 实现效果: csdn也在使用: 或者这样自己使用 1、安装 NProgress可以通过npm安装。 npm install --save nprogress 注意此处的--save等同于-s,就是将…

echats 时间直方图示例

需求背景 某订单有N个定时任务,每个任务的执行时间已经确定,希望直观的查看该订单的任务执行趋势 查询SQL: select UNIX_TIMESTAMP(DATE_FORMAT(exec_time,%Y-%m-%d %H:%i)) execTime, count(*) from order_detail_task where order_no 2…

【C++】vector模拟实现+迭代器失效

vector模拟实现 成员变量定义默认成员函数构造函数 迭代器范围for、对象类型匹配原则 容量操作sizeemptycapacityreserve成员变量未更新memcpy值拷贝 resize内置类型的构造函数 数据访问frontbackoperator[ ] 数据修改操作push_backpop_backswapclearinsertpos位置未更新无返回…

el-button 选择与非选择按钮批量处理

el-button 选择与非选择按钮批量处理 <el-button v-for"(voyage,i) in data[voyages][nowVoyage]":key"i"class"c-work-bts"type"primary":plain"nowWorkSpace!i"click"chooseWorkSpace(i)"size"small&qu…

C#快速配置NLog日志使用

首先我们需要在Nuget中安装Nlog和Nlog-Schema。 添加配置文件&#xff1a;NLog.config <?xml version"1.0" encoding"utf-8" ?> <nlog xmlns"http://www.nlog-project.org/schemas/NLog.xsd"xmlns:xsi"http://www.w3.org/2001…

CSS弹性布局

CSS弹性布局 一、概念 ​ 弹性盒子是 CSS3 的一种新的布局模式。 ​ CSS3 弹性盒&#xff08; Flexible Box 或 flexbox&#xff09;&#xff0c;是一种当页面需要适应不同的屏幕大小以及设备类型时确保元素拥有恰当的行为的布局方式。 ​ 引入弹性盒布局模型的目的是提供一…

山西电力市场日前价格预测【2024-02-21】

日前价格预测 预测说明&#xff1a; 如上图所示&#xff0c;预测明日&#xff08;2024-02-21&#xff09;山西电力市场全天平均日前电价为470.29元/MWh。其中&#xff0c;最高日前电价为654.81元/MWh&#xff0c;预计出现在18:45。最低日前电价为355.63元/MWh&#xff0c;预计…

将Windows的系统日志自动收集并且转发到syslog服务器,百试百灵

将windows的系统日志自动收集并且转发到syslog服务器&#xff0c;百试百灵* **使用*Evtsys工具&#xff0c;他会自动收集windows系统日志&#xff0c;然后发送到syslog服务器&#xff0c;并且不乱码 下载链接&#xff1a;百度云永久链接 链接&#xff1a;https://pan.baidu.co…

D9741——用于也收路像机和笔记本电的等设备上的直流转换器。在便携式的仪器设备上。低电压输入时误操作保护电路, 定时闩锁、短路保护电路等功能

D9741是一块脉宽调制方三用于也收路像机和笔记本电的等设备上的直流转换器。在便携式的仪器设备上。 主要特点: 高精度基准电路 定时门锁、短路保护电路 低电压输入时误操作保护电路 输出基准电压(2.5V 超过工作范围能进行自动校正 封装形式: SOP16 应用: 电视摄像机 笔记本电…

5个顶级开源法学硕士大型语言模型 (LLM)

5个顶级开源法学硕士大型语言模型 (LLM)。 在快速发展的人工智能 (AI) 世界中&#xff0c;大型语言模型 (LLM) 已成为推动创新并重塑我们与技术交互方式的基石。 随着这些模型变得越来越复杂&#xff0c;人们越来越重视对它们的访问的民主化。 尤其是开源模型&#xff0c;在这…

算法面试八股文『 模型详解篇 』

说在前面 这是本系列的第二篇博客&#xff0c;主要是整理了一些经典模型的原理和结构&#xff0c;面试有时候也会问到这些模型的细节&#xff0c;因此都是需要十分熟悉的。光看原理还不够&#xff0c;最好是能用代码试着复现&#xff0c;可以看看李沐老师深度学习的教材&#…

线程池:优化多线程管理的利器

引言 同步和异步想必各位都有了解&#xff0c;同步简单来说就是一件事做完再去做下一件&#xff1b;异步则是不用等一件事做完&#xff0c;就可以去做另一件事&#xff0c;当一件事完成后可以收到对应的通知&#xff1b;异步一般应用于一些耗时较长的操作&#xff0c;比如大型…

量子计算:数据安全难题

当今数字技术面临的最大挑战之一是安全系统和数据。为此&#xff0c;人们设计了复杂的算法来加密数据并通过称为对称加密的框架来保护数据。虽然这已被证明是成功的&#xff0c;但量子计算的进步&#xff08;利用量子力学比传统计算机更快地解决复杂问题&#xff09;可能会彻底…