文章目录
- 知识表示
- 知识表示研究
- 符号表示方法
- 向量表示方法
知识表示
简单而言,知识表示(KR)就是用易于计算机处理的方式来描述人脑的知识的方法。KR不是数据格式、不等同于数据结构、也不是编程语言,对于人工智能而言,数据与知识的区别在于KR支持推理。
知识的符号表示:一阶谓词逻辑 (First-Order Logic),语义网络 (Semantic Net),产生式规则 (Production Rule)、框架系统 (Framework)、描述逻辑(Description Logic)、逻辑程序 (Logic Programming)。
从符号表示到向量表示:基于离散符号的知识表示:显式知识、强逻辑约束、易于解释、推理不易扩展;基于连续向量的知识表示:隐式知识、弱逻辑约束、不易解释、对接神经网络。
智能的精华是怎样实现推理,推理的关键是形式化逻辑。“学习”需要我们清楚的知道要学习的是什么,那些认为任何东西都可以学习出来的想法是愚蠢的。大脑中并没有符号和图像的存储,而是一些Big Activity Vectors之间相互发生作用。
知识表示研究
描述逻辑是一阶谓词逻辑的可判定子集,主要用于描述本体概念和属性,对于本体知识库的构建提供了便捷的表达形式,是与知识图谱最密切相关的知识表示方法之一。核心表达要素:概念Concepts—解释为一个领域的子集,例如:学生,已婚者:{x| Student(x) },{x| Married(x) } ;关系Relations—解释为指该领域上的二元关系,例如:示例:朋友,爱人:{< x,y > | friend(x,y) } ,{< x,y > | loves(x,y) } ;个体Individuals—一个领域内的实例,例如:小明,小红:{Ming, Hong} 。
描述逻辑的知识库O:=< T,A >,T即Tbox,A即Abox。TBox包含内涵知识,描述概念的一般性质,定义: 引入概念以及关系的名称,例如:Mother, Person, has_child;包含:声明包含关系的公理,例如:Mother ⊑ ∃ has_child.Person;ABox包含外延知识 (又称断言知识),描述论域中的特定个体。概念断言—表示一个对象是否属于某个概念,例如:Mother(Helen),关系断言—表示两个对象是否满足一定的关系,例如:has_child(Helen, Jack)。
Horn Logic是一阶谓词逻辑的子集,主要特点是表达形式简单,复杂度低。著名的Prolog语言就是基于Horn逻辑设计实现的。核心表达要素:原子Atoms,p(t1, t2 ..., tn),p 是谓词,ti 是项(变量或者常量),例子:has_child(X, Y);规则Rules,由原子构建: H:B1, B2, ..., Bm。H称为Head;B1, B2, ..., Bm称为Body,例子:has_child(X, Y) 、has_son(X, Y);事实Facts:没有体部且没有变量的规则,例子:has_son(Helen, Jack)
一阶谓词逻辑优缺点比较,优点:接近自然语言,容易被接受,且易于表示精确知识,有严格的形式定义和推理规则,易于精确实现。缺点:无法表示不确定性知识,难以表示启发性知识及元知识;组合爆炸,经常出现事实、规则等的组合爆炸,导致效率低,推理复杂度通常较高;是以人的逻辑为主导的表示方式,可能并不适合机器,机器可能有自己的逻辑表示。
产生式系统是一种更广泛意义的规则系统,专家系统多数是基于产生式系统:Feigenbaum研制的化学分子结构专家系统DENDRAL;Shortliffe研制的的诊断感染性疾病的专家系统MYCIN。产生式系统的核心表达形式:IF P THEN Q CF = [0, 1],其中P是产生式的前提,Q是一组结论或操作,CF (Certainty Factor)为确定性因子,也称置信度。
产生式系统的优缺点,优点:自然性:产生式系统采用人类常用的因果关系知识表示形式,既直观、自然,又便于进行推理。模块性:产生式规则形式相同,易于模块化管理。有效性:能表示确定性知识、不确定性知识、启发性知识、过程性知识等。清晰性:产生式有固定的格式,既便于规则设计,又易于对规则库中的知识进行一致性、完整性检测。缺点:效率不高:产生式系统求解问题的过程是一个反复进行“匹配—冲突消解—执行”的过程。而规则库一般都比较大,匹配又十分费时,因此其工作效率不高。 在求解复杂问题时容易引起组合爆炸。不能表达结构性知识:产生式系统对具有结构关系的知识无能为力,它不能把具有结构关系的事物间的区别与联系表示出来。
Frame System:框架系统,框架理论的基本思想:认为人们对现实世界中事物的认识都是以一种类似于框架的结构存储在记忆中。当面临一个新事物时,就从记忆中找出一个合适的框架,并根据实际情况对其细节加以修改、补充,从而形成对当前事物的认识。框架系统在很多NLP任务如Dialogue系统中都有广泛的应用。基本表达要素:框架:是一种描述对象 (事物、事件或概念等)属性的数据结构。一个框架由若干个“槽” (Slot)结构组成,每个槽又可分为若干个 “侧面”。一个槽:用于描述所论对象某一方面的属性;一个侧面:用于描述相应属性的一个方面。槽和侧面所具有的属性值分别称为槽值和侧面值。
框架系统优缺点,优点:对于知识的描述完整和全面;基于框架的知识库质量高;框架允许数值计算。缺点:框架构建成本高,质量要求高;框架的表达形式不灵活,很难同其它形式的数据集相互关联使用。
语义网络 (Semantic Network),1968年J.R.Quillian在其博士论文中最先提出语义网络,把它作为人类联想记忆的一个显式心理学模型,并在他设计的可教式语言理解器TLC (Teachable Language Comprehenden)中用作知识表示方法。
语义网络 (Semantic Network)——WordNet,WordNet是最著名的词典知识库,主要用于词义消歧。WordNet由普林斯顿大学认识科学实验室从1985年开始开发。WordNet主要定义了名词、动词、形容词和副词之间的语义关系。例如名词之间的上下位关系(如:“猫科动物”是“猫”的上位词),动词之间的蕴含关系(如:“打鼾”蕴含着“睡眠”)等。WordNet3.0已经包含超过15万个词和20万个语义关系。
语义网络的优缺点,优点:结构性:语义网络是一种结构化的知识表示方法,它能把事物的属性以及事物间的各种语义联想显 式地表示出来。联想性:最初是作为人类联想记忆模型提出来的。自然性:直观地把事物的属性及其语义联系表示出来,便于理解,自然语言与语义网络的转换比较容易实现,故语义网络表示法在自然语言理解系统中应用最为广泛。缺点:非严格性:语义网络没有公认的形式表示体系。一个给定的语义网络所表达的含义完全依赖于处理程序如何对它进行解释。通过推理网络而实现的推理不能保证其正确性。支持全称量词和存在量词的语义网络在逻辑上是不充分的,不能保证不存在二义性。处理上的复杂性:语义网络表示知识的手段多种多样,灵活性高,但由于表示形式不一致使得处理复杂性高,对知识的检索相对复杂。
知识表示与推理在人工智能的发展历史上一直居于核心位置。传统的知识表示方法主要以符号表示为主,与知识图谱有关的典型方法有:描述逻辑、Horn Logic、产生式规则、框架系统、语义网络等等。这些方法各有优缺点,但都有一个共同的缺点是知识的获取过程主要依靠专家和人工,越复杂的知识表示框架知识获取过程越困难。
符号表示方法
属性图是图数据库Neo4J实现的图结构表示模型,在工业界有广泛应用。属性图的优点是表达方式非常灵活,例如,它允许为边增加属性,非常便于表示多元关系。属性图的存储充分利用图的结构进行优化,因而在查询计算方面具有较高优势。属性图的缺点是缺乏工业标准规范的支持,由于不关注更深层的语义表达,也不支持符号逻辑推理。
在属性图的术语中,属性图是由 顶点(Vertex), 边(Edge),标签(Label),关系类型还有属性(Property)组成的有向图。顶点也称为 节点(Node),边也称为 关系(Relationship)。在属性图中,节点和关系是最重要的实体。节点上包含属性,属性可以以任何键值形式存在。
关系连接节点,每个关系都有拥有一个方向、一个标签、一个开始节点和结束节点。关系的方向的标签使得属性图具有语义化特征。和节点一样,关系也可以有属性,即边属性,可以通过在关系上增加属性给图算法提供有关边的元信息,如创建时间等,此外还可以通过边属性为边增加权重和特性等其他额外语义。
哲学中的本体论:本体论是对存在、成为、存在或现实的本质以及基本存在的类别及其关系--韦氏。计算机科学与人工智能中的本体论:本体是对概念和关系的描述(如程序的形式规范),可以正式为代理或代理社区而存在--Tom Gruber,Siri 创始人。Web 本体:基于 RDFS/OWL 等 Web 标准的本体。OWL是基于描述逻辑的,这是一个非常非常长的历史人工智能研究。
OWL的表达构件:
每一种子语言是前述语义表达构件的一类集合,并有相应的复杂度分析。
属性图是工业界最常见的图谱建模方法,属性图数据库充分利用图结构特点做了性能优化,实用度高,但不支持符号推理。RDF是W3C推动的语义数据交换标准与规范,有更严格的语义逻辑基础,支持推理,并兼容更复杂的本体表示语言OWL。在三元组无法满足语义表示需要时,OWL作为一种完备的本体语言,提供了更多可供选用的语义表达构件。描述逻辑可以为知识图谱的表示与建模提供理论基础。描述逻辑之于知识图谱,好比关系代数之于关系数据库。
向量表示方法
词的向量表示:
词是符号化的,词的语义由它被使用的上下文确定。
Word Embedding/词嵌入= Word Vectors/词向量= Distributed Representations/词的分布式表示
词嵌入到知识图谱嵌入:
知识图谱嵌入模型:
负样本的构造:随机替换h或t
推理问题包括:测试三元组( h, r, t );尾实体预测( h, r, ? );头实体预测( ?, r, t )
知识表示是传统符号人工智能研究的核心,知识表示的方法在早期语义网的发展过程主要用来为知识图谱的概念建模提供理论基础;现实的知识图谱项目由于规模化构建的需要,常常降低表示的逻辑严格性,目前较为常见的知识图谱实践包括RDF图模型和属性图模型;尽管很多知识图谱并没有应用复杂的知识表示框架,Schema工程对于知识图谱的构建仍然是基础性和必要性的工作,高质量的知识图谱构建通常从Schema设计开始。在知识图谱的深度利用中,如复杂语义的表达、规则引擎的构建、推理的实现,会对更有丰富表达能力的知识表示方法有更多的需求。图模型是更加接近于人脑认知和自然语言的数据模型,RDF作为一种知识图谱表示框架的参考标准,向上对接OWL等更丰富的语义表示和推理能力,向下对接简化后的属 性图数据库以及图计算引擎,仍然是最值得重视的知识图谱表示框架。知识(图谱)的表示学习是符号表示与神经网络相结合比较自然且有前景的方向。知识的向量表示有利于刻画那些隐含不明确的知识,同时基于神经网络和表示学习实现的推理一定程度上可以解决传统符号推理所面临的鲁棒性不高不容易扩展等众多问题。