数据:描述事务的符号记录。
数据库(DB):按一定的数据模型组织,描述和存储在计算机内的,有组织的,可共享的数据集合。
数据库管理系统(DBMS):位于用户和操作系统之间的一层数据管理软件。主要功能包括:
数据定义功能:DBMS提供DDL,用户通过它定义数据对象。
数据操纵功能:DBMS提供DML,用户通过它实现对数据库的查询,插入,删除和修改等操作。
数据库的运行管理:DBMS对数据库的建立,运行和维护进行统一管理,统一控制,以保证数据的安全性,完整性,并发控制及故障恢复。
数据库的建立和维护功能:数据库初始数据的输入,转换,数据库的转储,恢复,重新组织及性能监视与分析等。
数据库系统(DBS):计算机中引入数据库后的系统,包括:数据库DB,数据库管理系统DBMS,应用系统,数据库管理员DBA和用户
数据管理与数据处理
数据管理:对数据收集,整理,组织,存储,(对象) 维护,检索,传送,(操作)等,目标:在妥当的时候以妥当的形式给妥当的人提供妥当的数据。
数据处理:对数据进行加工,计算,提炼,从而产生新的有效数据的过程(数据--》信息)
管理与处理的关系:管理是处理的基础,处理为管理服务
数据管理的发展阶段
人工管理阶段(50年代中期以前)
文件系统阶段(50年代中期至60年代后期)
数据库系统阶段(60年代后期以后)
数据模型
数据处理的抽象过程:现实世界--抽象》信息世界--转换》机器世界(数据世界)
概念模型(信息模型):把现实世界中的客观对象抽象成的某种信息结构,主要用于数据库设计。
实体与记录
信息世界
实体:客观存在并可相互区分的事务。
实体集:性质相同的同类实体的集合。
属性:实体具有的某一特性。
实体标识符:能将一个实体与其他实体区分开来的一个或一组属性。
数据世界
记录:实体(抽象表示)
文件:实体集
字段或数据项:属性
关键字:实体标识符。唯一地标识一个记录。又称码,键。
型与值
在DBS中,每一个对象广义上讲都有型与值之分:
型是对象的结构或特性描述。
值是一个具体的对象实例。
类似于程序实际语言中数据类型与数据值的概念。
实体间的联系
实体内部的联系:反应在数据上就是记录内部数据项间的联系(1对1,1对多,多对多)
实体之间的联系:反应在数据上就是记录之间的联系
数据模型
是对现实世界进行抽象的工具,它按计算机系统的观点对数据建模,用于提供数据库系统中信息表示和操作手段的形式框架,主要用于DBMS的实现,是数据库系统的核心和基础。
常用的数据模型:层次模型,网状模型,关系模型,面向对象模型
数据模型的三要素:数据结构(静态)--》如何表示实体及联系,数据操作(动态)--》如何实现增删改查,完整性约束--》如何保证数据的约束条件得到满足
层次模型:用树形结构来表示实体以及实体间联系的模型。
网状模型
关系模型
DBS的结构
DBS的三级模式结构
模式:又称逻辑模式,DB的全局逻辑结构,即DB中全体数据的逻辑结构和特征的描述。模式定义的任务:定义全局逻辑结构(构成记录的属性名,类型,宽度等)。定义有关的安全性,完整性要求,定义记录间的联系。
外模式:又称子模式或用户模式,DB的局部逻辑结构,即与某一应用有关的数据的一个逻辑表示。
说明:外模式是某个用户的数据视图,模式是所有用户的公共数据视图,一个DB只能有一个模式,但可以有多个外模式。外模式通常实模式的子集,但可以在结构,类型,长度等方面有差异。DBS提供外模式DDL。
内模式:又称存储模式。数据的物理结构和存储方式的描述,即DB中数据的内部表示方式。一个数据库只有一个内模式,内模式定义的任务:记录存储格式,索引组织方式,数据是否压缩,是否加密等。
两级映像及其作用
模式变,可修改映象使外模式保持不变,从而应用程序不必修改,保证了程序和数据的逻辑独立性。
存储结构变,可修改映象使逻辑结构(模式)保持不变,从而应用程序不必修改,保证了数据与程序的物理独立性。
数据库系统的组成
数据库:一个或多个数据库,四要素:用户数据,元数据,索引,应用元数据
软件:操作系统,数据库管理系统(DBMS),数据库应用开发工具等辅助软件,具有数据库接口的高级语言与编译系统,如C,C++等,某个数据库应用系统
人员:用户(使用),应用程序员(开发),数据库管理员DBA(管理)
硬件:计算机有关设备。
数据库系统研究的对象:三个主要研究领域:DBMS及其辅助软件,数据库设计,数据库理论
关系数据库
关系数据库是应用数学方法来处理数据的,它具有结构简单,理论基础坚实,数据独立性高以及提供非过程性语言等优点。
关系的数学定义
域:值的集合。它们具有相同的数据类型,语义上通常指某一对象的取值范围。
笛卡尔积:没有任何条件的关联
关系
关系模型
三部分:关系数据结构,关系操作集合,关系的完整性
数据结构
单一的数据结构
关系模式
关系的三种形式:
基本关系:客观存在的基本表
查询表:由基本表按一定条件检索得到的结果
试图:从一个或多个基本关系上导出的关系。它不对应实际的存储数据,是一个虚关系,然而可永久存在,相当于关系模型的外模式。
关系操作
种类:选择,投影,连接,除,并,交,差,(查询操作)增加,删除,修改(维护操作)
关系模型的三类完整性
实体完整性,参照完整性,用户定义的完整性,
关系数据库标准语言--SQL
数据查询():SELECT
数据定义(DDL):CREATE,DROP,ALTER
数据操纵:INSERT,DELETE,UPDATE
数据控制:GRANT,REVOKE
关系系统及其查询优化
全关系系统准则:信息准则,保证访问准则,空值的系统化处理,基于关系模型的动态的联机数据字典,统一的数据子语言准则,试图更新准则,高级的插入修改删除操作,数据物理独立性,数据逻辑独立性,数据完整性的独立性,分布独立性,无破坏准则。
优化的一般策略:
选择,投影运算应尽可能先做,好处是减少下一步运算的数据量
选择和投影运算同时进行,好处是扫描关系的次数
在执行连接前对文件适当 的预处理
把投影同起前或其后的双目运算结合起来
把某些选择和笛卡尔积乘积结合起来成为连接运算
找出公共子表达式