一、什么是数据库?
数据库(Database)是按照数据结构来组织、存储和管理数据的仓库。
每个数据库都有一个或多个不同的 API 用于创建,访问,管理,搜索和复制所保存的数据。
我们也可以将数据存储在文件中,但是在文件中读写数据速度相对较慢。
所以,现在我们使用关系型数据库管理系统(RDBMS)来存储和管理大数据量。所谓的关系型数据库,是建立在关系模型基础上的数据库,借助于集合代数等数学概念和方法来处理数据库中的数据。
RDBMS 即关系数据库管理系统(Relational Database Management System)的特点:
- 1.数据以表格的形式出现
- 2.每行为各种记录名称
- 3.每列为记录名称所对应的数据域
- 4.许多的行和列组成一张表单
- 5.若干的表单组成database
二、RDBMS 术语
在我们开始学习MySQL 数据库前,让我们先了解下RDBMS的一些术语:
- 数据库: 数据库是一些关联表的集合。
- 数据表: 表是数据的矩阵。在一个数据库中的表看起来像一个简单的电子表格。
- 列: 一列(数据元素) 包含了相同类型的数据, 例如邮政编码的数据。
- 行:一行(元组,或记录)是一组相关的数据,例如一条用户订阅的数据。
- 冗余:存储两倍数据,冗余降低了性能,但提高了数据的安全性。
- 主键:主键是唯一的。一个数据表中只能包含一个主键。你可以使用主键来查询数据。
- 外键:外键用于关联两个表。
- 复合键:复合键(组合键)将多个列作为一个索引键,一般用于复合索引。
- 索引:使用索引可快速访问数据库表中的特定信息。索引是对数据库表中一列或多列的值进行排序的一种结构。类似于书籍的目录。
- 参照完整性: 参照的完整性要求关系中不允许引用不存在的实体。与实体完整性是关系模型必须满足的完整性约束条件,目的是保证数据的一致性。
MySQL 为关系型数据库(Relational Database Management System), 这种所谓的"关系型"可以理解为"表格"的概念, 一个关系型数据库由一个或数个表格组成,
- 列(col): 具有相同数据类型的数据的集合;
- 行(row): 每一行用来描述某条记录的具体信息;
- 值(value): 行的具体信息, 每个值必须与该列的数据类型相同;
- 键(key): 键的值在当前列中具有唯一性。
三、基础概念
[1] 关系模式 对关系的逻辑结构和特征的描述。
[2] 关系代数 以关系作为运算对象的代数系统。在数据库中用代数运算来定义关系查询的一种形式化语言。
[3] 数据冗余 同一或同一批数据在同一存储设备或同一系统中多处出现,容易造成数据变更时的不一致。
[4] 元组 与关系对应的二维表中的行。相当于数据文件中的记录。
[5] 第二范式 每一个非主属性完全函数依赖于键的关系模式。
[6] 第一范式 每个属性均不能再分解的关系模式。它是关系模式最基本的规范形式。
[7] 主属性 在关系中能够唯一地标识一个元组的属性组中的诸属性。
[8] 函数依赖 如果一部分属性的值由另外一部分属性的值决定,则称该部分属性函数依赖于另一部分属性。例如基本工资额函数依赖于工资级别。
[9] 第三范式 每一个非主属性既不存在对键的部分函数依赖也不存在对键的传递函数依赖的关系模式。
[10] BC范式 每一个函数依赖的决定因素中均含有键的关系模式。
[11] 数据库设计 对于一个给定的应用环境,构造最优的数据库模式。建立数据库及其应用系统,使之能够有效地存储和管理数据满足各种用户的应用需求。
[12] 关系演算 以一阶谓词演算为基础定义的一种抽象的关系查询语言。
四、函数依赖
在数据库设计和规范化中,函数依赖是一个核心概念。它用于描述关系模式(即表结构)中属性之间的依赖关系,帮助我们理解数据的完整性和冗余性,从而指导我们如何优化数据库设计。
1.函数依赖的基本定义
假设有一个关系模式 R
,其中包含一组属性集合 U
。如果对于 R
的所有可能的关系实例,只要两个元组在属性集 X
上的值相同,那么它们在属性集 Y
上的值也必然相同,我们就说 X
函数决定 Y
,记作 X -> Y
。这里,X
是决定因子,Y
是被决定的属性或属性集。
例如,在一个学生信息表中,如果有属性 StudentID
、Name
和 Major
,我们可以有函数依赖 StudentID -> Name
和 StudentID -> Major
,因为每个学生的学号决定了其名字和专业。
2.函数依赖的类型
-
平凡函数依赖:如果
Y
是X
的子集,则X -> Y
称为平凡函数依赖。 -
非平凡函数依赖:如果
Y
不是X
的子集,则X -> Y
秢为非平凡函数依赖。 -
部分函数依赖:如果
X -> Y
,但存在X
的真子集Z
使得Z -> Y
,则称Y
对X
部分函数依赖。 -
完全函数依赖:如果
X -> Y
,且不存在X
的真子集Z
使得Z -> Y
,则称Y
对X
完全函数依赖。
3.函数依赖的性质
-
自反律:如果
Y
是X
的子集,则X -> Y
成立。 -
增广律:如果
X -> Y
,则对于任何属性集Z
,都有XZ -> YZ
。 -
传递律:如果
X -> Y
且Y -> Z
,则X -> Z
。
函数依赖是数据库规范化理论的基础,通过理解和应用这些规则,可以消除数据冗余,提高数据的一致性和完整性,从而构建更高效、更可靠的数据库系统。
五、自然连接
自然连接(Natural Join)是一种特殊的数据库操作,主要用于合并两个具有公共属性的关系(表)。它是SQL中最常见的连接类型之一,特别适用于当两个表在某些列上拥有相同的属性名时进行数据整合。
1.自然连接的特点:
-
自动匹配列名:自然连接会自动识别两个表之间同名的列,并基于这些列进行连接。如果两个表没有共同的列,自然连接的结果将为空。
-
内连接类型:自然连接本质上是一种内连接(INNER JOIN),意味着只有当两个表中的记录在共同列上有匹配时,才会出现在结果集中。不匹配的记录会被排除。
-
隐式条件:与使用显式ON子句的JOIN不同,自然连接不需要指定连接条件,因为它会默认使用所有同名的列作为连接键。
2.SQL语法示例:
假设有两个表 Employees
和 Departments
,它们都有一个名为 DepartmentID
的列。执行自然连接如下:
Sql
SELECT *
FROM Employees
NATURAL JOIN Departments;
这将返回一个新的表,其中包含了 Employees
和 Departments
表中 DepartmentID
相匹配的所有记录。结果集中的每一行都表示一个员工及其所在部门的信息。
3.注意事项:
-
在使用自然连接时,应确保两个表中的同名列具有相同的含义和数据类型,否则可能会导致错误或意外的结果。
-
如果两个表中有多个同名列,自然连接会基于所有同名列进行匹配,这可能不是预期的行为。在需要精确控制连接条件的情况下,使用显式的INNER JOIN语句并指定ON子句通常更为合适。
自然连接简化了查询编写过程,特别是在处理具有明显共享属性的表时,但它也可能引入复杂性和不确定性,尤其是在大型数据库系统中。因此,根据具体场景选择合适的连接类型非常重要。
六、引用关系
引用关系(Referential Relationship)在数据库设计中,尤其是关系型数据库中,指的是实体之间的一种联系,它确保了数据的完整性和一致性。这种关系通常是通过外键约束实现的,外键链接一个表的数据到另一个表的主键,从而建立起表与表之间的关联。
1.主要组成部分:
-
主键(Primary Key):在关系型数据库中,每个表至少有一个主键,它唯一标识表中的每一条记录。主键可以由一个或多个字段组成,确保数据行的唯一性。
-
外键(Foreign Key):外键是参照另一个表主键的一个或多个字段,用于建立两个表之间的链接。通过外键,一个表(子表)的某条记录可以指向另一个表(父表)中的某条记录。
2.引用关系的作用:
-
数据完整性:引用关系确保了数据库中数据的一致性和完整性。例如,如果一个表中的记录被删除,那么所有引用该记录的其他表中的相关记录要么也被删除(级联删除),要么保持不变(限制删除)以避免出现孤儿记录。
-
导航和查询:引用关系允许从一个表的数据轻松导航到另一个表的相关数据,这对于复杂的查询和报告非常有用。
3.实现引用关系:
在创建数据库表时,可以通过定义外键约束来实现引用关系。例如,在SQL中,可以这样定义:
Sql
CREATE TABLE Orders (
OrderID int PRIMARY KEY,
CustomerID int,
OrderDate date,
FOREIGN KEY (CustomerID) REFERENCES Customers(CustomerID)
);
在这个例子中,Orders
表的 CustomerID
字段是一个外键,它引用了 Customers
表的主键 CustomerID
。这意味着 Orders
表中的每一个 CustomerID
值必须在 Customers
表中找到对应的值。
引用关系是关系型数据库设计的核心原则之一,它有助于维护数据的逻辑结构和业务规则,确保数据在不同表之间的一致性和相关性。
七、MySQL数据库
MySQL 是一个关系型数据库管理系统,由瑞典 MySQL AB 公司开发,目前属于 Oracle 公司。MySQL 是一种关联数据库管理系统,关联数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。
- MySQL 是开源的,目前隶属于 Oracle 旗下产品。
- MySQL 支持大型的数据库。可以处理拥有上千万条记录的大型数据库。
- MySQL 使用标准的 SQL 数据语言形式。
- MySQL 可以运行于多个系统上,并且支持多种语言。这些编程语言包括 C、C++、Python、Java、Perl、PHP、Eiffel、Ruby 和 Tcl 等。
- MySQL 对 PHP 有很好的支持,PHP 是很适合用于 Web 程序开发。
- MySQL 支持大型数据库,支持 5000 万条记录的数据仓库,32 位系统表文件最大可支持 4GB,64 位系统支持最大的表文件为8TB。
- MySQL 是可以定制的,采用了 GPL 协议,你可以修改源码来开发自己的 MySQL 系统