目录
- 1 数据库约束
- 1.1 NOT NULL 约束
- 1.2 UNIQUE 约束
- 1.3 DEFAULT 约束
- 1.4 PRIMARY KEY 约束
- 1.5 FOREIGN KEY 约束
- 1.6 CHECK 约束
- 2 表的关系
- 2.1 三大范式
- 2.2 表的设计
- 2.2.1 一对一 (1:1)
- 2.2.2 一对多 (1:n)
- 2.2.3 多对多 (m:n)
- 3 进阶版CRUD操作
- 3.1 新增(Create)
- 3.2 查询(Retrieve)
- 3.2.1 聚合查询
- 3.2.1.1 聚合函数
- 3.2.1.1.1 COUNT函数
- 3.2.1.1.2 SUM函数
- 3.2.1.1.3 AVG函数
- 3.2.1.1.4 MAX函数
- 3.2.1.1.5 MIN函数
- 3.2.1.2 GROUP BY子句
- 3.2.1.3 HAVING子句
- 3.2.2 联合查询
- 3.2.2.1 内连接
- 3.2.2.2 外连接
- 3.2.2.3 自连接
- 3.2.2.4 子查询
- 3.2.2.4.1 单行子查询
- 3.2.2.4.2 多行子查询
- 3.2.2.4.3 from子句中使用子查询
- 3.2.2.5 合并查询
1 数据库约束
数据库的约束主要针对的是表中的字段。
约束类型:
- NOT NULL: 指示某列不能存储 NULL 值。
- UNIQUE: 保证某列的每行必须有唯一的值。
- DEFAULT: 规定没有给列赋值时的默认值。
- PRIMARY KEY: NOT NULL 和 UNIQUE 的结合。确保某列(或两个列多个列的结合)有唯一标识,有助于更容易更快速地找到表中的一个特定的记录。
- FOREIGN KEY: 保证一个表中的数据匹配另一个表中的值的参照完整性。
- CHECK: 保证列中的值符合指定的条件。对于MySQL数据库,对CHECK子句进行分析,但是忽略CHECK子句。
1.1 NOT NULL 约束
示例: 创建表时,可以指定某列不为空:
-- 重新设置学生表结构
DROP TABLE IF EXISTS student;
CREATE TABLE student (
id INT NOT NULL,
sn INT,
name VARCHAR(20),
qq_mail VARCHAR(20)
)
1.2 UNIQUE 约束
UNIQUE约束叫做唯一约束,也就是不能重复的意思。
示例: 指定sn列为唯一的、不重复的:
-- 重新设置学生表结构
DROP TABLE IF EXISTS student;
CREATE TABLE student (
id INT NOT NULL,
sn INT UNIQUE,
name VARCHAR(20),
qq_mail VARCHAR(20)
);
1.3 DEFAULT 约束
DEFAULT约束叫做默认值约束。
示例: 指定插入数据时,name列为空,默认值unkown:
-- 重新设置学生表结构
DROP TABLE IF EXISTS student;
CREATE TABLE student (
id INT NOT NULL,
sn INT UNIQUE,
name VARCHAR(20) DEFAULT 'unkown',
qq_mail VARCHAR(20)
);
注意: 这里当我们insert into student (id,sn,name,qq_mail) values(1,101,NULL,'111@qq.com');
时,我们在表里所插入的内容为(1,101,NULL,111@qq.com),此时不能体现出我们的默认值。
那么到底怎么体现默认值呢?答案是:只有我们insert into student (id,sn,qq_mail) values(1,101,'111@qq.com');
这样写的时候,我们表里所插入的内容才为(1,101,unkown,111@qq.com),才能体现出默认值的存在。即只要不指定列,不给name任何值,包括NULL值,才能体现出默认值的存在。
1.4 PRIMARY KEY 约束
PRIMARY KEY约束叫做主键约束,它是 NOT NULL 和 UNIQUE 的结合。也就是说,当一个字段被PRIMARY KEY修饰后,那么这个字段就是不能为空且是独一无二的!
因为是独一无二的,所以对于整数类型的主键,一般搭配:自增长auto_increment使用。插入数据对应字段不给值时,使用最大值+1。
一个表当中包含两个主键,这句话是有瑕疵的。正确的说法是:一个表只有一个主键,但是这个主键可以是两个字段联合起来表示的,此时叫做联合主键。
示例: 指定id列为主键:
-- 重新设置学生表结构
DROP TABLE IF EXISTS student;
CREATE TABLE student (
id INT PRIMARY KEY auto_increment,
sn INT UNIQUE,
name VARCHAR(20) DEFAULT 'unkown',
qq_mail VARCHAR(20)
);
注意: 当创建好表之后,表中没有任何数据,当第一次执行插入的时候,当前主键,也就是id,会自动从1开始。即执行insert into student (sn,name,qq_mail) values(101,'feihan','111@qq.com');
这条语句之后,数据库中将成功插入(1,101,feihan,111@qq.com)这条数据。
但是当我将刚刚插入的数据删除之后,再次进行插入的时候,就会在原来的基础上,也就是上一次最后插入的语句的id上开始加1。也就是我们依次执行delete from student wher id=1;
和insert into student (sn,name,qq_mail) values(101,'feihan','111@qq.com');
这两条语句之后,成功插入的数据将是(2,101,feihan,111@qq.com)。
此时,只有你drop table if exists student;
把这个表整个删除以后,id才会重新从1开始!!!
同时需要记住alter可以修改字段的类型!即可以把字段从int类型修改为long类型等。
1.5 FOREIGN KEY 约束
FOREIGN KEY约束叫做外键约束,外键用于关联其他表的主键或唯一键。
语法: foreign key (字段名) references 主表(列)
示例:
- 创建班级表classes,id为主键:
-- 创建班级表,有使用MySQL关键字作为字段时,需要使用``来标识
DROPTABLE IF EXISTS classes;
CREATETABLE classes (
id INT PRIMARY KEY auto_increment,
name VARCHAR(20),
`desc` VARCHAR(100)
);
- 创建学生表student,一个学生对应一个班级,一个班级对应多个学生。使用id为主键,classes_id为外键,关联班级表id:
-- 重新设置学生表结构
DROPTABLE IF EXISTS student;
CREATETABLE student (
id INT PRIMARY KEY auto_increment,
sn INT UNIQUE,
name VARCHAR(20) DEFAULT 'unkown',
qq_mail VARCHAR(20),
classes_id int,
FOREIGN KEY (classes_id) REFERENCES classes(id)
--classes_id就是外键,关联的是classes这张表的id字段
);
注意: 现在我们有两张表,一张班级表,一张学生表。
- 建表的时候,先创建哪张表呢?
先创主表(班级表)! - 插入数据时,请问应该先插入哪个表?
先插入主表(班级表)! - 删除时,请问应该先删除哪个表的数据?
先删除子表(学生表)!
但是删除主表也是可以的,前提是主表当中的这个id没有被关联。如果被关联了,那么就会删除失败!!
所以这样做体现了:安全性!
1.6 CHECK 约束
示例: 约束插入sex字段时只能插入男或者女这两个字。
droptable if exists test_user;createtable test_user (
id int,
name varchar(20),
sex varchar(1),
check (sex ='男'or sex='女'));
注意: 当我们在MySQL中执行insert into test_user values(1,'feihan','哈');
这条语句时,按理来说应该插入失败报错,但你会发现,它竟然插入成功了!此时我们要记住,它在MySQL使用时不报错,忽略该约束;但在Oracle使用时会报错,忽略不了该约束!!!
2 表的关系
2.1 三大范式
范式是你在建表的时候的一些规则,即数据库设计时遵循的一种规范,不同的规范要求遵循不同的范式。具体可借助博客https://blog.csdn.net/ddzzz_/article/details/119277573进行具体的理解与学习。
在设计表的时候会有以下3种情况:
2.2 表的设计
在设计表的时候会有以下3种情况:
2.2.1 一对一 (1:1)
设计表格时就很简单,如下所示的一个二维表格:
name | 身份证号 |
---|---|
2.2.2 一对多 (1:n)
设计表格时就需要如下所示的两个表格:
- 班级表:
班级ID | 班级名称 |
---|---|
- 学生表:
学生ID | 学号 | 姓名 | 班级ID |
---|---|---|---|
注意: 多的那边存入1的这边的ID!
2.2.3 多对多 (m:n)
设计表格时就需要如下所示的三个表格:
- 学生表:
学生ID | 学号 | 姓名 |
---|---|---|
- 课程表:
课程ID | 课程名称 |
---|---|
- 学生课程中间表(因为不管在哪张表里面写了另一张表的ID都是不合适的,所以有了中间表的出现):
中间表ID | 学生ID | 课程ID |
---|---|---|
3 进阶版CRUD操作
3.1 新增(Create)
语法: INSERT INTO table_name [(column [, column ...])] SELECT ...
示例: 创建一张用户表,设计有name姓名、email邮箱、sex性别、mobile手机号字段。需要把已有的学生数据复制进来,可以复制的字段为name、qq_mail:
-- 创建用户表
DROPTABLE IF EXISTS test_user;
CREATETABLE test_user (
id INT primary key auto_increment,
name VARCHAR(20) comment '姓名',
age INT comment '年龄',
email VARCHAR(20) comment '邮箱',
sex varchar(1) comment '性别',
mobile varchar(20) comment '手机号'
);
-- 将学生表中的所有数据复制到用户表
insert into test_user(name, email) select name, qq_mail from student;
3.2 查询(Retrieve)
在了解数据库表进阶版的查询之前,我们需要先进行一些准备工作,即在选中的数据库中准备两张表和插入一些数据:
-- 创建一张学生表
DROP TABLE IF EXISTS student;
CREATE TABLE student (
id INT,
sn INT comment '学号',
name VARCHAR(20) comment '姓名',
qq_mail VARCHAR(20) comment 'QQ邮箱'
);
-- 创建考试成绩表
DROP TABLE IF EXISTS exam_result;
CREATE TABLE exam_result (
id INT,
name VARCHAR(20),
chinese DECIMAL(3,1),
math DECIMAL(3,1),
english DECIMAL(3,1)
);
--在exam_result表中插入一些数据
INSERT INTO exam_result (id,name, chinese, math, english) VALUES
(1,'唐三藏', 67, 98, 56),
(2,'孙悟空', 87.5, 78, 77),
(3,'猪悟能', 88, 98, 90),
(4,'曹孟德', 82, 84, 67),
(5,'刘玄德', 55.5, 85, 45),
(6,'孙权', 70, 73, 78.5),
(7,'宋公明', 75, 65, 30);
3.2.1 聚合查询
3.2.1.1 聚合函数
常见的统计总数、计算平局值等操作,可以使用聚合函数来实现,常见的聚合函数有:
函数 | 说明 |
---|---|
COUNT ([DISTINCT] expr) | 返回查询到的数据的数量 |
SUM ([DISTINCT] expr) | 返回查询到的数据的总和,不是数字没有意义 |
AVG ([DISTINCT] expr) | 返回查询到的数据的平均值,不是数字没有意义 |
MAX ([DISTINCT] expr) | 返回查询到的数据的最大值,不是数字没有意义 |
MIN ([DISTINCT] expr) | 返回查询到的数据的最小值,不是数字没有意义 |
注意: 在where后面,不能出现聚合函数!
3.2.1.1.1 COUNT函数
- 统计班级共有多少同学:
SELECT COUNT(*) FROM exam_result ;
或SELECT COUNT(任意数字) FROM exam_result ;
任意数字的意思是例如SELECT COUNT(0) FROM exam_result ;
或SELECT COUNT(1) FROM exam_result ;
等命令都可以实现此需求。 - 统计班级收集的 qq_mail 有多少个:
SELECT COUNT(qq_mail) FROM student;
注意:qq_mail 为 NULL 的数据不会计入结果! - 如果在exam_result表中再加入了和前面一模一样的数据: (1,‘唐三藏’, 67, 98, 56)。
执行SELECT COUNT(*) FROM exam_result ;
命令得到的结果将是8。
但我们要是执行SELECT COUNT(distinct id) FROM exam_result ;
命令得到的结果将是7,因为这里我们用distinct对计数的列进行了去重操作。
3.2.1.1.2 SUM函数
- 统计数学成绩总分:
SELECT SUM(math) FROM exam_result;
- 不及格 < 60 的总分,没有结果则返回 NULL:
SELECT SUM(math) FROM exam_result WHERE math < 60;
3.2.1.1.3 AVG函数
- 统计平均总分:
SELECT AVG(chinese + math + english) 平均总分 FROM exam_result;
3.2.1.1.4 MAX函数
- 返回英语最高分:
SELECT MAX(english) FROM exam_result;
3.2.1.1.5 MIN函数
- 返回 > 70 分以上的数学最低分:
SELECT MIN(math) FROM exam_result WHERE math > 70;
3.2.1.2 GROUP BY子句
SELECT 中使用 GROUP BY 子句可以对指定列进行分组查询。
需要满足:使用 GROUP BY 进行分组查询时,SELECT 指定的字段必须是“分组依据字段”,其他字段若想出现在SELECT 中则必须包含在聚合函数中。
语法: select column1, sum(column2), .. from table group by column1,column3;
示例: 在了解GROUP BY 子句之前,我们需要先进行一些准备工作,即在选中的数据库中准备一张表和插入一些数据:
--职员表,有id(主键)、name(姓名)、role(角色)、salary(薪水)
create table emp(
id int primary key auto_increment,
name varchar(20) not null,
role varchar(20) not null,
salary numeric(11,2)
);
insert into emp(name, role, salary) values
('马云','服务员', 1000.20),
('马化腾','游戏陪玩', 2000.99),
('孙悟空','游戏角色', 999.11),
('猪无能','游戏角色', 333.5),
('沙和尚','游戏角色', 700.33),
('隔壁老王','董事长', 12000.66);
查询每个角色的最高工资、最低工资和平均工资:
select role,max(salary),min(salary),avg(salary) from emp group by role;
注意: 执行的时候是先执行group by后面的语句,再执行前面的语句。
3.2.1.3 HAVING子句
GROUP BY 子句进行分组以后,需要对分组结果再进行条件过滤时,不能使用 WHERE 语句,而需要用HAVING。
示例: 显示平均工资低于1500的角色和它的平均工资:
select role,max(salary),min(salary),avg(salary) from emp group by role having avg(salary)<1500;
3.2.2 联合查询
- 什么是联合查询?
就是两张表或两张以上的表,进行连接查询。 - 为什么要联合查询?
因为我们所需要的数据不仅仅是来自于一张表的,它是来自多张表的,所以我们要进行联合查询。 - 笛卡尔积:
所有的联合查询都是从这个笛卡尔积当中去取出数据,当然在取数据的时候,一定是要满足某种规则的。这种规则就是接下来要介绍的各种联表查询的方式。
在了解联合查询之前,我们需要先进行一些准备工作,即在选中的数据库中准备四张表和插入一些数据,这里仅把在这四张表中插入数据的SQL语句进行展示,具体的建表语句大家可以自己练习写一下:
insert into classes(name, `desc`) values
('计算机系2019级1班', '学习了计算机原理、C和Java语言、数据结构和算法'),
('中文系2019级3班','学习了中国传统文学'),
('自动化2019级5班','学习了机械自动化');
insert into student(sn, name, qq_mail, classes_id) values
('09982','黑旋风李逵','xuanfeng@qq.com',1),
('00835','菩提老祖',null,1),
('00391','白素贞',null,1),
('00031','许仙','xuxian@qq.com',1),
('00054','不想毕业',null,1),
('51234','好好说话','say@qq.com',2),
('83223','tellme',null,2),
('09527','老外学中文','foreigner@qq.com',2);
insert into course(name) values
('Java'),('中国传统文化'),('计算机原理'),('语文'),('高阶数学'),('英文');
insert into score(score, student_id, course_id) values
-- 黑旋风李逵
(70.5, 1, 1),(98.5, 1, 3),(33, 1, 5),(98, 1, 6),
-- 菩提老祖
(60, 2, 1),(59.5, 2, 5),
-- 白素贞
(33, 3, 1),(68, 3, 3),(99, 3, 5),
-- 许仙
(67, 4, 1),(23, 4, 3),(56, 4, 5),(72, 4, 6),
-- 不想毕业
(81, 5, 1),(37, 5, 5),
-- 好好说话
(56, 6, 2),(43, 6, 4),(79, 6, 6),
-- tellme
(80, 7, 2),(92, 7, 6);
3.2.2.1 内连接
两张或两张以上的表进行查询,左表和右表存在相同意义的字段的时候可以使用内连接,也就是求几张表的交集。
语法:
select 字段 from 表1 别名1 [inner] join 表2 别名2 on 连接条件 and 其他条件;
或
select 字段 from 表1 别名1,表2 别名2 where 连接条件 and 其他条件;
示例:
- 查询“许仙”同学的 成绩:
select sco.score from student stu inner join score sco on stu.id=sco.student_id and stu.name='许仙';
或
select sco.score from student stu, score sco where stu.id=sco.student_id and stu.name='许仙';
- 查询所有同学的总成绩,及同学的个人信息:
-- 成绩表对学生表是多对1关系,查询总成绩是根据成绩表的同学id来进行分组的
SELECT
stu.sn,
stu.NAME,
stu.qq_mail,
sum( sco.score )
FROM
student stu
JOIN score sco ON stu.id = sco.student_id
GROUP BY
sco.student_id;
--或者
SELECT
stu.sn,
stu.NAME,
stu.qq_mail,
sum( sco.score )
FROM
student stu,score sco
where
stu.id = sco.student_id
GROUP BY
sco.student_id;
- 查询所有同学的成绩,及同学的个人信息:
--查询出来的都是有成绩的同学,“老外学中文”同学 没有显示
select * from student stu join score sco on stu.id=sco.student_id;
-- 学生表、成绩表、课程表3张表关联查询
SELECT
stu.id,
stu.sn,
stu.NAME,
stu.qq_mail,
sco.score,
sco.course_id,
cou.NAME
FROM
student stu
JOIN score sco ON stu.id = sco.student_id
JOIN course cou ON sco.course_id = cou.id
ORDER BY
stu.id;
--或者
SELECT
stu.id,
stu.sn,
stu.NAME,
stu.qq_mail,
sco.score,
sco.course_id,
cou.NAME
FROM
student stu,score sco,course cou
where
stu.id = sco.student_id
and
sco.course_id = cou.id
ORDER BY
stu.id;
建议: 多张表联合查询的时候,去找每个表之间的关系。
3.2.2.2 外连接
外连接分为左外连接和右外连接。如果联合查询,左侧的表完全显示我们就说是左外连接;右侧的表完全显示我们就说是右外连接。
语法:
- 左外连接,表1完全显示:
select 字段名 from 表名1 left join 表名2 on 连接条件;
- 右外连接,表2完全显示:
select 字段 from 表名1 right join 表名2 on 连接条件;
示例: 查询所有同学的成绩,及同学的个人信息,如果该同学没有成绩,也需要显示:
-- “老外学中文”同学 没有考试成绩,也显示出来了
select * from student stu left join score sco on stu.id=sco.student_id;
-- 对应的右外连接为:
select * from score sco right join student stu on stu.id=sco.student_id;
-- 学生表、成绩表、课程表3张表关联查询
SELECT
stu.id,
stu.sn,
stu.NAME,
stu.qq_mail,
sco.score,
sco.course_id,
cou.NAME
FROM
student stu
LEFT JOIN score sco ON stu.id = sco.student_id
LEFT JOIN course cou ON sco.course_id = cou.id
ORDER BY
stu.id;
3.2.2.3 自连接
自连接是指在同一张表连接自身进行查询,即把一张表看成两张表使用。
示例: 针对同一个人,显示所有“计算机原理”成绩比“Java”成绩高的成绩信息:
-- 先查询“计算机原理”和“Java”课程的id
select id,name from course where name='Java' or name='计算机原理';
-- 再查询成绩表中,“计算机原理”成绩比“Java”成绩 好的信息
SELECT
s1.*
FROM
score s1,
score s2
WHERE
s1.student_id = s2.student_id
AND s1.score < s2.score
AND s1.course_id = 1
AND s2.course_id = 3;
-- 也可以使用join on 语句来进行自连接查询
SELECT
s1.*
FROM
score s1
JOIN score s2 ON s1.student_id = s2.student_id
AND s1.score < s2.score
AND s1.course_id = 1
AND s2.course_id = 3;
以上查询只显示了成绩信息,并且是分布执行的。要显示学生及成绩信息,并在一条语句显示:
SELECT
stu.*,
s1.score Java,
s2.score 计算机原理
FROM
score s1
JOIN score s2 ON s1.student_id = s2.student_id
JOIN student stu ON s1.student_id = stu.id
JOIN course c1 ON s1.course_id = c1.id
JOIN course c2 ON s2.course_id = c2.id
AND s1.score < s2.score
AND c1.NAME = 'Java'
AND c2.NAME = '计算机原理';
3.2.2.4 子查询
子查询是指嵌入在其他sql语句中的select语句,也叫嵌套查询。
3.2.2.4.1 单行子查询
单行子查询:返回一行记录的子查询。
示例: 查询与“不想毕业” 同学的同班同学:
select * from student where classes_id=(select classes_id from student where name='不想毕业');
3.2.2.4.2 多行子查询
多行子查询:返回多行记录的子查询。
示例: 查询“语文”或“英文”课程的成绩信息:
- [NOT] IN关键字
-- 使用IN
select * from score where course_id in (select id from course where name='语文'or name='英文');
-- 使用 NOT IN
select * from score where course_id notin (select id from course where name!='语文'and name!='英文');
可以使用多列包含:
-- 插入重复的分数:score, student_id, course_id列重复
insertinto score(score, student_id, course_id) values -- 黑旋风李逵
(70.5, 1, 1),(98.5, 1, 3),
-- 菩提老祖
(60, 2, 1);
-- 查询重复的分数
SELECT
*
FROM
score
WHERE
( score, student_id, course_id ) IN ( SELECT score, student_id, course_id FROM score GROUPBY score, student_id, course_id HAVING
count( 0 ) > 1 );
- [NOT] EXISTS关键字
EXISTS(表达式):只要这个表达式为真,就返回true。
这个关键字执行的原理是:
例如这条SQL语句:select * from A where exists (select 1 from B where B.id = A.id);
(1)首先执行一次外部查询,并缓存结果集,如select * from A
。
(2)遍历外部查询结果集的每一行记录R,代入子查询中作为条件进行查询,如select 1 from B where B.id = A.id
。
(3)如果子查询有返回结果,则exists子句返回true,这一行R可作为外部查询的结果行,否则不能作为结果。
-- 使用 EXISTS
select * from score sco where exists (select sco.idfrom course cou where (name='语文'or name='英文') and cou.id = sco.course_id);
-- 使用 NOT EXISTS
select * from score sco wherenot exists (select sco.idfrom course cou where (name!='语文'and name!='英文') and cou.id = sco.course_id);
3.2.2.4.3 from子句中使用子查询
在from子句中使用子查询:子查询语句出现在from子句中。这里要用到数据查询的技巧,把一个子查询当做一个临时表使用。
示例: 查询所有比“中文系2019级3班”平均分高的成绩信息:
-- 获取“中文系2019级3班”的平均分,将其看作临时表
SELECT
avg( sco.score ) score
FROM
score sco
JOIN student stu ON sco.student_id = stu.id
JOIN classes cls ON stu.classes_id = cls.id
WHERE
cls.NAME = '中文系2019级3班';
查询成绩表中,比以上临时表平均分高的成绩:
SELECT
*
FROM
score sco,
(
SELECT
avg( sco.score ) score
FROM
score sco
JOIN student stu ON sco.student_id = stu.id
JOIN classes cls ON stu.classes_id = cls.id
WHERE
cls.NAME = '中文系2019级3班'
) tmp
WHERE
sco.score > tmp.score;
3.2.2.5 合并查询
在实际应用中,为了合并多个select的执行结果,可以使用集合操作符 union,union all。使用UNION 和 UNION ALL时,前后查询的结果集中,字段需要一致。
- union
该操作符用于取得两个结果集的并集。当使用该操作符时,会自动去掉结果集中的重复行。
示例: 查询id小于3,或者名字为“英文”的课程:
select * from course where id<3
union
select * from course where name='英文';
-- 或者使用or来实现
select * from course where id<3 or name='英文';
- union all
该操作符用于取得两个结果集的并集。当使用该操作符时,不会去掉结果集中的重复行。
示例: 查询id小于3,或者名字为“Java”的课程:
-- 可以看到结果集中出现重复数据Java
select * from course where id<3
union all
select * from course where name='英文';