1. 行转列
1.1 示例数据准备
create table test_9(
id int,
name varchar(22),
course varchar(22),
score decimal(18,2)
);
insert into test_9 (id,name,course,score)values(1,'小王','java',99);
insert into test_9 (id,name,course,score)values(2,'小张','java',89.2);
insert into test_9 (id,name,course,score)values(3,'小李','java',88);
insert into test_9 (id,name,course,score)values(4,'小王','MySQL',92.2);
insert into test_9 (id,name,course,score)values(5,'小张','MySQL',42.2);
insert into test_9 (id,name,course,score)values(6,'小李','MySQL',59.2);
1.2 场景一(多行转一行多列)
在上表中,通过SELECT * FROM test_9;语句查询到的结果为
我们想要显示的结果为:
实现以上类似的功能,就是行转列
思路分析:1. 由于每个名字输出两次,而最终结果的名字只有一次,所以一名字分组
select * from test_9 group by name;
2. 最终结果只需要有名字和科目
select name,1 as java ,1 as MySQL from test_9 group by name;
3. 使用聚合函数聚合,相当于把多行数据压扁为一行
-- 行转列
SELECT `name`,MAX(
CASE
WHEN course = 'java' THEN score
END
) AS java,MAX(
CASE
WHEN course = 'MySQL' THEN score
END
) AS MySQL
FROM test_9
GROUP BY `name`;
1.3 场景二(多行转一行一列)
输出结果:
相关函数:concat(值,拼接符,值):拼接多行数据为一行
group_concat(值,拼接符,值):多行压扁到一行
思路分析:
-- 多行转一行一列
-- 第一步:分组
SELECT `name`,1 AS `各科成绩` FROM test_9 GROUP BY `name`;
-- 第二步:将课程名与成绩拼接在一起
SELECT `name`,CONCAT(course,"=",score) AS `各科成绩` FROM test_9 GROUP BY `name`;
-- 第三步:利用group_concat函数将多行压扁到一行
SELECT `name`,GROUP_CONCAT(course,"=",score) AS `各科成绩` FROM test_9 GROUP BY `name`;
-- 第四步:添加分隔符
SELECT `name`,GROUP_CONCAT(course,"=",score SEPARATOR' | ') AS `各科成绩` FROM test_9 GROUP BY `name`;
-- 第五步:按课程名排序
SELECT `name`,GROUP_CONCAT(course,"=",score ORDER BY course DESC SEPARATOR' | ') AS `各科成绩` FROM test_9 GROUP BY `name`;
2. DQL-链接查询
2.1 笛卡尔积
笛卡尔积,也有的叫笛卡尔乘积
多表查询中,链接的where限定条件,不能少于 表的个数-1 , 否则就会发生笛卡尔乘积 , 这个限定条件并不是随便一个限定条件,而是用于维护映射两个表的条件,比如 外键
笛卡尔乘积是一个很消耗内存的运算,笛卡尔积产生的新表,行数是原来两个表行数的乘积,列数是原来两个表列数的和。所以我们在表连接时要使用一些优化手段,避免出现笛卡尔乘积。
最简单的多表查询 : select * from 表1,表2;
示例数据:
create table teacher(
id int ,
name varchar(20),
primary key (id)
);
create table student (
id int ,
name varchar(20),
teacher_id int ,
primary key (id),
foreign key (teacher_id) references teacher(id)
);
insert into teacher (id,name) values(1,'张老师');
insert into teacher (id,name) values(2,'王老师');
insert into teacher (id,name) values(3,'赵老师');
insert into student (id,name,teacher_id) values(1,'小明',1);
insert into student (id,name) values(2,'小红');
insert into student (id,name,teacher_id) values(3,'小黑',2);
执行查询语句
SELECT * FROM teacher,student;
执行结果
每个行都出现两次,如果直接写查询语句,结果的条数就是两个表的成绩,所以判断条件至少也要有一个,也就是两个表的个数-1.
执行语句:
SELECT * FROM student AS stu,teacher AS t
WHERE stu.teacher_id = t.id;
执行结果:
条数对了,因为小红没有teacher_id所以不会被查询出来。虽然条数对了,但是也会先发生一个完全的笛卡尔乘积,然后在新视图中找匹配的数据,再展示匹配的数据,会消耗内存一些、所以不推荐使用,推荐使用链接查询
优化以上笛卡尔积的方法:
优化一:使用等值连接条件,比如上面的where s.teahcer_id = t.id。
优化二:能使用inner join的就不要使用left join。
优化三:使用记录数更少的表当左表。
但是如果业务上有要求:
比如,我们有一张用户的基本信息表,我们还有一张用户的订单表, 现在我们要求在页面上展示,所有用户的订单记录,这种情况下我们就必须使用left join了,因为inner join 会丢数据
假设基本信息表中有A B C三个用户(3条记录)
订单表中有A B两个人的100条订单记录
这种情况下,我们除了使用left join外,还必须要让基本信息表当左表,订单表当右表。
MYSQL支持的表连接查询有inner join,left join,right join(right join我们工作中基本不用)。
2.2 inner join
插入一条示例数据:
-- 内连接:INNER JOIN/JOIN
SELECT * FROM student AS stu INNER JOIN teacher AS t
ON stu.teacher_id = t.id;
总结:
数据库在通过连接两张或多张表来返回记录时,都会生成一张中间的临时表,然后再将这张临时表返回给用户。
在使用 join 连接查询 时,on和where条件的区别如下:
1、on条件是在生成临时表时使用的条件,需要和链接查询一起使用。
2、where条件是在临时表生成好后,再对临时表进行过滤的条件。这时已经没有join的含义(必须返回左边表的记录)了,条件不为真的就全部过滤掉。
链接查询,会发生笛卡尔乘积,但是不是完全的笛卡尔乘积,在生成视图的时候,会进行匹配,不符合条件的就不要了
结果数据是以左表数据为准,先生成左表数据,再生成右表数据
使用内连接的话,会以左边表为基准(student),生成新视图的时候,先生成左边表中的数据,然后再去匹配右边表中是否有符合条件的,没有的话,就不生成这一行
同时左表中有的,右表中没有的数据,都不会生成
右表中有的,左表中没有的也一样不会生成,所以 左表和右表就算换了位置,数据行数不会变多
但是会丢失数据,不符合 条件的数据不会查询出来,所以 刚添加的 孙老师就不会查询出来的,就算是teacher表在左边,也一样不会查询出来孙老师,并且学生小红也没有被查询处理 因为学生表中 teacher_id列 没有保存孙老师的ID,并且小红也没有保存老师的ID,所以都不要
多表查询是有左右表之分的,一般左表是主表,以左边为主。Inner join 也可以直接写join 不写inner
2.3 inner join
left join on : 左连接,又称左外链接,是 left outer join 的简写 ,使用left join 和 使用 left outer join 是一样的效果
-- 左外链接:LEFT JOIN 或 LEFT OUTER JOIN
SELECT * FROM student AS stu LEFT JOIN teacher AS t
ON stu.teacher_id = t.id;
总结:
以左边的表为基准,左表中数据都有,右表中不符合条件的就没有,就在指定列上用null代替
生成视图的时候,也是先生成左表的数据。
2.4 right join
right join on : 右链接,又称右外连接,是 right outer join 的简写,使用right join 和 使用 right outer join 是一样的.
-- 右外链接:RIGHT JOIN 或 RIGHT OUTER JOIN
SELECT * FROM student AS stu RIGHT JOIN teacher AS t
ON stu.teacher_id = t.id;
总结:
以右表为基准,右表中数据都有,左表中不符合条件的就没有,就在指定列上用null代替
但是视图生成的时候,还是会先生成左表数据。以上可以看出,student right join teacher 显示的内容是与teacher left join student相同的。而teacher right join student 显示的内容又与student left join student相同。 所以,我们工作中,right join基本不用。用的最多的是inner join 与left join。
PS:外键与表连接没有任何关系,不要混淆。
外键是为了保证不能随便删除/插入/修改数据,是数据完整性的一种约束机制。
而表连接是因为一张表的字段无法满足业务需求(想查的字段来自于2张甚至多张表)
一个是为了增删改,一个是为了查,它俩之间没有联系。
2.4 模拟Oracle中的full join
上面几个链接查询中
inner是两个表都符合条件的数据
left join 是 左表都有,右表符合条件才有
right join 是 右表都有,左表符合条件才有
那么能不能让两个表,别管符合不符合,都有呢?
full join / full outer join ,但是MySQL这里给取消了,比如Oracle就有
模拟一下 full join 的功能
-- 模拟Oracle中的full join , 两边不符合条件的,也都要
-- 就是也有小红,也有赵老师
SELECT * FROM student AS stu LEFT JOIN teacher AS t
ON stu.teacher_id = t.id
UNION
SELECT * FROM student AS stu RIGHT JOIN teacher AS t
ON stu.teacher_id = t.id;