目录
1. CRUD介绍
2. Create 新增
2.1 单行数据+全列插入
2.2 多行数据+指定列插入
2.3 插入否则更新
2.4 替换数据
3. Retrieve 查找
3.1 select 查询
3.2 where 条件
3.2.1 MySQL运算符
3.2.2 NULL的查询
3.3 order by 结果排序
3.4 limit 筛选分页结果
4. Update 修改
5. Delete 删除
5.1 delete 删除数据
5.2 truncate 截断表
6. 插入查询结果
7. 聚合函数
8. group by 分组查询
8.1 group by 测试
8.2 having 条件
本篇完。
1. CRUD介绍
- 表的增删查改简称CRUD:Create(新增),Retrieve(查找),Update(修改),Delete(删除)。
- CRUD的操作对象是对表当中的数据,是典型的DML(Data Manipulation Language)数据操作语言。
复习:SQL语句可分为如下三类:
- DDL(Data Definition Language)数据定义语言,用来维护存储数据的结构。比如create语句、drop语句、alter语句等。
- DML(Data Manipulation Language)数据操作语言,用来对数据进行操作。比如insert语句、delete语句、update语句等。
- DCL(Data Control Language)数据控制语言,主要负责权限管理和事务。比如grant语句、revoke语句、commit语句。
注: DML中又单独分了一个DQL(Data Query Language)数据查询语言,比如select语句、from语句、where语句等。
此篇大多是DQL(Data Query Language)数据查询语言。
先看个有用的面试题:SQL查询中各个关键字的执行先后顺序: from > on> join > where > group by > with > having > select > distinct > order by > limit
2. Create 新增
因为MySQL在默认情况下不区分大小写,所以平时都习惯用小写了,看到大写能懂就行。
Create新增数据的SQL如下:
insert [into] table_name [(column1 [, column2] ...)] values (value_list1) [, (value_list2)] ...;
insert [into] table_name [(column1 [, column2] ...)]
values (value_list1) [, (value_list2)] ...;
- [ ]中代表的是可选项, 可以不加。
- SQL中的每个value_list都表示插入的一条记录,每个value_list都由若干待插入的列值组成。
- SQL中的column列表,用于指定每个value_list中的各个列值应该插入到表中的哪一列。
为了进行演示,下面创建一个学生表,表当中包含自增长的主键id、学号、姓名和QQ号。如下:
创建表完毕后查看表结构,可以看到表结构如下:
2.1 单行数据+全列插入
下面使用insert语句向学生表中插入记录,每次向表中插入一条记录,并且插入记录时不指定column列表,表示按照表中默认的列顺序进行全列插入,因此插入的每条记录中的列值需要按表列顺序依次列出。如下:
2.2 多行数据+指定列插入
使用insert语句也可以一次向表中插入多条记录,插入的多条记录之间使用逗号隔开,并且插入记录时可以只指定某些列进行插入。如下:
注意:在插入记录时,只有允许为空的列或自增长字段可以不指定值插入,不允许为空的列必须指定值插入,否则会报错。
2.3 插入否则更新
向表中插入记录时,如果待插入记录中的主键或唯一键已经存在,那么就会因为主键冲突或唯一键冲突导致插入失败。如下:
这时可以选择性的进行同步更新操作:
- 如果表中没有冲突数据,则直接插入数据。
- 如果表中有冲突数据,则将表中的数据进行更新。
插入否则更新的SQL如下:
INSERT ... ON DUPLICATE UPDATE column1=value1 [, column2=value2] ...;
insert... on duplicate update column1=value1 [, column2=value2] ...;
- SQL中大写的表示关键字,[ ]中代表的是可选项。
- SQL中INSERT之后语法与之前的INSERT语句相同。
- UPDATE后面的column=value,表示当插入记录出现冲突时需要更新的列值。
比如向学生表中插入记录时,如果没有出现主键冲突则直接插入记录,如果出现了主键冲突,则将表中冲突记录的学号和姓名进行更新。如下:
执行插入否则更新的SQL后,可以通过受影响的数据行数来判断本次数据的插入情况:
- 0 rows affected:表中有冲突数据,但冲突数据的值和指定更新的值相同。
- 1 row affected:表中没有冲突数据,数据直接被插入。
- 2 rows affected:表中有冲突数据,并且数据已经被更新。
2.4 替换数据
replace... on duplicate update column1=value1 [, column2=value2] ...;
- 如果表中没有冲突数据,则直接插入数据。
- 如果表中有冲突数据,则先将表中的冲突数据删除,然后再插入数据。
要达到上述效果,只需要在插入数据时将SQL语句中的INSERT改为REPLACE即可。比如:
执行替换数据的SQL后,也可以通过受影响的数据行数来判断本次数据的插入情况:
- 1 row affected:表中没有冲突数据,数据直接被插入。
- 2 rows affected:表中有冲突数据,冲突数据被删除后重新插入。
3. Retrieve 查找
查找数据的SQL如下:
select [distinct] {* | {column1 [, column2] ...}} from table_name [where ...] [order by ...] [limit] ...;
- [ ]中代表的是可选项, 可以不加。
- { }中的 | 代表可以选择左侧的语句或右侧的语句。
select [distinct] {* | {column1 [, column2] ...}}
from table_name [where ...] [order by ...] [limit] ...;
为了进行演示,下面创建一个成绩表,表当中包含自增长的主键id、姓名以及该同学的语文成绩、数学成绩和英语成绩。如下:
创建表完毕后查看表结构,可以看到表结构如下:
接下来向表中插入几条测试记录,以供我们进行查找。如下:
3.1 select 查询
全列查询
在查询数据时直接用*代替column列表,表示进行全列查询,这时将会显示被筛选出来的记录的所有列信息。如下:
注意:通常情况下不建议使用*
进行全列查询,因为被查询到的数据需要通过网络从MySQL服务器传输到本主机,查询的列越多也就意味着需要传输的数据量越大,此外,进行全列查询还可能会影响到索引的使用(索引后面讲)。
指定列查询:
在查询数据时也可以只对指定的列进行查询,这时将需要查询的列在column列表列出即可。如下:
表达式查询:
查询数据时,column列表中除了能罗列表中存在的列名外,我们也可以将表达式罗列到column列表中。如下:
因为select不仅能够用来查询数据,还可以用来计算某些表达式或执行某些函数。如下:
如果我们将表达式罗列到column列表,那么每当一条记录被筛选出来时就会执行这个表达式,然后将表达式的计算结果作为这条记录的一个列值进行显示。
column列表中的表达式可以包含表中已有的字段,这时每当一条记录被筛选出来时,就会将记录中对应的列值提供给表达式进行计算。如下:
column列表中的表达式中也可以包含多个表中已有的字段,这时我们就可以通过表达式计算出更多有意义的数据。如下:
为查询结果指定别名:
看到上图,表达式已经很长了,可以为查询结果指定别名,SQL如下:
select column [as] alias_name [...] from table_name;
比如查询成绩表中的数据时,将每条记录中的三科成绩相加,然后将计算结果对应的列指定别名为“总分”。如下:
结果去重:
查询成绩表时指定查询数学成绩对应的列,可以看到数学成绩中有重复的分数。如下:
如果想要对查询结果进行去重操作,可以在SQL中的select后面带上distinct。如下:
3.2 where 条件
- 如果在查询数据时没有指定where子句,那么会直接将表中所有的记录作为数据源来依次执行select语句。
- 如果在查询数据时指定了where子句,那么在查询数据时会先根据where子句筛选出符合条件的记录,然后将符合条件的记录作为数据源来依次执行select语句。
where子句中可以指明一个或多个筛选条件,各个筛选条件之间用逻辑运算符and或or进行关联,下面给出了where子句中常用的比较运算符和逻辑运算符。
3.2.1 MySQL运算符
比较运算符:
运算符 | 说明 |
---|---|
>、>=、<、<= | 大于、大于等于、小于、小于等于 |
= | 等于。NULL不安全,例如NULL=NULL的结果是NULL而不是TRUE(1) |
<=> | 等于。NULL安全,例如NULL<=>NULL的结果就是TRUE(1) |
!=、<> | 不等于 |
between a0 and a1 | 范围匹配。如果a0<=value<=a1,则返回TRUE(1) |
in(option1, option2, …) | 如果是IN中的任意一个option,则返回TRUE(1) |
is NULL | 如果是NULL,则返回TRUE(1) |
in not NULL | 如果不是NULL,则返回TRUE(1) |
like | 模糊匹配。% 表示任意多个字符(包括0个),_ 表示任意一个字符 |
逻辑运算符:
运算符 | 说明 |
---|---|
and | 多个条件同时为TRUE(1),则结果为TRUE(1),否则为FALSE(0) |
or | 任意一个条件为TRUE(1),则结果为TRUE(1),否则为FALSE(0) |
not | 条件为TRUE(1),则结果为FALSE(0);条件为FALSE(0),则结果为TRUE(1) |
where 条件演示:
查询英语不及格的同学及其英语成绩:
在where子句中指明筛选条件为英语成绩小于60,在select的column列表中指明要查询的列为姓名和英语成绩。如下:
查询语文成绩在80到90分的同学及其语文成绩:
在where子句中指明筛选条件为语文成绩大于等于80并且小于等于90,在select的column列表中指明要查询的列为姓名和语文成绩。如下:
此外,这里也可以使用between a0 and a1来指明语文成绩的的所在区间。如下:
左闭右闭:
分别查询姓孙的同学和孙某同学:
查询姓孙的同学:在where子句中通过模糊匹配来判断当前同学是否姓孙(需要用到%来匹配多个字符),在select的column列表中指明要查询的列为姓名。如下:
查询孙某同学:在where子句中通过模糊匹配来判断当前同学是否为孙某(需要用到_来严格匹配单个字符,一个下划线一个字符),在select的column列表中指明要查询的列为姓名。如下:
查询语文成绩好于英语成绩的同学:在where子句中指明筛选条件为语文成绩大于英语成绩,在select的column列表中指明要查询的列为姓名、语文成绩和英语成绩。如下:
查询总成绩在200分以下的同学:在select的column列表中添加表达式查询,查询的表达式为语文、数学和英语成绩之和,为了方便观察可以将表达式对应的列指定别名为“总分”,在where子句中指明筛选条件为三科成绩之和小于200。如下:
需要注意的是,在where子句中不能使用select中指定的别名:
- 查询数据时是先根据where子句筛选出符合条件的记录。
- 然后再将符合条件的记录作为数据源来依次执行select语句。
也就是说,where子句的执行是先于select语句的,所以在where子句中不能使用别名,如果在where子句中使用别名,那么在查询数据时就会产生报错。如下:
查询性孙的同学,或总成绩大于200分并且语文成绩小于数学成绩并且英语成绩大于80分的同学,查询时需要用到模糊匹配、表达式查询和逻辑运算符。如下:
3.2.2 NULL的查询
这里用之前演示新增数据的学生表来演示NULL查询,学生表中的内容如下:
查询QQ号已知的同学:在where子句中指明筛选条件为QQ号不为NULL,在select的column列表中指明要查询的列为姓名和QQ号。如下:
查询QQ号未知的同学:在where子句中指明筛选条件为QQ号为NULL,在select的column列表中指明要查询的列为姓名和QQ号。如下:
需要注意的是,在与NULL值作比较的时候应该使用<=>运算符或者用is null,使用=运算符无法得到正确的查询结果。如下:
因为=运算符是NULL不安全的,使用=运算符将任何值与NULL作比较,得到的结果都是NULL。如下:
但是<=>运算符是NULL安全的,使用<=>运算符将NULL和NULL作比较得到的结果为TRUE(1),将非NULL值与NULL作比较得到的结果为FALSE(0)。如下:
3.3 order by 结果排序
结果排序的SQL如下:
select ... from table_name [where ...] order by column [asc | desc] [, ...];
- [ ]中代表的是可选项, 可以不加。
- asc 和desc 分别代表的是排升序和排降序,默认为 asc(不建议使用默认的,可读性不好)。
注意: 如果查询SQL中没有order by子句,那么返回的顺序是未定义的。
下面用前面建的exam_result表演示。
查询同学及其数学成绩,按数学成绩升序显示:在select的column列表中指明要查询的列为姓名和数学成绩,在order by子句中指明按照数学成绩进行升序排序。如下:
在students表查询同学及其QQ号,按QQ号升序显示(演示默认升序):在select的column列表中指明要查询的列为姓名和QQ号,在order by子句中指明按照QQ号进行升序排序。如下:
NULL值视为比任何值都小,因此排升序时出现在最上面。
查询同学的各门成绩,依次按数学降序、英语升序、语文升序显示:在select的column列表中指明要查询的列为姓名和QQ号,在order by子句中指明按照QQ号进行降序排序。如下:
查询同学的各门成绩,依次按数学降序、英语升序、语文升序显示:在select的column列表中指明要查询的列为姓名、数学成绩、英语成绩和语文成绩,在order by子句中指明依次按照数学成绩排降序、英语成绩排升序和语文成绩排升序。如下:
可以看到显示结果是按照数学成绩进行降序排序的,而相同的数学成绩之间则是按照英语成绩进行升序排序的。
- order by子句中可以指明按照多个字段进行排序,每个字段都可以指明按照升序或降序进行排序,各个字段之间使用逗号隔开,排序优先级与书写顺序相同。
- 比如上述SQL中,当两条记录的数学成绩相同时就会按照英语成绩进行排序,如果这两条记录的英语成绩也相同就会继续按照语文成绩进行排序,以此类推。
查询同学及其总分,按总分降序显示:在select的column列表中指明要查询的列为姓名和总分(表达式查询),在order by子句中指明按照总分进行降序排序。如下:
需要注意的是,在order by子句中可以使用select中指定的别名:
- 查询数据时是先根据where子句筛选出符合条件的记录。
- 然后再将符合条件的记录作为数据源来依次执行select语句。
- 最后再通过order by子句对select语句的执行结果进行排序。
也就是说,order by子句的执行是在select语句之后的,所以在order by子句中可以使用别名。如下:
查询姓孙的同学或姓曹的同学及其数学成绩,按数学成绩降序显示:
- 题目的前半句描述的是查询,后半句描述的是排序。
- 在排序的时候必须要有数据,因此可以先完成前面的查询动作,然后再根据题目要求进行排序。
查询数据时,在where子句中指明筛选条件为姓孙或姓曹(模糊匹配),在select的column列表中指明要查询的列为姓名和数学成绩。如下:
当查询到目标数据后再在查询SQL后添加order by子句,在order by子句中指明按照数学成绩进行降序排序。如下:
3.4 limit 筛选分页结果
从第0条记录开始,向后筛选出n条记录:
select ... from table_name [where ...] [order by ...] limit n;
从第s条记录开始,向后筛选出n条记录:
select ... from table_name [where ...] [order by ...] limit s, n;
从第s条记录开始,向后筛选出n条记录:
select ... from table_name [where ...] [order by ...] limit n, offset s;
- [ ]中代表的是可选项,可以不加。
- 查询SQL中各语句的执行顺序为:where、select、order by、limit。
- limit子句在筛选记录时,记录的下标从0开始。
建议: 对未知表进行查询时最好在查询SQL后加上limit 1,避免在查询全表数据时因为表中数据过大而导致数据库卡死。
按id进行分页,每页3条记录,分别显示第1、2、3页:这里使用成绩表中的数据来演示分页查询,查询第1页记录时在查询全表数据的SQL后,加上limit子句指明从第0条记录开始,向后筛选出3条记录。如下(最上面和最下面是无关演示):
查询第2页记录时在查询全表数据的SQL后,加上limit子句指明从第3条记录开始,向后筛选出3条记录。如下:
查询第3页记录时在查询全表数据的SQL后,加上limit子句指明从第6条记录开始,向后筛选出3条记录。如下:
说明一下: 如果从表中筛选出的记录不足n个,则筛选出几个就显示几个。
4. Update 修改
修改数据的SQL如下:
update table_name set column1=expr1 [, column2=expr2] ... [where ...] [order by ...] [limit ...];
- [ ]中代表的是可选项,可不加。
- SQL中的column=expr,表示将记录中列名为column的值修改为expr。
- 在修改数据之前需要先找到待修改的记录,update语句中的where、order by和limit就是用来定位数据的。
将孙悟空同学的数学成绩修改为80分:在修改数据之前,先查看孙悟空同学当前的数学成绩。如下:
在update语句中指明要将筛选出来的记录的数学成绩改为80分,并在修改后再次查看数据确保数据成功被修改。如下:
将曹孟德同学的数学成绩修改为60分,语文成绩修改为70分:在修改数据之前,先查看曹孟德同学当前的数学成绩和语文成绩。如下:
在update语句中指明要将筛选出来的记录的数学成绩改为60分,语文成绩改为70分,并在修改后再次查看数据确保数据成功被修改。如下:
将总成绩倒数前三的3位同学的数学成绩加上30分:在修改数据之前,先查看总成绩倒数前三的3位同学的数学成绩。如下:
在update语句中指明要将筛选出来的记录的数学成绩加上30分,并在修改后再次查看数据确保数据成功被修改。如下:
需要注意的是,MySQL中不支持+=这种复合赋值运算符,此外,这里在查看更新后的数据时不能查看总成绩倒数前三的3位同学,因为之前总成绩倒数前三的3位同学,数学成绩加上30分后可能就不再是倒数前三了。如下:
将所有同学的语文成绩修改为原来的2倍:在修改数据之前,先查看所有同学的语文成绩。如下:
在update语句中指明要将筛选出来的记录的语文成绩变为原来的2倍,并在修改后再次查看数据确保数据成功被修改。如下:
注意: 更新全表的语句要慎用,因为和下面的删除类似,更新了,原有的数据就找不回来了。
5. Delete 删除
5.1 delete 删除数据
删除数据的SQL如下:
delete from table_name [where ...] [order by ...] [limit ...];
- [ ]中代表的是可选项,可不加。
- 在删除数据之前需要先找到待删除的记录,delete语句中的where、order by和limit就是用来定位数据的。
删除孙悟空同学的考试成绩:在删除数据之前,先查看孙悟空同学的相关信息,然后在delete语句中指明删除孙悟空对应的记录,并在删除后再次查看数据确保数据成功被删除。如下:
演示删除整张表数据:创建一张测试表,表中包含一个自增长的主键id和姓名。如下:
向表中插入一些测试数据用于删除。如下:
在delete语句中只指明要删除数据的表名,而不通过where、order by和limit指明筛选条件,这时将会删除整张表的数据。如下:
再向表中插入一些数据,在插入数据时不指明自增长字段的值,这时会发现插入数据对应的自增长id值是在之前的基础上继续增长的。如下:
查看创建表时的相关信息时可以看到,有一个AUTO_INCREMENT=n的字段,该字段表示下一次插入数据时自增长字段的值应该为n。如下:
当通过delete语句删除整表数据时,不会重置AUTO_INCREMENT=n字段,因此删除整表数据后插入数据对应的自增长id值会在原来的基础上继续增长。如下:
注意: 删除整表操作要慎用。
5.2 truncate 截断表
截断表的SQL如下:
truncate [table] table_name;
- [ ]中代表的是可选项,可不加。
- truncate只能对整表操作,不能像delete一样针对部分数据操作。
- truncate实际上不对数据操作,所以比delete更快。
- truncate在删除数据时不经过真正的事务,所以无法回滚。
- truncate会重置自增长AUTO_INCREMENT=n字段。
创建一张测试表,表中包含一个自增长的主键id和姓名。如下:
向表中插入一些测试数据用于删除。如下:
在truncate语句中只指明要删除数据的表名,这时便会删除整张表的数据,但由于truncate实际不对数据操作,因此执行truncate语句后看到影响行数为0。如下:
再向表中插入一些数据,在插入数据时不指明自增长字段的值,这时会发现插入数据对应的自增长id值是重新从1开始增长的。如下:
查看创建表时的相关信息时也可以看到,有一个AUTO_INCREMENT=n的字段,该字段表示下一次插入数据时自增长字段的值应该为n。如下:
但是当通过truncate语句删除整表数据时,会重置AUTO_INCREMENT字段,因此截断表后插入数据对应的自增长id值会重新从1开始增长。如下:
注意: 截断表操作要慎用。
6. 插入查询结果
插入查询结果的SQL如下:
insert [into] table_name [(column1 [, column2] ...)] select ... [where ...] [order by ...] [limit ...];
- [ ]中代表的是可选项,可不加。
- SQL的作用是将筛选出来的记录插入到指定的表当中。
- SQL中的column,表示将筛选出的记录的各个列插入到表中的哪一列。
删除表中重复的记录,重复的数据只能有一份:
创建一张测试表,表中包含id和姓名。如下:
向测试表中插入一些测试数据,数据中存在重复的记录。如下:
现在要求删除测试表中重复的数据,思路如下:
- 创建一张临时表,该表的结构与测试表的结构相同。
- 以去重的方式查询测试表中的数据,并将查询结果插入到临时表中。
- 将测试表重命名为其他名字,再将临时表重命名为测试表的名字,实现原子去重操作。
通过插入查询语句将去重查询后的结果插入到临时表中,由于临时表和测试表的结构相同,并且select进行的是全列查询,因此在插入时不用在表名后指明column列表。如下:
将测试表重命名为其他名字(相当于对去重前的数据进行备份,如果不需要可以直接删除),将临时表重命名为测试表的名字,这时便完成了表中数据的去重操作。如下:
7. 聚合函数
聚合函数对一组值执行计算并返回单一的值,常用的聚合函数如下:
函数 | 说明 |
---|---|
count([distinct] expr) | 返回查询到的数据的数量 |
sum([distinct] expr) | 返回查询到的数据的总和,不是数字没有意义 |
avg([distinct] expr) | 返回查询到的数据的平均值,不是数字没有意义 |
max([distinct] expr) | 返回查询到的数据的最大值,不是数字没有意义 |
min([distinct] expr) | 返回查询到的数据的最小值,不是数字没有意义 |
聚合函数可以在select语句中使用,此时select每处理一条记录时都会将对应的参数传递给这些聚合函数。
这里用之前的学生表来进行演示,学生表中的内容如下:
统计班级共有多少同学:在select语句中使用count函数,并将*作为参数传递给count函数,这时便能统计出表中的记录条数。如下:
这种写法相当于在查询表中数据时,自行新增了一列列名为特定表达式的列,我们就是在用count函数统计该列中有多少个数据,等价于统计表中有多少条记录。如下:
统计班级收集的QQ号有多少个:在select语句中使用count函数统计qq列中数据的个数,这时便能统计出表中QQ号的个数。如下:
如果count函数的参数是一个确定的列名,那么count函数将会忽略该列中的NULL值。
下面用之前的成绩表来进行演示,成绩表中的内容如下:
统计本次考试数学成绩的分数个数:在select语句中使用count函数统计math列中数据的个数,这时便能统计出表中的数学成绩的个数。如下:
为了方便演示,修改一下成绩表:
统计本次考试数学成绩的分数个数(去重):在使用count函数时(包括其他聚合函数),在传递的参数之前加上distinct,这时便能统计出表中数学成绩去重后的个数。如下:
统计数学成绩总分:在select语句中使用sum函数统计math列中数据的总和,这时便能统计出表中的数学成绩的总和。如下:
统计平均总分:在select语句中使用avg函数计算总分的平均值。如下:
返回数学最高分:在select语句中使用max函数查询数学成绩最高分。如下:
返回70分以上的英语最低分:在where子句中指明筛选条件为英语成绩大于70分,在select语句中使用min函数查询英语成绩最低分。如下:
8. group by 分组查询
分组查询测试表:直接复制的一份雇员信息表
雇员信息表中包含三张表,分别是员工表(emp)、部门表(dept)和工资等级表(salgrade)。
员工表(emp)中包含如下字段:
- 雇员编号(empno)。
- 雇员姓名(ename)。
- 雇员职位(job)。
- 雇员领导编号(mgr)。
- 雇佣时间(hiredate)。
- 工资月薪(sal)。
- 奖金(comm)。
- 部门编号(deptno)。
部门表(dept)中包含如下字段:
- 部门编号(deptno)。
- 部门名称(dname)。
- 部门所在地点(loc)。
工资等级表(salgrade)中包含如下字段:
- 等级(grade)。
- 此等级最低工资(losal)。
- 此等级最高工资(hisal)。
雇员信息表的SQL如下(复制粘贴即可):
DROP database IF EXISTS `scott`;
CREATE database IF NOT EXISTS `scott` DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;
USE `scott`;
DROP TABLE IF EXISTS `dept`;
CREATE TABLE `dept` (
`deptno` int(2) unsigned zerofill NOT NULL COMMENT '部门编号',
`dname` varchar(14) DEFAULT NULL COMMENT '部门名称',
`loc` varchar(13) DEFAULT NULL COMMENT '部门所在地点'
);
DROP TABLE IF EXISTS `emp`;
CREATE TABLE `emp` (
`empno` int(6) unsigned zerofill NOT NULL COMMENT '雇员编号',
`ename` varchar(10) DEFAULT NULL COMMENT '雇员姓名',
`job` varchar(9) DEFAULT NULL COMMENT '雇员职位',
`mgr` int(4) unsigned zerofill DEFAULT NULL COMMENT '雇员领导编号',
`hiredate` datetime DEFAULT NULL COMMENT '雇佣时间',
`sal` decimal(7,2) DEFAULT NULL COMMENT '工资月薪',
`comm` decimal(7,2) DEFAULT NULL COMMENT '奖金',
`deptno` int(2) unsigned zerofill DEFAULT NULL COMMENT '部门编号'
);
DROP TABLE IF EXISTS `salgrade`;
CREATE TABLE `salgrade` (
`grade` int(11) DEFAULT NULL COMMENT '等级',
`losal` int(11) DEFAULT NULL COMMENT '此等级最低工资',
`hisal` int(11) DEFAULT NULL COMMENT '此等级最高工资'
);
insert into dept (deptno, dname, loc)
values (10, 'ACCOUNTING', 'NEW YORK');
insert into dept (deptno, dname, loc)
values (20, 'RESEARCH', 'DALLAS');
insert into dept (deptno, dname, loc)
values (30, 'SALES', 'CHICAGO');
insert into dept (deptno, dname, loc)
values (40, 'OPERATIONS', 'BOSTON');
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7369, 'SMITH', 'CLERK', 7902, '1980-12-17', 800, null, 20);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7499, 'ALLEN', 'SALESMAN', 7698, '1981-02-20', 1600, 300, 30);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7521, 'WARD', 'SALESMAN', 7698, '1981-02-22', 1250, 500, 30);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7566, 'JONES', 'MANAGER', 7839, '1981-04-02', 2975, null, 20);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7654, 'MARTIN', 'SALESMAN', 7698, '1981-09-28', 1250, 1400, 30);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7698, 'BLAKE', 'MANAGER', 7839, '1981-05-01', 2850, null, 30);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7782, 'CLARK', 'MANAGER', 7839, '1981-06-09', 2450, null, 10);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7788, 'SCOTT', 'ANALYST', 7566, '1987-04-19', 3000, null, 20);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7839, 'KING', 'PRESIDENT', null, '1981-11-17', 5000, null, 10);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7844, 'TURNER', 'SALESMAN', 7698,'1981-09-08', 1500, 0, 30);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7876, 'ADAMS', 'CLERK', 7788, '1987-05-23', 1100, null, 20);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7900, 'JAMES', 'CLERK', 7698, '1981-12-03', 950, null, 30);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7902, 'FORD', 'ANALYST', 7566, '1981-12-03', 3000, null, 20);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7934, 'MILLER', 'CLERK', 7782, '1982-01-23', 1300, null, 10);
insert into salgrade (grade, losal, hisal) values (1, 700, 1200);
insert into salgrade (grade, losal, hisal) values (2, 1201, 1400);
insert into salgrade (grade, losal, hisal) values (3, 1401, 2000);
insert into salgrade (grade, losal, hisal) values (4, 2001, 3000);
insert into salgrade (grade, losal, hisal) values (5, 3001, 9999);
上述SQL中创建了一个名为scott的数据库,在该数据库中分别创建了部门表(dept)、员工表(emp)和工资等级表(salgrade),并分别向三张表中插入了一些数据用于查询。
执行完文件中的SQL后查看数据库,就能看到多了一个名为scott的数据库。如下:
进入该数据库,在该数据库中就可以看到雇员信息表中的三张表。如下:
其中部门表(dept)的表结构和表中的内容如下:
员工表(emp)的表结构和表中的内容如下:
工资等级表(salgrade)的表结构和表中的内容如下:
8.1 group by 测试
上面是测试表,分组查询的SQL如下:
select column1 [, column2], ... from table_name [where ...] group by column [, ...] [order by ...] [limit ...];
- [ ]中代表的是可选项,可不加。
- 查询SQL中各语句的执行顺序为:where、group by、select、order by、limit。
- group by后面的列名,表示按照指定列进行分组查询。
测试演示:显示每个部门的平均工资和最高工资:
在group by子句中指明按照部门号进行分组,在select语句中使用avg函数和max函数,分别查询每个部门的平均工资和最高工资。如下:
测试演示:显示每个部门的每种岗位的平均工资和最低工资:
在group by子句中指明依次按照部门号和岗位进行分组,在select语句中使用avg函数和min函数,分别查询每个部门的每种岗位的平均工资和最低工资。如下:
- group by子句中可以指明按照多个字段进行分组,各个字段之间使用逗号隔开,分组优先级与书写顺序相同。
- 比如上述SQL中,当两条记录的部门号相同时,将会继续按照岗位进行分组。
8.2 having 条件
含有having子句的SQL如下:
select ... from table_name [where ...] group by ... [having ...] [order by ...] [limit ...];
- [ ]中代表的是可选项,可不加。
- SQL中各语句的执行顺序为:where、group by、select、having、order by、limit。
- having子句中可以指明一个或多个筛选条件。
having子句和where子句的区别
- where子句放在表名后面,而having子句必须搭配group by子句使用,放在group by子句的后面。
- where子句是对整表的数据进行筛选,having子句是对分组后的数据进行筛选。
- where子句中不能使用聚合函数和别名,而having子句中可以使用聚合函数和别名。
测试演示:显示平均工资低于2000的部门和它的平均工资:
- 先统计每个部门的平均工资。
- 然后通过having子句筛选出平均工资低于2000的部门。
在group by子句中指明按照部门号进行分组,在select语句中使用avg函数查询每个部门的平均工资。然后在having子句中指明筛选条件为平均工资小于2000。如下:
本篇完。
再贴一个前面贴过的有用的面试题:SQL查询中各个关键字的执行先后顺序: from > on> join > where > group by > with > having > select > distinct > order by > limit
下一部分是内置函数和复合查询的学习。