汇总数据
本文介绍什么是SQL的聚集函数以及如何利用它们汇总表的数据。
聚集函数
我们经常需要汇总数据而不用把它们实际检索出来,为此MySQL提供了专门的函数。使用这些函数,MySQL查询可用于检索数据,以便分析和报表生成。这种类型的检索例子有以下几种。
- 确定表中行数(或者满足某个条件或包含某个特定值的行数)。
- 获得表中行组的和。
- 找出表列(或所有行或某些特定的行)的最大值、最小值和平均值。
上述例子都需要对表中数据(而不是实际数据本身)汇总。因此,返回实际表数据是对时间和处理资源的一种浪费(更不用说带宽了)。为方便这种类型的检索,MySQL给出了5个聚集函数,见下表。
函数 | 说明 |
---|---|
AVG() | 返回某列的平均值 |
COUNT() | 返回某列的行数 |
MAX() | 返回某列的最大值 |
MIN() | 返回某列的最小值 |
SUM() | 返回某列值之和 |
【示例】查询employees表中所有员工的平均工资
SELECT AVG(salary) as avg_salary
FROM employees;
运行结果:
AVG()只能用来确定特定数值列的平均值,而且列名必须作为函数参数给出。为了获得多个列的平均值,必须使用多个AVG()函数。
AVG()函数忽略列值为NULL的行。
【示例】查询employees表中的员工个数
SELECT COUNT(*) as total
FROM employees;
运行结果:
外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传
COUNT()函数有两种使用方式。
- 使用COUNT(*)对表中行的数目进行计数,不管表列中包含的是空值(NULL)还是非空值。
- 使用COUNT(column)对特定列中具有值的行进行计数,忽略NULL值。
虽然MAX()一般用来找出最大的数值或日期值,但MySQL允许将它用来返回任意列中的最大值,包括返回文本列中的最大值。在用于文本数据时,如果数据按相应的列排序,则MAX()返回最后一行。MIN()同理
聚集不同的值
下面将要介绍的聚集函数的DISTINCT的使用
以上5个聚集函数都可以如下使用:
- 对所有的行执行计算,指定ALL参数或不给参数(因为ALL是默认行为);
- 只包含不同的值,指定DISTINCT参数。
【示例】查询employees表中所有员工的平均工资,每个数值只计算一次
SELECT AVG(DISTINCT salary) as avg_salary
FROM employees;
运行结果可以看到,在使用了DISTINCT后,此例子中的avg_salary比较高,因为有多个物品具有相同的较低价格。:
SELECT语句可以包含多个聚集函数
【示例】查询employees表中所有员工的平均工资、最大工资、最小工资
SELECT AVG(salary) as avg_salary,
MAX(salary) as max_salary,
MIN(salary) as min_salary
FROM employees;
运行结果: