group by:按照某个字段或者某些字段进行分组。
having:对分组之后的数据进行再次过滤,having必须和group by一起用,且在group by后面。
比如person表如下(以下查询均基于此表):
1.group by 用法:对某个或某些字段进行分组
对sex字段进行分组时:
select sex from test.person group by sex;
也可对多个字段进行分组,比如对sex和age同时分组。此时我们的数据如下:
select sex, age from test.person group by sex, age;
从上面结果来看,某种意义上,是和distinct功能类似。
所以,在更多时候,group by是和分组函数(count、sum、avg、max、min) 联合使用的,需要注意的是,任何一个分组函数都是在group by执行结束后才会执行的。
eg,要查询男、女分组下的最大年龄,与max函数联合使用:
select sex,max(age) from test.person group by sex;
又或者,要查询男、女的人数,与count函数联合使用:
select sex, count(sex) from test.person group by sex;
2.接下来就要说having的使用了 :having是对分组数据的筛选。
eg,要查询人数大于1的分组,使用having筛选时,要写到group by后面
select sex from test.person group by sex having count(sex) > 1 ;
3.having和where的区别
先给一个简单的语句:
select sex from test.person where age < 21 group by sex;
执行结果如下:
由此可见,where语句是在分组之前执行的。总结where和having的区别就是:
having | where |
---|---|
1.分组之前执行 2.后面不能再跟max,min,count等聚合函数(因为where的执行顺序大于聚合函数) 3.过滤的是原表的数据,过滤掉的数据,不参与分组 | 1.分组之后执行 2.后面不能再跟max,min,count等聚合函数 3.过滤的是分组后的数据 4.支持所有WHERE操作符 |