GROUP BY用于按字段分组数据并结合聚合函数进行统计分析,常见场景包括统计数量、计算总和或平均值、多字段分组及使用HAVING过滤分组结果,需注意非聚合字段必须出现在GROUP BY中,可配合ORDER BY排序,提升数据分析效率。
在MySQL数据库中,GROUP BY 是用于对查询结果按一个或多个字段进行分组的关键字。它通常与聚合函数(如 COUNT、SUM、AVG、MAX、MIN)配合使用,以便对每个分组进行统计分析。
基本语法结构
GROUP BY 的基本语法如下:
SELECT 字段1, 聚合函数(字段2)
FROM 表名
WHERE 条件(可选)
GROUP BY 字段1;
执行顺序:FROM → WHERE → GROUP BY → SELECT。这意味着 WHERE 是在分组前过滤数据,而 HAVING 用于对分组后的结果进行筛选。
常见使用场景
以下是一些典型的 GROUP BY 使用示例:
-
统计每类数据的数量:比如统计每个部门的员工人数。
SELECT department, COUNT(*) AS employee_count
FROM employees
GROUP BY department;
-
计算每组的总和或平均值:例如计算每个销售人员的销售额总和。
SELECT sales_person, SUM(amount) AS total_sales
FROM sales
GROUP BY sales_person;
-
结合多个字段分组:比如按年份和月份统计订单数量。
SELECT YEAR(order_date) AS year, MONTH(order_date) AS month, COUNT(*) AS order_count
FROM orders
GROUP BY YEAR(order_date), MONTH
(order_date);
使用 HAVING 过滤分组结果
WHERE 无法直接用于过滤聚合函数的结果,这时需要使用 HAVING。
SELECT department, AVG(salary) AS avg_salary
FROM employees
GROUP BY department
HAVING AVG(salary) > 5000;
这条语句会返回平均工资高于5000的部门。
注意事项
使用 GROUP BY 时需要注意以下几点:
- SELECT 中出现的非聚合字段必须出现在 GROUP BY 子句中,否则会报错(在 SQL 模式为 ONLY_FULL_GROUP_BY 时)。
- GROUP BY 后可以跟多个字段,表示多级分组。
- 排序可以用 ORDER BY 配合 GROUP BY 使用,例如按统计结果从高到低排列。
SELECT department, COUNT(*) AS count
FROM employees
GROUP BY department
ORDER BY count DESC;
基本上就这些。掌握 GROUP BY 的用法,能有效提升数据分析能力,在报表生成、业务统计等场景中非常实用。