SQL窗口函数的核心是不压缩行数、保留明细并按逻辑窗口动态计算,由OVER标识,需配合PARTITION BY定义分组边界、ORDER BY确定计算顺序,必要时用ROWS/RANGE限定物理或值范围。
SQL窗口函数的核心在于不压缩行数、保留明细、按逻辑“窗口”动态计算。OVER 是它的语法标识,PARTITION BY 和 ORDER BY 是两个最常用也最关键的子句,它们共同决定了“在哪一组、按什么顺序、对哪些行做计算”。
所有窗口函数(如 SUM()、ROW_NUMBER()、LAG())必须跟 OVER(),否则就退化为普通聚合或标量函数。比如:
SUM(salary) → 对整张表求和,只返回一行SUM(salary) OVER() → 对整张表求和,但为每一行都复制这个总和值,行数不变SUM(salary) OVER(PARTITION BY dept) → 按部门分组求和,每行显示其所在部门的总薪资它把数据切分成多个独立计算单元,每个单元内单独执行窗口函数。没有 PARTITION BY,整个结果集就是一个大分区。
PARTITION BY user_id(按用户算累计消费)、PARTITION BY product_category(按品类算排名)PARTITION BY region, year,适合多维分析场景它不仅排序,更直接影响窗口函数的行为逻辑。尤其在涉及“累计”“偏移”“排名”类函数时,缺了 ORDER BY 会报错或结果异常。
ROW_NUMBER() OVER(PARTITION BY dept ORDER BY salary DESC) 才能给每个部门内员工按薪资从高到低编号SUM(sales) OVER(ORDER BY date ROWS B
ETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) 实现严格按时间顺序的滚动累计当需要控制参与计算的具体行集合时(比如只看最近3条记录),就要用 ROWS 或 RANGE 框架。它们必须配合 ORDER BY 使用。
ROWS BETWEEN 2 PRECEDING AND CURRENT ROW 表示当前行及前两行RANGE BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW 在薪资相同时会把同薪者全纳入窗口UNBOUNDED PRECEDING(分区第一行)、CURRENT ROW(当前行)、UNBOUNDED FOLLOWING(分区最后一行)