子查询优化需区分相关与非相关类型:非相关只执行一次,相关则每行重算;优先转为非相关、善用IN/EXISTS/JOIN、以CTE或派生表解耦嵌套、避免SELECT*并验证执行计划。
子查询优化的关键在于理解其执行逻辑,并根据场景选择改写方式。不是所有子查询都需要改写,但不当写法会显著拖慢查询性能,尤其在大数据量或嵌套较深时。
非相关子查询(inner query不依赖outer query)只执行一次,结果可缓存复用;相关子查询(如 WHERE salary > (SELECT AVG(salary) FROM emp e2 WHERE e2.dept = e1.dept))则对主表每行都重新执行,开销呈线性增长。
IN 和 EXISTS 在多数情况下逻辑一致,但优化器处理方式不同:IN 会先执行子查询生成结果集再做哈希匹配;EXISTS 只判断是否存在,找到即停,适合子查询结果集大而主表小的场景;JOIN 更利于利用索引和并行,且便于后续扩展条件。
深层嵌套(如 SELECT * FROM (SELECT ... FROM (SELECT ...) t1) t2)会让优化器难以生成最优计划,也降低可读性和维护性。CTE(WITH 子句)或内联视图(派生表)可将逻辑分层,帮助优化器更好估算行数和选择连接顺序
。
子查询里写 SELECT * 不仅带来多余列传输开销,还可能干扰优化器选择索引——尤其当子查询用于 EXISTS 或 IN 时,只需判断存在性或某字段值,却加载了整行数据。
不复杂但容易忽略。改写前先看执行计划,确认瓶颈真在子查询本身,而不是缺失索引或统计信息过期。