17370845950

如何在mysql中使用索引优化UNION查询
优化UNION查询需确保各子查询使用索引,优先用UNION ALL减少去重开销,并在每个SELECT中通过WHERE和LIMIT尽早过滤数据,避免全表扫描。

在MySQL中优化UNION查询的性能,索引的使用非常关键。UNION操作会合并两个或多个SELECT结果集,并自动去重(UNION ALL不去重),如果每个子查询没有合理利用索引,数据库可能执行全表扫描,导致性能下降。

理解UNION查询的执行机制

MySQL在执行UNION时,会分别运行每个SELECT语句,将结果放入临时表,最后进行去重和排序(仅UNION,UNION ALL不排序)。因此,提升每个子查询的效率是优化的关键。

  • 每个SELECT应尽可能通过索引快速定位数据
  • 避免在大表上无索引扫描后合并
  • 临时表可能使用磁盘存储,影响速度

为每个子查询建立合适的索引

确保每个UNION中的SELECT都能使用索引,尤其是WHERE、JOIN、ORDER BY涉及的列。

  • 若查询基于status字段筛选,应在各表的status列上建立索引
  • 复合查询条件应考虑组合索引,如 (status, created_at)
  • 覆盖索引可避免回表,提升速度

例如:

-- 查询1
SELECT id, name FROM users WHERE status = 1;
-- 查询2  
SELECT id, name FROM users_archived WHERE status = 1;

-- 优化:在 users(status) 和 users_archived(status) 上建立索引 CREATE INDEX idx_status ON users(status); CREATE INDEX idx_status_archive ON users_archived(status);

优先使用 UNION ALL

如果业务允许重复数据,用UNION ALL代替UNION。它不会去重,也不隐式排序,性能更好。

  • UNION需要额外的排序和去重步骤,常导致临时表写入磁盘
  • UNION ALL直接追加结果,减少开销

示例:

-- 更高效
SELECT id FROM t1 WHERE condition
UNION ALL
SELECT id FROM t2 WHERE condition;

限制结果集并尽早过滤

在每个子查询中使用LIMIT和精确的WHERE条件,减少参与UNION的数据量。

  • 提前过滤无效数据,降低索引扫描范围
  • 若最终只需前N条,可在子查询中先LIMIT再合并

例如:

(SELECT id FROM logs_2025 WHERE user_id = 100 LIMIT 10)
UNION ALL
(SELECT id FROM logs_2025 WHERE user_id = 100 LIMIT 10)
LIMIT 10;

基本上就这些。关键是让每个子查询走索引,避免全表扫描,同时根据场景选择UNION或UNION ALL,控制数据量。