索引选择性指索引列不同值数量与总行数的比值,理想接近1。高选择性列(如主键)提升查询效率,低选择性列(如性别)单独建索引效果差。组合索引应将高选择性列前置,遵循最左前缀原则,覆盖常用查询条件及字段以减少回表。通过EXPLAIN分析执行计划、查看information_schema.statistics中基数、启用慢查询日志监控索引使用情况,避免无效索引。索引设计需结合数据分布与查询模式,注重精准而非数量。
在MySQL中,索引选择性(Index Selectivity)是影响查询性能的关键因素之一。选择性越高,意味着索引列的唯一值越多,重复值越少,数据库就能更高效地定位目标数据。优化索引选择性可以显著提升查询效率,减少全表扫描的发生。
索引选择性是指索引列中不同值的数量与总行数的比值,计算公式为:
选择性 = 不同值的数量 / 总行数
理想情况下,选择性越接近1越好,比如主键的选择性就是1。如果选择性很低(例如性别字段只有“男”和“女”),即使建了索引,优化器也可能放弃使用,因为扫描索引再回表的成本可能高于直接全表扫描。
选择高选择性的列作为索引起点能有效提升性能。
避免对低基数列单独建索引:如状态、性别等字段,单独建索引效果差。通过组合多个列来提升整体选择性。
例如,有查询:
SELECT name, email FROM users WHERE city = 'Beijing' AND age > 25;
可以创建索引:
CREATE INDEX idx_city_age_name_email ON users(city, age, name, email);
定期检查索引是否被实际使用,避免无效索引拖累写入性能。
基本上就这些。关键是理解数据分布,结合查询模式设计高效索引,持续观察执行效果,及时调整策略。索引不是越多越好,而是越准越好。