SQL分区表是逻辑上一张表、物理上按规则分散存储,适合数据有明显时间或范围特征且查询常带条件过滤的场景:日志订单监控按时间、用户按地区或租户、历史数据需快速归档、单表超千万行IO压力大。
SQL分区表不是把数据“拆成多张表”,而是让一张逻辑表在底层按规则分散存储,查询时数据库能自动跳过无关分区,大幅提升性能。
核心是“数据有明显时间或范围特征,且查询常带条件过滤”:
注意:语法细节因数据库而异,以下为通用逻辑示意
PARTITION BY RANGE (YEAR(create_time)) (
PARTITION p_2025 VALUES LESS THAN (2025),
PARTITION p_2025 VALUES LESS THAN (2025),
PARTITION p_2025 VALUES LESS THAN (2025)
)
PARTITION BY LIST (province_code) (
PARTITION p_beijing VALUES IN (110000),
PARTITION p_shanghai VALUES IN (310000),
PARTITION p_guangdong VALUES IN (440000, 440100, 440300)
)
PARTITION BY HASH (user_id) PARTITIONS 8
分区不是一劳永逸,得配合日常管理:
PARTITION BY子句,且分区字段必须是主键/唯一索引的一部分(MySQL要求)ALTER TABLE ... ADD PARTITION,不能跨版本自动扩展(需手动加)ALTER TABLE ... DROP PARTITION p_2025,秒级完成,不走事务日志EXPLAIN PARTITIONS SELECT ...看执行计划中的partitions列分区表用不好反而拖慢系统:
、CPU或磁盘瓶颈partitioning扩展基本上就这些。分区是优化手段,不是银弹。先确认瓶颈真在IO或扫描范围,再选对字段、定好策略、配上运维动作,才能真正见效。