快速定位MySQL锁等待和死锁需查INNODB_TRX中LOCK WAIT事务、INNODB_LOCK_WAITS找阻塞源头,并开启innodb_print_all_deadlocks捕获死锁日志;注意SHOW ENGINE INNODB STATUS仅保留最后一次死锁详情。
高并发下出现响应变慢或事务超时,大概率是锁等待堆积或死锁触发。MySQL 本身不主动暴露锁状态,必须靠 INFORMATION_SCHEMA 和日志配合排查。
SELECT * FROM INFORMATION_SCHEMA.INNODB_TRX WHERE TRX_STATE = 'LOCK WAIT';
SELECT * FROM INFORMATION_SCHEMA.INNODB_LOCK_WAITS;结合
blocking_trx_id 关联 INNODB_TRX 表里的 TRX_ID 找到持有锁的事务innodb_print_all_deadlocks = ON 后,死锁信息会写入错误日志(error_log),不是 slow log 或 general logSHOW ENGINE INNODB STATUS\G 只保留最近一次死锁详情,不适合监控场景不是所有 UPDATE 或 DELETE 都只锁匹配行;索引类型、查询条件是否走索引、是否含范围条件,都会影响锁粒度。
WHERE 条件 → 全表扫描 → 每行加记录锁 + 间隙锁,等效于隐式表锁SELECT ... FOR UPDATE 在唯一索引上等值查询 → 只锁匹配行;但用非唯一索引或范围(如 age > 25)→ 锁住对应间隙,可能阻塞其他插入INSERT ... ON DUPLICATE KEY UPDATE 会先加插入意向锁,再尝试获取唯一键上的记录锁;若多个事务同时插入相同 ON DUPLICATE 键,极易因间隙锁重叠导致死锁UPDATE 后未及时 COMMIT 或 ROLLBACK → 锁长期持有,放大等待链死锁无法完全杜绝,但可通过访问顺序统一、事务粒度控制和隔离级别降级大幅降低概率。
orders 再 order_items),避免交叉加锁innodb_lock_wait_timeout 设为较小值(如 10–30 秒),让锁等待早失败,而不是无限挂起REPEATABLE READ 降到 READ COMMITTED:后者不启用间隙锁(除外键和唯一检查),显著减少锁冲突直接 KILL 事务 ID 是最快止血方式,但治标不治本;更关键的是拿到现场快照,还原路径。
SELECT * FROM INFORMATION_SCHEMA.INNODB_TRX ORDER BY TRX_STARTED DESC LIMIT 10;查看最近活跃事务及其 SQL(
TRX_QUERY 字段)EXPLAIN FORMAT=TRADITIONAL 确认是否走了预期索引;必要时加 FORCE INDEX 固定执行计划shard_key 分散更新压力)或引入缓存层暂存中间状态真正难处理的从来不是死锁本身,而是那些没被日志捕获、自动回滚后无声消失的锁等待——它们持续消耗连接池,最终拖垮整个数据库。所以监控不能只盯死锁数,更要盯 INNODB_ROW_LOCK_TIME_AVG 和 Threads_running 的突增。