事务失败不能盲目重试,需区分可重试(如死锁、超时)与不可重试错误(如主键冲突),结合事务边界、保存点、补偿机制和幂等设计构建可靠容错体系。
SQL事务失败时,不能只靠“重试”硬扛,关键得看失败原因、事务边界和数据一致性要求。盲目重试可能造成重复扣款、状态错乱或死锁加剧。
不是所有SQL错误都适合重试:
避免在SQL语句里写重试逻辑,应在服务层控制:
长事务中部分步骤失败,不必全滚,可用SAVEPOINT精细控制:
BEGIN TRANSACTION; INSERT INTO orders (...) VALUES (...); -- 步骤1 SAVEPOINT order_saved;
UPDATE inventory SET stock = stock - 1 WHERE id = 123; -- 步骤2,可能失败 -- 若此处报错,只回滚到 savepoint,保留订单插入 ROLLBACK TO SAVEPOINT order_saved;
-- 后续可补发通知、走补偿流程等 COMMIT;
注意:Savepoint不能跨事务,且不同数据库语法略有差异(MySQL/PostgreSQL支持良好,Oracle需用PL/SQL块)。
对无法简单重试的关键操作(如支付、发券),采用“正向执行 + 异步校对 + 补偿”模式:
基本上就这些。重试不是银弹,它只是容错链条中的一环——前面要判错因,中间要控边界,后面要有兜底。设计时多问一句:“如果重试3次还失败,系统还能自愈吗?”