合理设置超时与重试是保障接口稳定的关键:连接超时设1~3秒、读取超时3~10秒;重试采用指数退避、限3~5次,仅针对5xx等临时错误;配合熔断降级、结构化日志与监控。
调用外部接口时,网络波动、服务端临时过载或限流都可能导致请求失败。合理设置超时与重试,是保障接口调用稳定性的关键,不是越多次重试越好,也不是超时越长越安全。
单次请求应明确区分连接超时(connect timeout)和读取超时(read timeout)。连接超时建议设为1~3秒,防止卡在建连阶段;读取超时建议3~10秒,视接口预期响应时间而定。例如使用 requests 时可这样写:
requests.get(url, timeout=(2, 5)) —— 前数为连接超时,后数为读取超时timeout=10),否则连接和读取共用同一时限,易掩盖真实问题无条件重试可能加剧服务端压力,也容易触发限流。推荐使用指数退避(exponential backoff)+ 最大重试次数限制:
@retry(stop=stop_after_attempt(3), wait=wait_exponential(multiplier=1, min=1, max=10))
当某接口连续失败达到阈值(如 5 分钟内失败率超 50%),应自动熔断一段时间(如 60 秒),期间直接返回默认值或缓存结果,不发起真实调用:

每次重试、熔断、超时都应记录结构化日志,包含关键字段: