Go中HTTP重试需区分可重试错误(5xx、408、429、网络超时/拒绝)与不可重试错误(400/401/403/404等),结合嵌套context控制单次与总超时,采用指数退避+抖动,并封装RetryableClient避免资源泄漏。
在Go中实现HTTP请求重试,核心是用http.Client配合自定义RoundTripper或手动控制重试逻辑,关键在于区分可重试错误(如网络超时、连接拒绝)和不可重试错误(如400、401),并避免无节制重试。
不是所有错误都该重试。HTTP状态码中,5xx(服务端错误)通常可重试;4xx中除408(Request Timeout)、429(Too Many Requests)外多数代表客户端问题,不应重试。网络层错误如net.OpError、url.Error(含i/o timeout、connection refused)属于典型可重试场景。
errors.Is(err, context.DeadlineExceeded) 或用strings.Contains(err.Error(), "timeout")
resp.StatusCode >= 500 && resp.StatusCode ,或显式允许的4xx(如429)
每次重试应有独立超时,同时整个重
试过程也需总时限约束,防止无限等待。推荐用嵌套context.WithTimeout:外层控总耗时,内层控单次请求。
ctx, cancel := context.WithTimeout(context.Background(), 30*time.Second)
req = req.WithContext(context.WithTimeout(ctx, 5*time.Second))
cancel()避免goroutine泄漏连续重试会加剧服务压力,应加入指数退避(exponential backoff)。简单做法是每次失败后等待baseDelay * 2^attempt,再加随机抖动防“重试风暴”。
time.Sleep(time.Duration(rand.Int63n(int64(jitter))) + base)
if ctx.Err() != nil { return nil, ctx.Err() }
不建议修改全局http.DefaultClient,而是封装一个带重试能力的工具函数或结构体:
RetryableClient结构,含MaxRetries、BaseDelay、Client *http.Client
Do(req *http.Request) (*http.Response, error)方法,内部执行带退避的循环ShouldRetry func(*http.Response, error) bool,提升灵活性不复杂但容易忽略细节,比如忘记关闭响应Body、未重置请求Body(POST时需req.Body = io.NopCloser(bytes.NewReader(data))),这些都会导致重试失败或资源泄漏。