命令队列应使用 chan *struct 而非 interface{},结构体需含 ID、超时、重试等上下文;停止时结合 context 取消、WaitGroup 与超时兜底;重试策略内置于 Task,避免统一中间件;并发消费需调优 GOMAXPROCS 并谨慎绑定 OS 线程。
chan + struct 组合,不是用接口模拟“命令模式”Go 没有传统 OOP 的抽象类或接口多态调度机制,硬套 Java 风格的 Command 接口 + execute() 方法,反而增加无谓的类型断言和反射开销。真实高吞吐场景下,应直接用带字段的结构体 + 通道传递,把“命令”当作数据而非行为载体。
chan 类型必须是具体结构体指针(如 chan *Task),避免复制大对象;切忌用 chan interface{}
json.RawMessage 或 map[string]any 延迟解析)select 控制退出与超时,不要用 for range 死循环阻塞type Task struct {
ID string `json:"id"`
Payload json.RawMessage `json:"payload"`
Timeout time.Duration `json:"timeout"`
Retries int `json:"retries"`
CreatedAt time.Time `json:"created_at"`
}
func NewTaskQueue() (chan Task, func()) {
q := make(chan Task, 1024)
done := make(chan struct{})
go func() {
for {
select {
case task := <-q:
if task == nil {
continue
}
ctx, cancel := context.WithTimeout(context.Background(), task.Timeout)
// 执行逻辑(例如调用 handler.Handle(ctx, task.Payload))
cancel()
case <-done:
return
}
}
}()
return q, func() { close(done) }
}
直接关闭 chan 会导致未处理任务丢失,而粗暴用 sync.WaitGroup 计数又容易因 panic 或阻塞导致 wait 永不返回。正确做法是结合 context 取消信号 + 手动计数 + 超时兜底。
sync.WaitGroup,每开始执行一个任务就 wg.Add(1),完成后 wg.Done()
wg.Wait() 等待,但必须加 time.AfterFunc 超时强制退出,防止卡死defer wg.Done() 外部做耗时操作(如写日志、发 HTTP),否则会拖慢整个 shutdown 流程不同命令对失败的容忍度差异极大:支付回调失败要立即重试,而日志上报失败可直接丢弃。把重试逻辑提到队列层(如“所有命令统一重试 3 次”)会破坏语义边界,也难以调试。
Task 结构体中嵌入 RetryPolicy 字段,例如:MaxRetries int、Backoff time.Duration、RetryOn []string(指定需重试的错误码)error 后,由消费者判断是否满足重试条件:若需重试,修改 task.Retries++ 并重新 send 到队列;否则记录错误并丢弃errors.Is(err, xxx) 做泛化判断——不同 handler 返回的 error 类型不一致,应约
*TemporaryError)并实现 IsTemporary() bool 方法runtime.GOMAXPROCS 和 OS 线程绑定当业务需要同时运行支付队列、通知队列、同步队列等多个独立通道时,若每个都起 10 个 goroutine 消费,可能因调度抖动导致延迟毛刺。这不是通道问题,而是 Go 运行时与操作系统线程交互的细节被忽略。
GOMAXPROCS 是 CPU 核心数,但高 IO 场景下建议设为 runtime.NumCPU() * 2,避免 goroutine 频繁抢占 M(OS 线程)runtime.LockOSThread() 将其 goroutine 绑定到特定 P,减少上下文切换;但必须成对使用 runtime.UnlockOSThread(),否则泄漏线程goroutines 数量,更要观察 go_gc_cycles_automatic_gc_cycles_total 和 go_sched_park_expires_total,它们更能反映调度压力真正难的不是把命令塞进 channel,而是让每个 Task 自己说清楚:“我该什么时候重试”“我失败了算不算事故”“我执行完要不要通知谁”。这些语义信息一旦散落在 handler 里,队列就退化成了裸管道。