Golang微服务异步通信首选NATS JetStream,因其轻量、Go原生友好且开箱支持持久化;次选RabbitMQ,具备强ACK、死信队列和灵活路由;Kafka仅用于事件回放或对接大数据场景;避免用Redis Streams作核心消息通道,因其不保证At-Least-Once投递。
直接说结论:Golang微服务异步通信,首选 NATS JetStream(轻量、Go原生友好、开箱持久化),次选 RabbitMQ(强ACK+死信+路由灵活),Kafka 仅当需要事件回放或对接大数据栈时才上;别用纯 Redis Streams 做核心业务消息通道,它不保证 At-Least-Once 投递。
HTTP 调用是同步阻塞的——订单服务调库存服务,库存一卡,订单接口就超时。而消息队列把“我做了”变成“我发了”,下游处理慢、宕机、升级,都不影响上游返回成功。这不只是性能问题,更是系统韧性的分水岭。
orders.created 主题,库存服务按自身吞吐能力慢慢消费,不会被瞬时压垮OrderCreatedEvent;新增一个审计服务?加个订阅就行,零代码改订单服务很多人写完 js.Publish("order.created", data) 就以为完事了,但网络抖动、JetStream 拒绝、序列化失败都会静默失败。真正可靠的发送必须带错误分支和兜底。
err:NATS JetStream 的 Publish() 返回 error,不是 nil 就代表没发出去,必须记录 log.Error("failed to publish order.created", "err", err)
pending_events 表,由后台 goroutine 定期扫描重发(注意加唯一索引防重复)recover() 包裹)消息可能重复(网络重传)、乱序(多消费者实例)、延迟(几秒到几分钟),消费者逻辑若没幂等,同一笔订单扣两次库存、发两封邮件就是常态。
order_id,处理前查 DB:SELECT COUNT(*) FROM inventory_locks WHERE order_id = ?,存在则直接 Ack() 跳过EX 300(5分钟过期),否则 Redis 故障会导致永久锁死;别用无过期时间的 keymsg.Ack(false) 或 NATS 的 msg.Ack() 写在数据库 commit 之后,不能提前max_deliver = 5,第 6 次自动进 $JS.API.CONSUMER.MSG.NAK 死信流;别让消息无限重试占满内存用 map[string]interface{} 解析 JSON 是自找麻烦——字段名拼错、类型错("total": "99.9" 字符串 vs float64)、缺字段全靠 runtime panic 报错。
type OrderCreatedEvent struct {
OrderID string `json:"order_id"`
UserID int64 `json:"user_id"`
Total float64 `json:"total"`
Timestamp int64 `json:"timestamp"`
Version string `json:"version"` // 必加,v1 → v2 升级时兼容
}json.Unmarshal(data, &event) + 显式错误检查,失败就 Nack() 进重试队列,别让脏数据污染下游events.order.created.v1,别用 order_created 这种裸名;升
最容易被忽略的一点:消息队列不是万能胶布。如果两个服务间有强事务语义(比如转账必须同时更新 A 账户扣款+B 账户入账),消息队列只能做最终一致性,得靠 Saga 模式或本地消息表补救;想靠发个消息就解决分布式事务,迟早掉坑里。