不能直接用 net/http 做服务注册,因为注册与发现本质是需持续状态同步的问题,涉及租约续期、长连接监听、健康检查剔除等机制,仅靠单次 HTTP 请求无法保障一致性。
net/http 做服务注册因为注册与发现本质是「状态同步」问题,不是单次 HTTP 请求能解决的。你发一个 POST /register 到某中心,不代表它真被其他服务看见了——中间可能网络抖动、节点宕机、TTL 过期未续租。真正的注册中心(如 Consul、etcd、Nacos)必须提供:带租约的 key-value 存储、监听变更的长连接、健康检查自动剔除机制。自己用 http.ServeMux 模拟只会漏掉心跳续期、watch 失败重连、多实例冲突这些关键逻辑。
consul-api 注册服务时必须设置的三个字段Consul 官方 Go SDK 是 github.com/hashicorp/consul/api,注册服务时 api.AgentServiceRegistration 结构体里,这三个字段不填或填错会导致服务不可见:
Name:服务名,不能含下划线(_),否则 Consul UI 不显示,只支持字母、数字、短横线ID:必须全局唯一,建议拼成 "service-name-hostname-port",比如 "user-service-laptop-8080";重复 ID 会导致后注册覆盖前注册Check:至少配一个健康检查,常用 &api.AgentServiceCheck{TTL: "10s"},然后你的服务得每 9 秒调一次 client.Agent().PassTTL(),否则 10 秒后服务变 critical
reg := &api.AgentServiceRegistration{
Name: "order-service",
ID: "order-service-server1-9001",
Port: 9001,
Check: &api.AgentServiceCheck{
TTL: "10s",
},
}
err := client.Agent().ServiceRegister(reg)
srv, _, err := client.Health().Service("user-service", "", false, nil) 的第三个参数含义这个 passingOnly 参数控制是否只返回健康的服务实例。设为 true 时,Consul 只返回状态为 passing 的节点;设为 false,会把 warning 和 critical 的也返回——这在调试阶段有用,但生产环境必须设 true,否则你的负载均衡器可能把请求打到已宕机的实例上。
另外注意:"" 是 tag 参数,如果服务注册时加了 tag(比如 Tags: []string{"v2", "canary"}),这里可以传 "v2" 来过滤;传空字符串表示不按 tag 过滤。
etcd 没有内置服务发现模型,所有逻辑得自己补全。核心难点不在注册,而在维持:
client.Grant(ctx, ttl) 创建租约,再用 client.KeepAlive() 启动协程续期,否则租约到期键自动删除client.Watch() 返回的 WatchChan 是单次的,收到 ErrCompacted 或断连后必须手动重建 watch,且要从最新 rev 继续,否则丢变更/services/user-service/instance-1),但读取时得自己反序列化,Consul 的 ServiceEntry 是现成结构体,etcd 是裸字节
除非你明确需要 etcd 的强一致性或已有集群,否则 Consul/Nacos 开箱即用的健康检查、DNS 接口、Web UI 更省事。
Consul 的 TT
L 续期和 etcd 的 lease keepalive 都容易写成「只调一次就不管了」,实际必须长期运行 goroutine 持续保活,这是最常被忽略的点。