使用-benchmem可查看基准测试中每次操作的内存分配字节数(B/op)和分配次数(allocs/op),重点关注后者以减少堆上逃逸;避免字符串与字节切片互转引发的额外分配,优先复用sync.Pool或使用unsafe包(仅限只读可控场景);通过逃逸分析优化变量驻留位置,并预分配slice/map容量以降低扩容开销。
运行基准测试时加上 -benchmem 参数,能立刻看到每次操作的平均内存分配字节数(B/op)和分配次数(allocs/op)。比如:
go test -bench=Sum -benchmem
输出类似:BenchmarkSum-8 1000000 1245 ns/op 16 B/op 2 allocs/op。重点关注后两项——越小越好,尤其是 allocs/op,它直接反映逃逸到堆上的对象数量。
在字符串处理中,string([]byte) 和 []byte(string) 都会触发新内存分配。如果只是临时读取,优先用 unsafe.String(Go 1.20+)或 unsafe.Slice 绕过拷贝,但要注意仅限**只读且生命周期可控**的场景。更安全的做法是复用 sync.Pool 管理临时切片:
var bufPool = sync.Pool{New: func() any { return make([]byte, 0, 256) }}
b := bufPool.Get().([]byte) 获取,用完 bufPool.Put(b[:0])
[:0]),否则下次 Get 可能拿到脏数据Go 编译器会自动做逃逸分析,但某些写法会“逼”变量上堆。常见诱因包括:
return &x)fmt.Println(x) 中 x 是非接口值,但底层可能触发分配)用 go tool compile -gcflags="-m -l" 查看逃逸详情。加 -l 禁用内联,让分析更清晰。目标是让高频路径上的小结构体(如 type Point struct{X,Y int})全程驻留栈中。
slice 的 appen
d 在容量不足时会重新分配底层数组,产生额外 allocs/op。基准测试里尤其明显。例如构建固定长度结果:
res := []int{} → 后续循环 append(res, x)
res := make([]int, 0, n),其中 n 是已知最终长度make([]T, 0, maxEstimate),比默认 0 容量更稳对 map 也同理:make(map[K]V, n) 预分配桶,减少 rehash 次数。
基本上就这些。内存优化不是一味追求零分配,而是聚焦高频路径、压低 allocs/op、控制对象生命周期。跑一遍 -benchmem,再结合逃逸分析,问题通常一眼可见。