Go基准测试需确保条件一致:相同Go版本、构建参数、禁用CPU频率缩放、-benchmem统计内存、-count=5取中位数;Benchmark函数须防优化干扰、固定输入、正确使用b.ResetTimer和//go:noinline;用benchstat比对并关注p值与geomean提升。
go test -bench 跑出可比的基准测试结果Go 自带的 testing.B 是做性能对比最直接、最可信的方式。关键不是“跑一次”,而是让优化前后的测试在相同条件下运行,否则数字毫无意义。
-benchmem 同时开启内存分配统计,避免只看耗时忽略 GC 压力sudo cpupower frequency-set -g performance),否则 BenchmarkFoo-8 的结果波动可能达 ±20%GOOS=linux GOARCH=amd64 go test),跨平台或跨版本对比无效-count=5 取中位数,例如:go test -bench=^BenchmarkParse$ -benchmem -count=5
Benchmark 函数要注意什么很多初学者写的 benchmark 看似在测逻辑,实则测的是编译器优化或空循环——比如忘记调用 b.ReportAllocs() 或误用 b.N。
b.ResetTimer() 必须放在初始化代码之后、主循环之前,否则把 setup 时间也算进耗时//go:noinline 注释),否则优化前后可能走不同路径fmt.Sprintf),否则引入非目标变量for i := 0; i 里重复 json.Unmarshal 以外的 map 构造或日志打印
func BenchmarkParseJSON(b *testing.B) {
data := []byte(`{"name":"alice","age":30}`)
b.ResetTimer()
for i := 0; i < b.N; i++ {
var u User
json.Unmarshal(data, &u) // ← 这才是唯一被测行为
}
}
benchstat 比肉眼更可靠直接看 12.42 ns/op → 9.11 ns/op 容易误判——得确认是否显著。Go 官方工具链提供了 benchstat(需 go install golang.org/x/perf/cmd/benchstat@latest)。
go test -bench=Parse -count=10 > old.txt 和 > new.txt
benchstat old.txt new.txt,它会自动做 t-test 并标出 p 值和提升百分比geomean: 1.37x faster 且 p=0.0002,才算可信提升;若写 0.98x (±2.1%) 就基本没变old.txt 和 new.txt 的 BenchmarkXXX-8 后缀不一致(比如一个跑在 8 核、一个跑在 4 核),benchstat 会拒绝比较哪怕 benchmark 写对了,真实性能差异也可能被底层机制掩盖。
立即学习“go语言免费学习笔记(深入)”;
map[string]int)会让 gc pause 成为主因,此时看 B/op 比 ns/op 更关键runtime.GOMAXPROCS(1) 未锁定)可能因 goroutine 抢占导致抖动,建议显式设置 runtime.GOMAXPROCS(1) 再测单核场景unsafe.Offsetof 检查字段布局,必要时手动填充对齐ns/op 变差但 B/op 大幅下降,说明你用空间换时间成功了——这在内存受限服务里反而是正向收益ns/op 数字稳定只是起点;真正要盯住的是 allocs/op 是否增长、GC 频次是否上升、以及在线上流量下 P99 延迟是否同步改善。