必须使用 b.N 循环,Go 的 Benchmark 函数通过 b.N 控制重复执行次数以获得稳定统计值;若未将待测逻辑置于循环内,基准测试结果无效。
b.N 循环,基准测试就等于没测Go 的 Benchmark 函数不是“执行一次看耗时”,而是靠 b.N 控制重复次数来压出稳定统计值。如果你把待测逻辑直接写在函数体里、没包进 for i := 0; i ,那 go test -bench=. 实际只运行了一次,但报告的 ns/op 是拿总时间除以一个可能高达上亿的 b.N——结果就是 0.3 ns/op 这种假高光数据,毫无意义。
func BenchmarkFoo(b *testing.B) { doWork() }(doWork() 只跑一次)func BenchmarkFoo(b *testing.B) { for i := 0; i
b.ResetTimer() 切掉准备时间b.ResetTimer() 不调,初始化开销就混进性能数字里比如你要测排序 10 万元素切片的性能,却在 for 循环里每次生成新切片、填充随机数——这些内存分配和随机计算全被算进 ns/op,你其实测的是“生成+排序”,不是“纯排序”。真实瓶颈可能根本不在排序算法本身。
[]byte、加载配置、预热缓存、初始化 map 等b.ResetTimer()
b.StopTimer() + b.StartTimer() 精确掐段b.ReportAllocs(),内存压力就完全看不见ns/op 再低也没用,如果每次操作都分配 1KB 内存,GC 就会拖垮服务。而 Go 默认不报告内存指标,allocs/op 和 B/op 全是 0——这不是没分配,是没开报告。
b.ReportAllocs(),放在函数开头即可strings.Builder{} 每次新建、&
Struct{} 在循环里、make([]byte, n)(应改用 make([]byte, 0, n))-benchmem 参数后,输出里出现类似 500 B/op 2 allocs/op 才算生效如果你的被测函数返回一个值,但这个值没被任何地方使用,Go 编译器大概率直接删掉整个调用链。你看到的 0.5 ns/op,其实是空循环的开销。
ns/op 异常低(B/op 为 0、不同算法差距极小var blackhole int; blackhole = compute()
runtime.KeepAlive(compute())(需 import runtime)go build -gcflags="-l" 关闭内联,再跑 benchmark,若结果突变,说明原来被优化了最常被忽略的不是某行代码怎么写,而是环境本身——CPU 频率缩放、后台进程、笔记本电源模式,都能让 ns/op 波动 ±30%。真要定位回归,得关掉 Turbo Boost、禁用其他应用、跑三次以上取平均,否则你调优的只是噪声。