Google Benchmark可自动多次运行、对抗编译器优化并支持多种测量方式,通过CMake集成后,编写基准测试函数并注册,即可获得可靠性能数据。
在C++开发中,准确评估代码片段的执行性能对优化关键路径至关重要。直接用std::chrono手动测时间容易受环境波动、编译优化和测量误差影响。Google Benchmark 是一个专为C++设计的微基准测试(microbenchmark)框架,能帮助开发者写出可靠、可重复的性能测试。
相比于手写计时代码,Google Benchmark 提供了以下优势:
最简单的集成方式是使用 CMake 和 FetchContent:
include(FetchContent) FetchContent_Declare( benchmark GIT_REPOSITORY https://github.com/google/benchmark.git GIT_TAG v1.8.4 ) FetchContent_MakeAvailable(benchmark)
然后在你的测试文件中链接 benchmark::benchmark:
add_executable(my_benchmarks bench_main.cpp) target_link_libraries(my_benchmarks benchmark::benchmark)
下面是一个对比 std::sqrt 和手动实现快速平方根的简单例子:
#include#include static void BM_StdSqrt(benchmark::State& state) { double x = 3.14159; for (auto _ : state) { volatile double result = std::sqrt(x); benchmark::DoNotOptimize(result); } } BENCHMARK(BM_StdSqrt); BENCHMARK_MAIN(); // 需要定义 main 函数入口
说明:
state 控制循环次数,for (auto _ : state) 是必须的结构volatile 或 DoNotOptimize 防止编译器把计算优化掉BENCHMARK 注册测试函数,BENCHMARK_MAIN() 提供默认 main你可以指定迭代次数、时间单位,甚至传入参数:
static void BM_VectorPushback(benchmark::State& state) {
for (auto _ : state) {
std::vector v;
for (int i = 0; i < state.range(0); ++i) {
v.push_back(i);
}
benchmark::DoNotOptimize(v.data());
benchmark::ClobberMemory(); // 模拟内存副作用
}
state.SetComplexityN(state.range(0));
}
BENCHMARK(BM_VectorPushback)->Range(1, 1<<16)->Complexity();
这里:
Range(1, 1 表示输入规模从 1 到 65536Complexity() 会尝试拟合时间复杂度,比如 O(N) 或 O(N²)ClobberMemory() 告诉编译器内存可能被修改,防止缓存优化你也可以用 Args({}) 传递具体参数组合,或用 Apply(...) 动态生成多个测试。
编译后直接运行可执行文件:
./my_benchmarks --benchmark_format=json > result.json输出包含:
建议在 release 模式下运行,并关闭不必要的后台进程,以减少噪声。
基本上就这些。Google Benchmark 让性能测试变得标准化,减少误判风险。只要记住:别让编译器“聪明”过头,合理设置循环和参数,结果才可信。