Python 性能分析工具 cProfile 使用方法_技术教程_南昌市广照天下广告策划有限公司

Python 性能分析工具 cProfile 使用方法

cProfile可快速定位慢函数，核心看tottime字段；用python -m cProfile启动或代码中嵌入Profile()控制启停，配合pstats排序分析，但无法检测I/O、C扩展及多线程耗时。

怎么用 cProfile 快速定位慢函数

cProfile 是 Python 自带的确定性性能分析器，不用装额外包，适合快速抓出耗时最多的函数。它统计的是每个函数被调用次数、总耗时（tottime）、每次调用平均耗时（percall）以及累计耗时（cumtime）——真正要盯的是 tottime，它排除了子调用开销，反映函数自身逻辑的真实瓶颈。

最简启动方式：

python -m cProfile your_script.py

如果脚本需要参数，直接跟在后面即可；想把结果存成文件便于后续排序或过滤，加 -o：

python -m cProfile -o profile.out your_script.py

tottime 高 ≠ 问题一定在该函数里，可能它调用了没 profile 到的 C 扩展（比如 NumPy 内部）
避免在 Jupyter 中直接用 %prun 分析整个 notebook：它会把所有 cell 合并统计，掩盖单个函数的真实上下文
若脚本启动快但某段逻辑慢（如处理特定输入），不要 profile 全流程，改用代码内嵌方式，只测关键段

如何在代码中精准 profile 某段逻辑

用 cProfile.Profile() 实例手动控制启停，比全局命令更灵活，尤其适合反复运行的函数或 Web 请求中的 handler。

示例：

import cProfile
import pstats
profiler = cProfile.Profile()
profiler.enable()
这里放你想测的代码，比如：
result = some_heavy_function(data)
profiler.disable()
profiler.dump_stats("section.prof")

之后用 pstats 加载分析：

stats = pstats.Stats("section.prof")
stats.sort_stats("tottime").print_stats(10)

enable() 和 disable() 必须成对出现，漏掉 disable() 会导致后续所有 Python 代码都被 profile，拖慢整体执行
不要在循环内部反复 enable()/disable()：开销本身会污染数据；应把整个循环包进去，再看单次迭代均值
dump_stats() 的路径必须有写权限，且注意多进程下别多个 worker 写同一个文件，会覆盖

怎么看懂 pstats 输出里的关键字段

pstats 输出默认按调用顺序排，基本无意义。必须用 sort_stats() 排序，常用键有：

"tottime"：函数自身耗时（不含子调用），找“纯 Python 逻辑慢”的首选
"cumtime"：从进入该函数到返回的总时间（含所有子调用），适合查“谁拖累了整个调用链”
"ncalls"：调用次数，配合 tottime 看是否高频小函数成了瓶颈（比如反复字符串拼接）

还可以过滤聚焦：

stats.filter_stats("my_module")  # 只看某个模块
stats.
print_stats("parse_")       # 只打包含 parse_ 的函数

注意：print_stats(10) 是打印前 10 行，不是“只统计 10 个函数”；如果想限制输出宽度，用 strip_dirs() 去掉完整路径，避免列宽溢出。

cProfile 的典型盲区和替代建议

cProfile 是函数级采样，对以下情况完全无能为力：

I/O 等待（如 requests.get()、open()）会被记为函数自身耗时，但它实际卡在系统调用上，cProfile 看不出是网络慢还是磁盘慢
C 扩展（如 Pandas、NumPy 大部分操作）只显示顶层 Python 调用，内部 C 循环不展开
多线程程序中，cProfile 默认只 profile 主线程，其他线程的函数调用不会被记录

遇到这些情况，得换工具：

查 I/O：用 strace -T -e trace=network,file your_program（Linux）或 py-spy record -o profile.svg --pid $PID
查 C 扩展内部：需编译 debug 版 Python + gdb，或用 perf（Linux）做底层采样
查多线程：加 threading.setprofile() 配合自定义 profiler，或直接上 py-spy（它基于 ptrace，天然支持多线程）

cProfile 不是万能的起点，但它是唯一无需额外依赖、能立刻告诉你“哪个函数在拖后腿”的工具——前提是，你清楚它不统计什么。

17370845950

怎么用 cProfile 快速定位慢函数

如何在代码中精准 profile 某段逻辑

怎么看懂 pstats 输出里的关键字段

cProfile 的典型盲区和替代建议

关于我们

服务项目

广告推广

案例欣赏