cProfile可快速定位慢函数,核心看tottime字段;用python -m cProfile启动或代码中嵌入Profile()控制启停,配合pstats排序分析,但无法检测I/O、C扩展及多线程耗时。
cProfile 是 Python 自带的确定性性能分析器,不用装额外包,适合快速抓出耗时最多的函数。它统计的是每个函数被调用次数、总耗时(tottime)、每次调用平均耗时(percall)以及累计耗时(cumtime)——真正要盯的是 tottime,它排除了子调用开销,反映函数自身逻辑的真实瓶颈。
最简启动方式:
python -m cProfile your_script.py
如果脚本需要参数,直接跟在后面即可;想把结果存成文件便于后续排序或过滤,加 -o:
python -m cProfile -o profile.out your_script.py
tottime 高 ≠ 问题一定在该函数里,可能它调用了没 profile 到的 C 扩展(比如 NumPy 内部)%prun 分析整个 notebook:它会把所有 cell 合并统计,掩盖单个函数的真实上下文用 cProfile.Profile() 实例手动控制启停,比全局命令更灵活,尤其适合反复运行的函数或 Web 请求中的 handler。
示例:
import cProfile import pstatsprofiler = cProfile.Profile() profiler.enable()
这里放你想测的代码,比如:
result = some_heavy_function(data)
profiler.disable() profiler.dump_stats("section.prof")
之后用 pstats 加载分析:
stats = pstats.Stats("section.prof")
stats.sort_stats("tottime").print_stats(10)enable() 和 disable() 必须成对出现,漏掉 disable() 会导致后续所有 Python 代码都被 profile,拖慢整体执行enable()/disable():开销本身会污染数据;应把整个循环包进去,再看单次迭代均值dump_stats() 的路径必须有写权限,且注意多进程下别多个 worker 写同一个文件,会覆盖pstats 输出默认按调用顺序排,基本无意义。必须用 sort_stats() 排序,常用键有:
"tottime":函数自身耗时(不含子调用),找“纯 Python 逻辑慢”的首选"cumtime":从进入该函数到返回的总时间(含所有子调用),适合查“谁拖累了整个调用链”"ncalls":调用次数,配合 tottime 看是否高频小函数成了瓶颈(比如反复字符串拼接)还可以过滤聚焦:
stats.filter_stats("my_module") # 只看某个模块
stats.
print_stats("parse_") # 只打包含 parse_ 的函数注意:print_stats(10) 是打印前 10 行,不是“只统计 10 个函数”;如果想限制输出宽度,用 strip_dirs() 去掉完整路径,避免列宽溢出。
cProfile 是函数级采样,对以下情况完全无能为力:
requests.get()、open())会被记为函数自身耗时,但它实际卡在系统调用上,cProfile 看不出是网络慢还是磁盘慢遇到这些情况,得换工具:
strace -T -e trace=network,file your_program(Linux)或 py-spy record -o profile.svg --pid $PID
perf(Linux)做底层采样threading.setprofile() 配合自定义 profiler,或直接上 py-spy(它基于 ptrace,天然支持多线程)cProfile 不是万能的起点,但它是唯一无需额外依赖、能立刻告诉你“哪个函数在拖后腿”的工具——前提是,你清楚它不统计什么。