gc.get_referrers() 能定位泄漏对象的持有者,因为它反向查询当前直接引用该对象的所有对象,从而揭示意外的引用链;它只返回垃圾回收器管理的非原子类型对象的直接引用者,需配合 gc.collect() 和去重使用,并注意性能与误判风险。
gc.get_referrers() 能定位泄漏对象的持有者Python 的内存泄漏往往不是对象没被销毁,而是它被某个“意外的引用链”死死拽住。gc.get_referrers() 不查对象自己做了什么,而是反向查——谁正指着它。只要泄漏对象还活着,就一定有至少一个 referrer(比如全局变量、类属性、闭包、容器等)在持有它。这是最直接的“逆向追踪”手段。
注意:它只返回当前可达的直接引用者(不递归),且要求目标对象在垃圾回收器管理范围内(即非原子类型,如 list/dict/自定义类实例等)。对 int、str 等小常量或 C 扩展对象可能为空或不可靠。
gc.get_referrers(
) 锁定可疑引用链典型流程是“抓活口 → 查引用 → 溯源头”。先通过 gc.get_objects() 或第三方工具(如 objgraph)找出疑似泄漏的长生命周期对象(比如不断增长的 list 实例或自定义类实例),再对其调用 gc.get_referrers()。
gc.enable()(默认开启,但显式确认更稳)gc.collect(),清理掉本该被回收的临时对象id(obj) 已知、且你怀疑“不该存在这么久”的对象查list(set(...)) 初筛示例:
import gc
# 假设 obj 是你从 objgraph.find_backref_chain() 或内存快照中锁定的可疑对象
referrers = gc.get_referrers(obj)
for r in referrers[:3]: # 只看前几个,避免刷屏
print(type(r), getattr(r, '__name__', ''), getattr(r, '__class__', ''))返回的 referrer 类型直接暴露泄漏入口点。重点盯以下几类:
dict:检查是否误塞进全局字典、模块级缓存、__dict__ 或日志上下文;特别注意 locals() 或装饰器闭包里偷偷保留的引用list / tuple:查是否作为全局队列、待处理缓冲区、事件监听器列表未及时 pop/clearr.__dict__.keys()),比如 self._cache、self._handlers 是否累积未清理function 或 method:说明是闭包或绑定方法持有了对象,需 inspect 其 __closure__ 或 __func__.__globals__
module:最危险——说明对象被挂到了模块顶层,比如 my_module.GLOBAL_LIST.append(obj) 后忘记清理gc.get_referrers() 看似简单,但实战中几个细节常导致误判或卡死:
gc.get_referrers() 可能返回 GC 自身的跟踪结构(如 gc.garbage),需过滤掉 type(r) is list and len(r) > 1000 这类异常大列表真正难的不是找到 referrer,而是判断“这个引用是否合理”——比如一个 dict 引用泄漏对象,得立刻查清它是配置缓存、还是本该随请求结束就丢弃的上下文残留。