缓存需权衡数据不变性、访问频率、内存开销与一致性;只缓存计算昂贵、读多写少、生命周期可控的数据,如纯函数结果、带TTL的外部API响应、低频更新的维度表;禁用动态值、毫秒级计算及大对象;选对工具并设过期与失效机制,监控命中率与存留时间,配置降级策略。
缓存不是“加了就快”,而是要在数据不变性、访问频率、内存开销和一致性之间做权衡。合理使用的关键是:只缓存那些计算昂贵、读多写少、生命周期可控的数据。
适合缓存的典型场景:
明确不建议缓存的:
@lru_cache 适合简单、无副作用、参数可哈希的函数:
✅ 正确用法:def get_user_role(user_id: int) -> str: ...(user_id 是整数,角色极少变更)
❌ 错误用法:def process_request(data: dict) -> dict: ...(dict 不可哈希,会报错;且 request 数据高度动态)
需要精细控制时,用 functools.cached_property(实例属性级缓存)或第三方库如 diskcache(支持持久化、淘汰策略、线程安全)。
无过期的缓存等于埋雷。Python 标准库不提供带 TTL 的 LRU,需自行补充:
@lru_cache 外包一层时间检查(适合简单场景)get_user(id) 缓存)特别注意:分布式环境下,单机缓存清除无效,需结合 Redis 的 publish/subscribe 或删除共享缓存。
上线后要可观测:
可用 tenacity 重试 + structlog 打点,把缓存行为变成可追踪的日志事件。