Python函数默认参数若为可变对象(如[]、{})会在多次调用间共享同一对象,导致状态残留;正确做法是用None作默认值并在函数内初始化。
Python 函数的默认参数在函数定义时只被初始化一次,不是每次
调用都新建。如果默认参数是可变对象(如 []、{}、set()),后续调用会复用同一个对象,导致“状态残留”。
常见错误现象:append() 多次调用后元素不断累积,而不是每次都从空列表开始。
def add_item(item, items=[]):
items.append(item)
return itemsdef add_item(item, items=None):
if items is None:
items = []
items.append(item)
return itemsitems=None 是惯用写法,避免用 items==[] 或 if not items: 判断——空列表也会被误判为“无值”None 是唯一安全的默认占位符因为 None 是单例,不可变,且语义明确表示“未传值”,不会和业务数据冲突(比如你总不能把 None 当作合法输入项塞进列表里)。
0、""、[] 作默认值来“简化判断”,它们都是真实可变/可参与运算的值None 作为合法输入,改用哨兵对象:_sentinel = object()
def func(val=_sentinel):
if val is _sentinel:
val = [] # 实际默认行为
pylint)会警告可变默认参数,但不会警告你用了 ""——得靠自己识别语义*args 和 **kwargs 不会触发默认参数陷阱,但要注意顺序*args 和 **kwargs 本身是新创建的元组和字典,不共享状态,所以不会“记住上次”。但它们和默认参数混用时,位置和关键字参数的解析规则容易出错。
def f(a, b=1, *args, c=2, **kwargs) —— *args 后的关键字参数叫“仅关键字参数”,必须显式传名f(1, 2, 3, 4) 中的 4 会被塞进 *args,而 c 仍用默认值;想传 c=4 必须写成 f(1, 2, 3, c=4)
**kwargs 的值(比如 kwargs.setdefault('timeout', 30)),不影响调用方的原始字典,但会影响本次执行中后续逻辑最直接的办法:打印默认参数对象的 id(),看多次调用是否一致。
def bad_example(items=[]):
print(f"items id: {id(items)}") # 每次调用都输出相同数字
items.append("x")
return items
assert add_item(1) == [1];assert add_item(2) == [2] —— 第二个断言在错误实现下会失败真正麻烦的不是写错,而是它看起来“好像能跑通”——直到某天用户批量提交数据,或者服务跑了三天后列表突然膨胀到几万项。