17370845950

Python 对象比较规则的全面解析
==比较值是否相等(由__eq__控制),is比较是否为同一内存对象;小整数和短字符串可能因缓存导致is误判;None必须用is判断;重写__eq__需同步处理__hash__以保证哈希一致性。

Python 中 ==is 的本质区别

== 比较的是值是否“相等”,由对象的 __eq__ 方法控制;is 比较的是两个变量是否指向**同一个内存地址**(即是否为同一对象)。这是最常混淆的起点。

常见错误现象:if a == b: 本意是判断逻辑相等,却误用 if a is b:,尤其在比较 NoneTrueFalse 以外的值时极易出错。

  • 小整数(-5 到 256)和短字符串在 CPython 中会被缓存,所以 100 is 100 返回 True,但 1000 is 1000 可能为 False(依赖实现,不可依赖)
  • 自定义类默认继承 object.__eq__,它实际退化为 is 比较,所以未重写 __eq__ 的实例之间 == 等价于 is
  • 永远用 is None 而不是 == None,因为 None 是单例,且某些对象可能错误地实现 __eq__ 返回 True 给非 None

自定义类中如何正确实现 __eq____hash__

只要重写了 __eq__,就**必须考虑 __hash__ 是否仍适用**。默认情况下,自定义类实例是可哈希的(hash(obj) 有效),但一旦定义了 __eq__ 且没定义 __hash__,Python 会自动将 __hash__ 设为 None,导致该实例无法用作字典键或加入集合。

  • 若对象逻辑上“不可变”(如 Point(x, y)),可在 __eq__ 中按字段比较,并显式定义 __hash__ = lambda self: hash((self.x, self.y))
  • 若对象是可变的(如带状态的 Cache),应保持 __hash__None(即不定义,或设为 __hash__ = None),避免哈希表损坏
  • __eq__ 必须满足自反性、对称性、传递性;返回值必须是布尔类型,不能是其他真值对象(如返回字符串或数字会被隐式转换,但违反约定)

内置类型比较的隐含行为与陷阱

不同内置类型的比较规则并不总是一致,且部分行为在 Python 版本间有变化(如 Py3 废除了跨类型排序)。

  • listtuple 按元素逐个比较,一旦某位置不等即返回结果,不要求长度一致([1,2] 为 True
  • dict 在 Py3.7+ 中按插入顺序比较键值对,{'a':1, 'b':2} == {'

    b':2, 'a':1}
    仍为 True(键值对相同),但顺序只影响迭代,不影响相等性
  • float('nan') == float('nan') 恒为 False,这是 IEEE 754 规定,需用 math.isnan() 判断
  • bytesstr 之间不允许直接 ==(Py3 报 TypeError),不存在隐式编码/解码

深比较:什么时候该用 deepcopy 或第三方库?

Python 标准库没有内置“深比较”函数。== 对容器是递归的(即 [a, b] == [c, d] 会调用 a == cb == d),但这仍是浅层语义——它不处理循环引用,也不跳过特定字段(如私有属性、动态计算属性)。

  • 遇到嵌套对象含循环引用(如树节点互相持有父引用),直接 == 会触发无限递归并报 RecursionError
  • unittest.TestCase.assertEqual 内部做了循环引用检测和类型适配,适合测试场景,但不建议在生产逻辑中直接依赖 unittest 工具
  • 需要可控深比较时,可用 deepdiff 库(DeepDiff(a, b) 返回差异描述)或手动用 json.dumps(sorted_dict, sort_keys=True) 做序列化后比对(仅限 JSON 兼容结构)
真正容易被忽略的是:比较行为高度依赖对象自身的协议实现,而非语言硬编码规则。哪怕看起来一样的两个字典,如果其中某个值是自定义类且重载了 __eq__,整个 == 结果就可能出人意料。