Python 的 set 是无序、不重复、可变的哈希表实现数据类型,支持 O(1) 查找/插入/删除;适用于去重(如 set([1,2,2,3])→{1,2,3})和集合运算(|、&、-、^),元素须可哈希。
Python 的 set 是一种无序、不重复、可变的内置数据类型,特别适合做去重和集合运算。它底层基于哈希表实现,查找、插入、删除平均时间复杂度都是 O(1),效率很高。
列表、元组、字符串等可迭代对象转为 set,自动剔除重复项。注意:原顺序不保留,因为 set 本身无序。
例如:
nums = [1, 2, 2, 3, 4, 4, 5] → set(nums) 得到 {1, 2, 3, 4, 5}
text = "hello" → set(text) 得到 {'h', 'e', 'l', 'o'}('l' 只出现一次)dict.fromkeys(): list(dict.fromkeys(nums))
set 支持数学意义上的集合操作,有方法形式(如 .union())和运算符形式(如 |),推荐用运算符更简洁直观。
A | B 或 A.union(B) —— 所有在 A 或 B 中的元素A & B 或 A.intersection(B) —— 同时在 A 和 B 中的元素A - B 或 A.difference(B) —— 在 A 中但不在 B 中的元素A ^ B 或 A.symmetric_difference(B) —— 在 A 或 B 中,但不同时在两者中的元素除了四则运算,set 还提供子集、超集、不相交等逻辑判断,以及更新类方法(直接修改原集合)。
A.issubset(B) 或 A ;超集用 A.issuperset(B) 或 A >= B
A.isdisjoint(B)(返回 True 表示无公共元素)A.update(B) 相当于 A |= B;A.intersection_update(B) 相当于 A &= B
A.add(x)、A.remove(x)(不存在时报错)或 A.discard(x)(安全删除)set 要求所有元素必须是“可哈希的”(h
ashable),即不可变类型。常见合法元素包括 int、float、str、tuple(且 tuple 内部也得全可哈希);列表、字典、其他 set 不允许作为元素。
{[1,2], 3} 报 TypeError;{{'a':1}, 2} 同样不行{(1,2), 'hello', 3.14} 是合法的frozenset(不可变 set),它可作为 dict 的 key 或其他 set 的元素