Python内置set不是线程安全的,多线程读写会引发崩溃或数据损坏;即使仅读操作(如len、in)在其他线程修改时也可能异常;应使用threading.Lock保护或改用queue.Queue等线程安全结构。
set 会导致崩溃或数据损坏Python 的内置 set 不是线程安全的。多个线程同时调用 add()、remove()、discard() 或 pop(),极大概率触发 RuntimeError: Set changed size during iteration 或静默丢失元素。这是因为 set 内部的哈希表扩容、重哈希等操作不是原子的,且没有内置锁保护。
即使只做“读”操作(如 len(s)、x in s),在其他线程正修改该 set 时,也可能因内部结构不一致而抛出异常——尤其在 CPython 中,in 操作虽常快,但并非完全免于竞态。
set 中哪些操作「看似安全」实则危险以下操作常被误认为线程安全,实际都不可靠:
s.copy():浅拷贝本身不是原子操作,若拷贝中途 set 被修改,结果可能不一致或崩溃list(s) 或 tuple(s):迭代过程暴露完整竞态窗口s & other_set(交集):底层仍需遍历,无锁保护len(s):CPython 中虽通常快,但长度字段未加内存屏障,极端情况下可能读到中间态值(如扩容中)不要自己“小心使用”,直接换用明确设计为线程安全的结构:
threading.Lock 包裹所有对同一 set 的访问:lock = threading.Lock()
with lock:
my_set.add(x)
if y in my_set:
my_set.remove(y)
queue.Queue 实现线程安全的集合语义(适合生产者-消费者场景)concurrent.futures.ThreadPoolExecutor 配合局部 set,避免共享——多数情况下比加锁更简单可靠注意:collections.deque 的 append() 和 popleft() 是原子的,但 deque 不是集合;若只需去重,可配合 dict.fromkeys() 构建临时 set,但依然不能替代共享 set 的并发访问。
set 线程安全?CPython 的 GIL(全局解释器锁)仅保证单个字节码指令的原子性,而 set.add() 这类操作对应多个字节码(查哈希、插槽、扩容判断等)。GIL 不等于线程安全——它只防止多线程同时执行 Python 字节码导致解释器崩溃,不保护用户数据结构的一致性。
加锁会拖慢单线程性能,所以标准库选择“不默认加锁”,把责任交给使用者。这也是为什么你看到 queue.Queue 明确声明线程安全,而 set、dict、list

最容易被忽略的是:即使你只读不写,只要别的线程在写,就不是安全的。别信“我只读,应该没问题”这种直觉。