Python dict 查询快的核心在于哈希表结构,平均时间复杂度O(1),依赖稳定哈希函数、开放寻址法处理冲突、动态扩容及CPython底层高度优化。
Python 的 dict 查询快,核心在于它用的是哈希表(Hash Table)结构,平均时间复杂度是 O(1) —— 也就是“几乎不随数据量变慢”。不是靠遍历,而是靠计算和定位。
当你执行 d['name'],Python 先对 'name' 调用哈希函数(比如 hash('name')),得到一个整数;再把这个整数映射到内部数组的某个索引位置。就像查电话簿不一页页翻,而是直接翻到“L”那部分找“Li”。
不同键算出相同哈希值叫“哈希冲突”。Python 的 dict 用开放寻址法(Open Addressing)处理:冲突时往附近空位找,同时保持装载因子(已用槽位 / 总槽数)低于 2/3。一旦超了,就自动扩容(通常是翻倍),重新散列所有键。
sys.getsizeof(d) 看字典实际占多少内存,通常比存的数据本身大不少,这是“用空间换时间”的典型CPython(标准 Python 解释器)的 dict 实现经过几十年打磨:缓存友好、指令精简、内存布局紧凑。比如 3.6+ 版本引入“紧凑 d

本质上,Python dict 是“哈希思想 + 工程极致 + 语言约束”共同作用的结果。它快,不是玄学,是每个环节都为查询服务。