标准规定,std::unordered_map 必须提供平均
常数时间的查找/插入/删除,而 C++11 起明确要求其底层采用「桶 + 单链表」结构处理哈希冲突,也就是开链法。每个桶(bucket)存储一个指向节点链表的指针,冲突键值对被挂到同一桶的链表上。
这是 libstdc++(GCC)和 libc++(Clang)的共同实现策略,不是标准强制,但已成为事实标准。好处是避免遍历链表找尾部,插入为 O(1)(不计哈希计算)。但注意:
std::unordered_map 维护一个 max_load_factor()(默认 1.0),当 size() / bucket_count() > max_load_factor() 时,自动扩容并 rehash 所有元素。关键点:
O(N) 时间,可能引发短暂停顿reserve(N) 可预先分配足够桶,避免多次 rehash;它等价于确保 bucket_count() >= N
开链法依赖两个函数协同工作:Hash 决定进哪个桶,KeyEqual(默认 std::equal_to)在链表内逐个比对。常见错误:
立即学习“C++免费学习笔记(深入)”;
operator==,却没提供对应哈希特化,导致编译失败std::time(nullptr)),造成查找失效a == b 为 true)返回不同哈希值,它们会被分到不同桶,永远无法查到struct Point {
int x, y;
bool operator==(const Point& p) const { return x == p.x && y == p.y; }
};
namespace std {
template<> struct hash {
size_t operator()(const Point& p) const {
// 正确:x 和 y 都参与,且顺序一致
return hash{}(p.x) ^ (hash{}(p.y) << 16);
}
};}
开链法本身简单,但实际性能高度依赖哈希函数质量——坏哈希会让所有键挤进少数桶,把平均 O(1) 退化成 O(N)。别只盯着容器接口,先盯住你的 hash::operator() 。