HashSet核心特点是无序、不重复、允许一个null、非线程安全、平均时间复杂度O(1),底层基于HashMap实现,依赖hashCode()和equals()保证唯一性,遍历仅支持增强for和迭代器。
Java 中 HashSet 的核心特点是:**无序、不重复、允许一个 null、非线程安全、平均操作时间复杂度为 O(1)**。它不维护插入顺序,也不支持索引访问,所有去重逻辑依赖 hashCode() 和 equals() 的配合。
添加元素时,先算哈希值定位桶位置;若该位置已有元素,再调用 equals() 判断是否真正相等:
equals() 返回 false → 挂在链表/红黑树中(哈希冲突)equals() 返回 true → 不添加,视为重复自定义类存入 HashSet 时,必须重写 hashCode() 和 equals(),否则默认按内存地址比较,相同内容的对象也会被当作不同元素。
因为没有索引,所以无法通过下标获取或修改元素:
for (String s : set))Iterator it = set.iterator() )set.get(i) 或传统 for 循环遍历输出顺序不等于插入顺序,但每次遍历的顺序是固定的(由底层哈希表结构决定),不是完全随机。
HashSet 内部持有一个 HashMap,把元素作为 key,固定对象 PRESENT 作为 value:
add(e) 实际调用 map.put(e, PRESENT)
contains(e) 实际调用 map.containsKey(e)
remove(e) 实际调用 map.remove(e)
所以它的性能、扩容机制(初始容量 16,加载因子 0.75)、树化条件(链表 ≥8 且数组 ≥64)都和 HashMap 完全一致。
这些点容易忽略但影响实际使用:
null 元素(因为 map.put(null, PRESENT) 合法)Collections.s
ynchronizedSet() / ConcurrentHashMap.newKeySet()
new HashSet(32, 0.75f))基本上就这些。