HashSet通过HashMap底层实现元素唯一性,以元素为key、PRESENT为value存储,依赖hashCode定位桶和equals判断重复;自定义类须重写hashCode与equals保证一致性,null值允许且仅存一个。
HashSet 保证元素唯一,靠的是 HashMap 的底层支撑和 hashCode + equals 的双重校验机制。
HashSet 并没有自己实现存储逻辑,而是内部持有一个 HashMap 实例。当你往 HashSet 中添加一个元素(比如 add("abc")),它实际上是把这个元素作为 key,存进内部的 HashMap,value 固定用一个叫 PRESENT 的静态对象占位。
因为 HashMap 的 key 天然不允许重复,所以 HashSet 就“顺便”实现了去重。
当调用 add() 方法时,HashSet 会按以下步骤判断是否重复:
⚠️ 注意:如果两个对象 equals() == true,它们的 hashCode() 必须相同;否则可能被分到不同桶里,导致去重失效。
如果你往 HashSet 里放的是自定义对象(比如 User 类),默认继承自 Object 的 hashCode() 和 equals() 是基于内存地址的,会导致逻辑相同的对象也被视为不同元素。
正确做法是:
手写出错HashSet 允许添加一个 null 值。它的处理方式很特别:
所以 set.add(null) 多次调用,结果仍是 size=1。
基本上就这些。理解清楚 HashMap 底层 + 重写规范,HashSet 去重就不会踩坑。