HashSet通过hashCode和equals方法实现去重,添加元素时先计算哈希值定位存储位置,若冲突则调用equals判断是否相等,相等则不重复添加;因此自定义对象需重写这两个方法并保持逻辑一致。使用时可直接add元素,集合自动去重,适用于快速判重、去重大量数据且无需顺序的场景,但不保证有序性,非线程安全,可结合Collections.synchronizedSet用于多线程环境。
在Java中,HashSet 是一个基于 HashMap 实现的无序、不重复集合。它天然支持元素去重,是处理重复数据时常用的数据结构之一。下面从去重原理、使用方法和典型场景三个方面进行解析。
HashSet 能实现去重,核心依赖于两个方法:equals() 和 hashCode()。其内部通过 HashMap 存储元素,将元素作为 key,value 使用一个固定的 Object 对象(如 PRESENT)。
当调用 add(element) 方法时,HashSet 会:
因此,要让自定义对象在 HashSet 中正确去重,必须重写 hashCode() 和 equals() 方法,且两者逻辑保持一致。
使用 HashSet 去重非常简单,以下是一些常见操作示例:
1. 去除基本类型包装类重复元素
Set2. 去除字符串重复项
Set3. 自定义对象去重(需重写 hashCode 和 equals)
class Person { private String name; private int age; public Person(String name, int age) { this.name = name; this.age = age; } @Override public boolean equals(Object o) { if (this == o) return true; if (!(o instanceof Person)) return false; Person person = (Person) o; return age == person.age && Objects.equals(name, person.name); } @Override public int hashCode() { return Objects.hash(name, age); } } SetHashSet 特别适合以下场景:
但也要注意几点:
基本上就这些。只要理解了 hashCode 和 equals 的协同作用,就能高效利用 HashSet 实现去重功能。实际开发中,尤其是在处理用户数据、日志记录、标签系统等场景下,HashSet 是提升效率的利器。