HashSet通过hashCode和equals方法判断重复,需重写这两个方法以确保去重正确;对于自定义类如Person,必须实现一致的equals和hashCode逻辑,否则可能导致去重失败或集合异常。
在Java中,HashSet 是一个基于哈希表实现的Set接口集合,它不允许存储重复元素。这使得 HashSet 成为去除重复数据的常用工具。只要正确使用,它可以高效地完成去重任务。
HashSet 判断两个对象是否重复,依赖于对象的 equals() 和 hashCode() 方法。当向 HashSet 添加一个元素时:
容。因此,为了确保去重有效,存入 HashSet 的对象必须正确重写这两个方法,尤其是自定义类。
对于 Integer、String 等 JDK 内置类,equals 和 hashCode 已经实现良好,可直接使用:
Setnames = new HashSet<>(); names.add("Alice"); names.add("Bob"); names.add("Alice"); // 重复,不会添加 System.out.println(names); // 输出: [Alice, Bob]
结果中只保留唯一值,重复的 "Alice" 被自动过滤。
假设有一个 Person 类,我们希望根据姓名和年龄判断是否重复:
class Person {
private String name;
private int age;
public Person(String name, int age) {
this.name = name;
this.age = age;
}
@Override
public boolean equals(Object o) {
if (this == o) return true;
if (!(o instanceof Person)) return false;
Person person = (Person) o;
return age == person.age && name.equals(person.name);
}
@Override
public int hashCode() {
int result = name != null ? name.hashCode() : 0;
result = 31 * result + age;
return result;
}}
此时将多个 Person 对象加入 HashSet,相同姓名和年龄的只会保留一份:
Setpeople = new HashSet<>(); people.add(new Person("Tom", 25)); people.add(new Person("Tom", 25)); // 重复 people.add(new Person("Jerry", 20)); System.out.println(people.size()); // 输出: 2
使用 HashSet 去重时,注意以下几点能避免常见问题:
基本上就这些。掌握 hashCode 和 equals 的作用机制,再结合实际场景选择合适的 Set 实现,就能高效、稳定地完成去重任务。不复杂但容易忽略细节。