17370845950

Java集合框架中元素去重方法
使用Set接口去重是Java中最常见方式,HashSet适用于无序场景,LinkedHashSet保持插入顺序,Stream.distinct()提供函数式编程支持,均依赖正确重写的equals()和hashCode()方法。

在Java集合框架中,元素去重最常用的方式是利用Set接口的特性,因为Set集合不允许存储重复元素。只要元素的equals()hashCode()方法正确实现,插入时就会自动去重。

使用HashSet去重(适用于无序场景)

将List或其他集合转为HashSet,可快速去除重复元素。

  • 适合对顺序无要求的去重场景
  • 底层基于HashMap,性能高
  • 注意:需确保元素类正确重写equals()hashCode()

示例代码:

List list = Arrays.asList("a", "b", "a", "c");
Set set = new HashSet<>(list);
// 结果:[a, b, c](顺序不保证)

使用LinkedHashSet去重(保持插入顺序)

如果需要保留元素首次出现的顺序,应使用LinkedHashSet。

  • 去重同时维护插入顺序
  • 性能略低于HashSet,但顺序可控

示例代码:

List list = Arrays.asList("a", "b", "a", "c");
Set set = new LinkedHashSet<>(list);
// 结果:[a, b, c](顺序与插入一致)

使用Stream.distinct()(函数式编程方式)

Java 8及以上版本支持通过Stream进行链式操作去重。

  • 语法简洁,适合流式处理
  • distinct()依赖equals和hashCode
  • 可与其他中间操作组合使用

示例代码:

List distinctList = list.stream()
    .distinct()
    .collect(Collectors.toList());

自定义对象去重注意事项

对于自定义类(如Person、Student),必须重写equals()hashCode()方法,否则去重会失效。

  • IDE通常可自动生成这两个方法
  • 建议基于关键业务字段生成(如id、name等)
  • 若使用Lombok,可用@Data注解自动包含

例如:

@Data
class Person {
    private String id;
    private String name;
}
// 使用@Data后,equals和hashCode已由Lombok生成
基本上就这些。根据是否需要保持顺序、JDK版本以及数据类型选择合适的方法即可。核心要点是理解Set的去重机制依赖对象的equals和hashCode。