在实际开发中,我们经常会遇到需要处理包含重复数据的列表,但这些重复数据在某些关键字段上是唯一的。例如,一个员工列表可能包含同一个员工(通过姓氏和名字确定)在不同时间点的薪资记录。我们的目标是,对于每个唯一的员工组合(例如,相同的姓氏和名字),只保留其最新的一条记录。
假设我们有以下Employee类定义:
import lombok.AllArgsConstructor;
import lombok.Data;
import java.time.LocalDate;
@Data
@AllArgsConstructor
public class Employee {
private String firstName;
private String lastName;
private double salary;
private LocalDate date; // 使用LocalDate表示日期
}以及一个包含示例数据的List
import java.util.ArrayList;
import java.util.List;
import java.time.LocalDate;
public class EmployeeData {
public static List getSampleEmployees() {
List employees = new ArrayList<>();
employees.add(new Employee("John", "Smith", 10, LocalDate.of(2022, 9, 1)));
employees.add(new Employee("John", "Smith", 20, LocalDate.of(2022, 10, 1)));
employees.add(new Employee("John", "Smith", 5, LocalDate.of(2022, 11, 1)));
employees.add(new Employee("Kelly", "Jones", 12, LocalDate.of(2022, 3, 1)));
employees.add(new Employee("Sara", "Kim", 21, LocalDate.of(2022, 3, 1)));
employees.add(new Employee("Sara", "Kim", 7, LocalDate.of(2022, 7, 1)));
return employees;
}
} 我们的目标是得到以下结果:
Java 8 引入的 Stream API 为处理集合数据提供了强大而简洁的工具。对于上述需求,我们可以利用Collectors.toMap的重载方法,该方法允许我们定义一个合并函数来处理键冲突。
import java.util.Collection;
import java.util.List;
import java.util.function.Function;
import java.util.stream.Collectors;
import java.time.LocalDate;
public class EmployeeFilterTutorial {
public static void main(String[] args) {
List employees = EmployeeData.getSampleEmployees();
Collection filteredEmployees = employees.stream()
.collect(Collectors.toMap(
// keyMapper: 定义如何从Employee对象中提取键
// 这里将firstName和lastName拼接作为键
employee -> employee.getFirstName() + employee.getLastName(),
// valueMapper: 定义如何从Employee对象中提取值
// Function.identity() 表示Employee对象本身作为值
Function.identity(),
// mergeFunction: 定义当两个键相同时如何合并值
// 比较两个Employee对象的日期,保留日期最新的那个
(existingEmployee, newEmployee) -> existingEmployee.getDate().isAfter(newEmployee.getDate()) ? existingEmployee : newEmployee
))
.values(); // 获取Map中所有的值,即我们筛选后的Employee对象
// 打印结果
filteredEmployees.forEach(System.out::println);
}
}
e。这确保了Map中最终存储的是具有最新日期的Employee记录。执行上述代码,将得到以下输出:
Employee(firstName=John, lastName=Smith, salary=5.0, date=2025-11-01) Employee(firstName=Sara, lastName=Kim, salary=7.0, date=2025-07-01) Employee(firstName=Kelly, lastName=Jones, salary=12.0, date=2025-03-01)
这正是我们期望的结果,对于每个唯一的员工组合,都成功筛选出了日期最新的那条记录。
通过本教程,您应该已经掌握了如何使用Java Stream API结合Collectors.toMap,根据对象的多个字段进行分组,并从每个分组中筛选出符合特定条件的唯一记录。这种模式在数据处理和聚合中非常常见且实用。