Collectors 是 Stream 的终端收集器,用于将流结果规整装入指定容器;必须配合 collect() 使用,提供 toList、groupingBy、joining、toMap 等模板,需注意 key 冲突处理、下游收集器嵌套规则及返回集合的可变性与线程安全性。
Collectors 的作用很直接:把 Stream 流处理后的结果,规整地“装进”你想要的容器或结构里。它不是用来过滤、转换或排序的(那是中间操作的事),而是流的“终点打包员”——没有它,collect() 就没法知道该生成 List、Map 还是统计值。
Collectors?只要调用了 stream().collect(...),你就绕不开 Collectors。它提供的是「怎么收」的模板,不是可选项。
List?→ 用 Collectors.toList()
Collectors.groupingBy(Employee::getDepartment)
Collectors.joining(", ")
toList() 的 combiner 函数)toMap() 为什么总抛 IllegalStateException: Duplicate key?这是最常踩的坑:toMap(keyMapper, valueMapper) 默认不处理重复 key。一旦两个元素映射出相同 key,就直接炸。
Mapmap = list.stream() .collect(Collectors.toMap( Person::getName, Person::getAge, (oldVal, newVal) -> oldVal // 保留旧值 ));
null;若想强制报错,得显式 throwTreeMap 或 ConcurrentHashMap?用四参数重载版,传构造函数引用collect()
很多人写:groupingBy(...).values().stream().map(...).collect(...) —— 这样做既多走一遍流,又丢掉了分组的上下文信息。
MapdeptTotal = employees.stream() .collect(Collectors.groupingBy( Employee::getDepartment, Collectors.summingInt(Employee::getSalary) ));
groupingBy(dept, mapping(..., toSet())) 或 groupingBy(dept, filtering(..., counting()))
toList() 这类“无状态”的简单收集器以外的终端操作;否则编译不过toList() 返回的是 ArrayList
从 Java 16 开始,Collectors.toList() 的返回类型是未指定的不可变 List(通常是 ImmutableCollections.ListN)。如果你后续要 add() 或 remove(),会直接抛 UnsupportedOperationException。
.collect(Collectors.toCollection(ArrayList::new))
toCollection(CopyOnWriteArrayList::new)
toCollection(TreeSet::new) 比 toSet() 更可控真正容易被忽略的,是下游收集器的“惰性组合”机制——它让一次流遍历完成多层聚合,但一旦写错嵌套层级或 merge 策略,错误往往延迟到运行时才暴露,且堆栈信息不友好。写 groupingBy 或 toMap 时,先想清楚 key 冲突和空值场景,比补 try-c 有用得多。
atch