Collection必须实现15个核心方法:增删查基础操作(add、remove、contains、size、isEmpty)、批量操作(addAll、removeAll、retainAll、containsAll、clear)、遍历转换(iterator、toArray、toArray(T[])),以及JDK 8+默认方法(stream、parallelStream、removeIf)。
Java 中 Collection 接口本身不提供具体实现,而是定义了所有单列集合(如 ArrayList、HashSet、LinkedList)必须支持的最小行为契约。它的方法不是“可选”,而是“必须实现”——否则无法通过编译。
共 15 个核心方法,按功能分组理解更实用:
add(E)、remove(Object)、contains(Object)、size()、isEmpty()
addAll(Collection)、removeAll(Collection)、retainAll(Collection)、containsAll(Collection)、clear()
iterator()(返回 Iterator)、toArray() 和 toArray(T[])
stream()、parallelStream()、removeIf(Predicate) —— 这些有默认实现,子类可不重写,但语义仍由具体集合决定(比如 removeIf 在 ArrayList 中是顺序遍历删除,在 ConcurrentHashMap.KeySetView 中则保证线程安全)这是为了支持运行时类型擦除下的安全操作。虽然泛型声明为 Collection,但底层调用 remove("abc") 时传入的是 Object,避免强制转型异常;同时允许像 list.remove(null) 这样的合法操作。
注意:这也会带来陷阱 —— 如果误传类型不兼容的对象(如向 Collection 里 contains("1")),不会编译报错,但永远返回 false(因为字符串和整数的 equals() 不成立)。
关键看是否需要运行时类型信息:
toArray() 返回 Object[] —— 安全但需强转,例如 (String[]) list.toA
rray() 可能抛 ClassCastException
toArray(T[]) 更推荐:传入一个带类型的数组(哪怕长度为 0),JVM 会返回正确泛型类型的数组。常见写法:list.toArray(new String[0])(JDK 11+ 也支持 list.toArray(String[]::new))别写 new String[list.size()] —— 多余分配,且若集合扩容会导致数组浪费或额外复制。
所有 Collection 实现都必须保证其 iterator() 返回的迭代器满足“快速失败(fail-fast)”语义(非并发集合):
add、remove),下一次调用 next() 或 remove() 会抛 ConcurrentModificationException
modCount 和 expectedModCount 对比实现,不是线程安全机制,只是调试辅助remove(),而要用 Iterator.remove()
真正需要并发修改,请换用 CopyOnWriteArrayList、ConcurrentLinkedQueue 等线程安全替代品,它们的迭代器不 fail-fast,但行为语义完全不同。
最常被忽略的是:即使你只调用 contains() 或 size(),背后也可能触发遍历或哈希计算;不同实现性能差异极大(比如 LinkedList.size() 是 O(1),但某些老版本 JDK 的 LinkedList 曾是 O(n))。别只看接口,得看实际用的是哪个实现类。