array大小固定,创建后无法改变,需手动复制扩容;2. arraylist内部自动扩容(通常1.5倍),对用户透明;3. array可存基本类型和对象,arraylist只能存对象(支持自动装箱);4. array内存连续、访问快、无额外开销,适合数据量固定场景;5. arraylist提供丰富api、开发便捷,适合数据动态变化场景;6. arraylist扩容有性能和内存浪费风险,且非线程安全。
Array 和 ArrayList 的核心区别在于它们的“体质”:Array 就像一个固定大小的盒子,一旦造好,能装多少就定了,你不能临时让它变大或变小。而 ArrayList 则更像一个弹性收纳袋,它虽然内部也用盒子来装东西,但当盒子装不下时,它会偷偷换一个更大的盒子,把旧东西搬过去,整个过程对你来说是透明的,所以它看起来是“可变”的。Array 可以直接存放基本数据类型(如 int, char),也可以放对象,但 ArrayList 只能放对象(当然,通过自动装箱/拆箱,你也能像放基本类型一样使用它)。
理解 Array 和 ArrayList 的差异,关键在于它们对内存的管理方式和提供的功能。
Array,作为 Java 语言最基础的数据结构之一,它的尺寸是在创建时就确定了的。比如你声明一个
String[] names = new String[10];,那么这个
names数组就只能容纳 10 个字符串,不多不少。如果你需要第 11 个位置,不好意思,你得重新创建一个更大的数组,然后把前面 10 个元素手动(或者用
System.arraycopy这样的工具)复制过去。这种固定性,带来了直接的内存访问效率——你可以通过索引
names[0]、
names[1]快速定位到任何一个元素,因为它们在内存中是连续存放的。这种直接、无花哨的特性,在某些对性能极致追求、或者数据量已知且稳定不变的场景下,显得尤为重要,比如处理固定大小的缓冲区、矩阵运算等。
而 ArrayList,它属于 Java 集合框架(Collections Framework)的一部分,是
List接口的一个具体实现。它的“可变”体现在,你不需要预先知道它会装多少东西。你可以不断地往里
add()元素,当内部存储空间不足时,ArrayList 会自动替你完成扩容的操作。它内部其实也维护着一个 Array(通常是
Object[] elementData),但这个 Array 的管理逻辑被封装起来了。当元素数量超出当前内部数组的容量时,ArrayList 会创建一个新的、更大的数组(通常是当前容量的 1.5 倍),然后把旧数组里的所有元素复制到新数组中,再把旧数组丢弃。这个过程对开发者是透明的,极大地提升了开发的便利性。它还提供了丰富的 API,比如
remove()、
contains()、
indexOf()等,让数据操作变得非常便捷。
这个“固定不变”和“可变”的说法,其实是站在使用者角度的一种直观感受。Array 的“固定”是指它的内存布局和大小在创建后就不可更改。想象一下,你申请了一块地皮盖房子,这块地皮的大小是固定的,你不能说盖到一半发现不够用,就直接把地皮变大。如果你想盖更大的房子,你得重新买一块更大的地皮,然后把旧房子的东西搬过去。这就是 Array 的本质:一
旦
new int[5],这块内存区域就固定了,你无法在不创建新 Array 的情况下,让它变成
int[10]。
ArrayList 的“可变”则是一种巧妙的封装。它并没有真正改变它内部那个“盒子”的大小,而是当“盒子”装满时,它会悄悄地在后台创建一个新的、更大的盒子,然后把旧盒子里的所有物品(元素)小心翼翼地搬到新盒子里。这个搬家过程就是我们常说的“扩容”。举个例子,你有一个小行李箱,装满了。你不会让这个行李箱变大,而是会换一个更大的行李箱,然后把旧行李箱里的东西全部转移过去。对于你而言,你只是觉得“行李箱”能装更多东西了,但实际上,是换了一个更大的。这个内部机制,让 ArrayList 在外部表现出极大的灵活性,你无需关心容量问题,只需要
add就行了。
选择 Array 还是 ArrayList,很多时候取决于你对数据结构的需求和对性能的考量,没有绝对的优劣,只有适不适合。
如果你在编码时,已经明确知道需要处理的数据量是固定不变的,或者数据量在某个范围之内且不会频繁变动,那么 Array 可能是个不错的选择。比如,你要处理一个班级固定 30 个学生的分数,或者一个图像的 RGB 像素数据(通常是固定宽度和高度),用
int[] scores = new int[30];或者
byte[] pixelData = new byte[width * height * 3];就很直接。Array 的优势在于其底层实现更接近硬件,直接内存访问,没有 ArrayList 扩容带来的额外开销。对于基本数据类型,Array 还能避免自动装箱/拆箱的性能损耗和内存开销。在一些性能敏感、内存受限的场景,或者需要多维数组(
int[][] matrix)时,Array 的简洁和高效是显而易见的。
然而,在绝大多数日常业务开发中,我们处理的数据量往往是动态变化的,你可能不知道用户会上传多少张图片,或者数据库会返回多少条记录。这时候,ArrayList 的便捷性就体现出来了。它的自动扩容机制,让你无需担心容量问题,可以随心所欲地
add、
remove元素。ArrayList 提供了丰富的集合操作方法,例如
contains()、
indexOf()、
subList()等,这些都是 Array 不具备的。而且,通过泛型(如
ArrayList),它能提供更好的编译时类型安全,避免了运行时类型转换错误。所以,如果你追求开发效率、代码可读性和灵活性,并且对偶尔的扩容性能开销不那么敏感,那么 ArrayList 几乎是你的首选。在我看来,除非有明确的理由(比如性能瓶颈或特定API要求),我通常会默认选择 ArrayList。
ArrayList 的“动态扩容”机制,确实是它实现灵活性的核心。简单来说,它内部有一个
Object[] elementData数组来存储元素。当你调用
add()方法时,ArrayList 会先检查当前元素数量
size是否已经等于
elementData的容量
capacity。如果相等,就意味着空间不够了,需要扩容。
扩容的步骤大致是这样的:
oldCapacity + (oldCapacity >> 1)),再加上一点点(例如 +1),以确保至少能多容纳一个元素。如果计算出来的新容量还是比当前需要的最小容量小,就直接取最小容量。
Object[]。
System.arraycopy()方法,将旧数组中的所有元素高效地复制到新创建的数组中。
elementData引用指向新的数组,旧数组则等待垃圾回收。
这个过程听起来很棒,但它确实带来了一些潜在的问题:
add都发生,但如果频繁地进行小幅度的扩容,或者在短时间内添加大量元素,累积起来的复制操作会显著拖慢性能。想象一下,你每多买一个苹果就要换一个更大的冰箱,这效率肯定不高。
add,另一个线程
remove),就可能出现数据不一致的问题,甚至抛出
ConcurrentModificationException。这是因为扩容操作不是原子性的,它包含多个步骤,在这些步骤之间,其他线程可能会干扰。如果需要在多线程环境中使用动态列表,通常会选择
Vector(但性能差)或者
Collections.synchronizedList(new ArrayList<...>),更现代的选择是
CopyOnWriteArrayList或其他并发集合。