Python列表是底层用C实现的动态数组,以指针数组存储对象引用,其性能由扩容机制、引用特性、内存连续性共同决定:append均摊O(1)但单次可能O(n),索引访问O(1)而中间增删平均O(n),存储开销固定,遍历缓存友好但对象内存不连续。
Python列表不是简单的数组,而是一个动态数组(Dynamic Array),底层用C语言实现,内部维护一个指针数组,指向实际存储的Python对象。它的性能表现和内存布局直接取决于这个设计——扩容机制、对象引用、内存连续性共同决定了增删查改的快慢。
列表在追加元素(append)时,如果当前空间已满,会触发扩容:分配一块更大的连续内存,把原有元素复制过去。CPython中采用“乘数增长”策略(约1.125倍),保证均摊时间复杂度为O(1)。但单次append可能因复制引发O(n)开销,尤其在反复小步扩容时(如从1扩到2、再到3……)更明显。
因为底层是连续内存的指针数组,按索引读写(lst[i])是纯O(1)操作;但insert(i, x)或pop(i)(i不是末尾)需移动i之后所有指针,平均O(n)。例如在万级列表开头插入一个元素,要平移上万个指针。
列表不保存整数、字符串等实际数据,只保存指向这些对象的指针(8字节/指针,64位系统)。这意味着:
0].append(1))不会改变列表结构,无额外开销指针数组连续,CPU缓存友好,遍历速度很快。但Python对象本身分散在堆内存各处——比如列表存了1000个独立创建的字典,这些字典内存不连续,遍历时缓存命中率低。
理解这四点,就能预判列表操作的真实成本,而不是凭直觉写代码。不复杂但容易忽略。