17370845950

新闻动态

< 返回列表当前位置：首页 > 新闻动态 > 技术教程

Python基础数据结构深入理解_列表字典集合解析【教程】

Python列表、字典、集合的底层机制决定其性能与安全性：列表为动态数组，索引O(1)但中间增删O(n)；字典基于哈希表，键须可哈希，查找平均O(1)；集合是无序去重结构，成员检测O(1)，空集合须用set()。

Python 的列表、字典、集合不是“会用就行”的工具，它们的底层行为、时间复杂度、可变性差异，直接决定代码是否健壮、高效、不易出错。理解它们不是背语法，而是看清“什么时候该用谁”“为什么这样写会慢或报错”。

列表：有序、可变、允许重复，但索引访问快，中间插入删除慢

列表底层是动态数组，内存连续，所以按索引取值（lst[5]）是 O(1)，但往开头或中间 insert() 或 pop(0) 是 O(n)——因为后面所有元素都要平移。

避免在循环中对列表做 remove() 或 append() 同时遍历，容易跳过元素或无限循环；推荐用列表推导式过滤：[x for x in lst if x > 0]
list.append() 均摊 O(1)，但 list.insert(0, x) 每次都挪动全部元素，大数据量时明显卡顿
复制列表别用 new = old（只是引用），要用 new = old.copy() 或 new = old[:] 或 new = list(old)

字典：键必须可哈希，查找/插入平均 O(1)，但无序（3.7+保持插入顺序是实现细节，非语言保证）

字典靠哈希表实现。键必须是不可变类型（如 str、int、tuple），因为哈希值需稳定；list、dict、set 不可作键，会报 TypeError: unhashable type。

判断键是否存在，用 if key in d:，不要用 try/except KeyError（除非你本就要取值并处理异常）
安全取值优先用 d.get(key, default)，比 d[key] 更健壮；批量设默认值可用 d.setdefault(key, default)
遍历时想同时得键和值，直接用 for k, v in d.items():，别先取 keys() 再索引——后者多一次哈希查找

集合：去重神器，成员检测极快，但不记录顺序、不支持索引

集合本质是精简版字典（只存键，值为占位符），因此成员判断 x in s 平均 O(1)，远快于 x in list 的 O(n)。适合查重、交并差运算、快速过滤。

创建空集合必须用 set()，{} 是空字典——这是高频错误
去重保留原顺序？不能直接用 set(lst)（会乱序），改用 dict.fromkeys(lst).keys() 或 list(dict.fromkeys(lst))
集合运算符更直观：s1 & s2（交集）、s1 | s2（并集）、s1 - s2（差集），比调用方法 s1.intersection(s2) 更简洁

三者嵌套与深浅拷贝：可变对象嵌套时，copy() 只复制一层

列表里放字典、字典里嵌套集合……这类结构很常见。此时 .copy() 或切片 [:] 只是浅拷贝：外层新对象，内层仍共用引用。修改内层字典，原列表里的也会变。

需要彻底隔离，用 import copy; deepcopy(obj)
更轻量的替代：用不可变结构约束自己，比如用 tuple 替代 list、用 frozenset 替代 set，天然避免意外修改
函数传参也是浅拷贝逻辑——传列表进去，函数里 append 会影响外部；如不想被改，函数开头就 data = data.copy()

不复杂但容易忽略。真正吃透这三者，不是为了炫技，而是写出来的代码少 debug、少重构、上线更稳。

赣ICP备2024031479号