17370845950

新闻动态

Python csv.DictReader 与 DictWriter 使用技巧

csv.DictReader和DictWriter通过字典操作提升CSV读写效率。1. DictReader按字段名读取，支持手动指定表头、处理缺失或多余列；2. DictWriter写入时需调用writeheader()，注意newline=''避免空行，并可控制缺失键行为；3. 中文处理推荐utf-8或utf-8-sig编码；4. 可结合字段映射实现重命名与数据清洗，增强代码可维护性。

在处理 CSV 文件时，csv.DictReader 和 csv.DictWriter 是 Python 标准库中非常实用的工具。它们以字典形式读写数据，让操作更直观、易维护。下面介绍一些常见且高效的使用技巧。

1. 使用 DictReader 按字段名读取数据

DictReader 将每行数据转换为字典，键是表头（第一行），值是对应列的内容。这样无需关心列的顺序，代码更具可读性。

基本用法：

import csv
with open('data.csv', 'r', encoding='utf-8') as file:
reader = csv.DictReader(file)
for row in reader:
print(row['姓名'], row['年龄'])

技巧提示：

若 CSV 文件无表头，可通过 fieldnames 参数手动指定字段名。
使用 restval 设置缺失字段的默认值。
用 restkey 接收多余列（当行数据列数多于表头）。

2. 使用 DictWriter 写入带表头的字典数据

DictWriter 可将字典列表写入 CSV，并自动处理表头。适合从 JSON 或数据库导出结构化数据。

import csv
fieldnames = ['姓名', '年龄', '城市']
data = [
{'姓名': '张三', '年龄': 25, '城市': '北京'},
{'姓名': '李四', '年龄': 30, '城市': '上海'}
]
with open('output.csv', 'w', encoding='utf-8', newline='') as file:
writer = csv.DictWriter(file, fieldnames=fieldnames)
writer.writeheader()
writer.writerows(data)

关键注意点：

必须调用 writeheader() 才能写入表头。
newlin='' 是必需的，防止在 Windows 上出现空行。
如果某字典缺少某个 fieldname 的键，会写入空白；可通过 extrasaction='raise' 或 'ignore' 控制异常行为。

3. 处理中文与编码问题

CSV 文件常涉及中文，编码设置不当会导致乱码。

读写时统一使用 encoding='utf-8'。
如需兼容 Excel，可使用 encoding='utf-8-sig' 避免打开时乱码。
确保文件实际编码与指定一致，特别是从不同系统导出的数据。

4. 数据清洗与字段映射

实际应用中，原始字段名可能不规范。可在读取后做字段重命名或筛选。

# 读取时重命名字段
field_mapping = {'Name': '姓名', 'Age': '年龄', 'City': '城市'}
with open('raw.csv', 'r', encoding='utf-8') as f:
reader = csv.DictReader(f)
cleaned_data = []
for row in reader:
cleaned_row = {field_mapping.get(k, k): v for k, v in row.items()}
cleaned_data.append(cleaned_row)

写入时也可动态控制输出字段，只保留需要的列。

基本上就这些核心技巧。掌握好 DictReader 和 DictWriter 的参数和上下文管理，能大幅提升 CSV 处理效率和代码清晰度。

17370845950

1. 使用 DictReader 按字段名读取数据

2. 使用 DictWriter 写入带表头的字典数据

3. 处理中文与编码问题

4. 数据清洗与字段映射

关于我们

服务项目

广告推广

案例欣赏