17370845950

Python csv.DictReader 与 DictWriter 使用技巧
csv.DictReader和DictWriter通过字典操作提升CSV读写效率。1. DictReader按字段名读取,支持手动指定表头、处理缺失或多余列;2. DictWriter写入时需调用writeheader(),注意newline=''避免空行,并可控制缺失键行为;3. 中文处理推荐utf-8或utf-8-sig编码;4. 可结合字段映射实现重命名与数据清洗,增强代码可维护性。

在处理 CSV 文件时,csv.DictReadercsv.DictWriter 是 Python 标准库中非常实用的工具。它们以字典形式读写数据,让操作更直观、易维护。下面介绍一些常见且高效的使用技巧。

1. 使用 DictReader 按字段名读取数据

DictReader 将每行数据转换为字典,键是表头(第一行),值是对应列的内容。这样无需关心列的顺序,代码更具可读性。

基本用法:

import csv

with open('data.csv', 'r', encoding='utf-8') as file: reader = csv.DictReader(file) for row in reader: print(row['姓名'], row['年龄'])

技巧提示:

  • 若 CSV 文件无表头,可通过 fieldnames 参数手动指定字段名。
  • 使用 restval 设置缺失字段的默认值。
  • 用 restkey 接收多余列(当行数据列数多于表头)。

2. 使用 DictWriter 写入带表头的字典数据

DictWriter 可将字典列表写入 CSV,并自动处理表头。适合从 JSON 或数据库导出结构化数据。

import csv

fieldnames = ['姓名', '年龄', '城市'] data = [ {'姓名': '张三', '年龄': 25, '城市': '北京'}, {'姓名': '李四', '年龄': 30, '城市': '上海'} ]

with open('output.csv', 'w', encoding='utf-8', newline='') as file: writer = csv.DictWriter(file, fieldnames=fieldnames) writer.writeheader() writer.writerows(data)

关键注意点:

  • 必须调用 writeheader() 才能写入表头。
  • newlin='' 是必需的,防止在 Windows 上出现空行。
  • 如果某字典缺少某个 fieldname 的键,会写入空白;可通过 extrasaction='raise' 或 'ignore' 控制异常行为。

3. 处理中文与编码问题

CSV 文件常涉及中文,编码设置不当会导致乱码。

  • 读写时统一使用 encoding='utf-8'。
  • 如需兼容 Excel,可使用 encoding='utf-8-sig' 避免打开时乱码。
  • 确保文件实际编码与指定一致,特别是从不同系统导出的数据。

4. 数据清洗与字段映射

实际应用中,原始字段名可能不规范。可在读取后做字段重命名或筛选。

# 读取时重命名字段
field_mapping = {'Name': '姓名', 'Age': '年龄', 'City': '城市'}

with open('raw.csv', 'r', encoding='utf-8') as f: reader = csv.DictReader(f) cleaned_data = [] for row in reader: cleaned_row = {field_mapping.get(k, k): v for k, v in row.items()} cleaned_data.append(cleaned_row)

写入时也可动态控制输出字段,只保留需要的列。

基本上就这些核心技巧。掌握好 DictReader 和 DictWriter 的参数和上下文管理,能大幅提升 CSV 处理效率和代码清晰度。