csv.DictReader和DictWriter通过字典操作提升CSV读写效率。1. DictReader按字段名读取,支持手动指定表头、处理缺失或多余列;2. DictWriter写入时需调用writeheader(),注意newline=''避免空行,并可控制缺失键行为;3. 中文处理推荐utf-8或utf-8-sig编码;4. 可结合字段映射实现重命名与数据清洗,增强代码可维护性。
在处理 CSV 文件时,csv.DictReader 和 csv.DictWriter 是 Python 标准库中非常实用的工具。它们以字典形式读写数据,让操作更直观、易维护。下面介绍一些常见且高效的使用技巧。
DictR
eader 将每行数据转换为字典,键是表头(第一行),值是对应列的内容。这样无需关心列的顺序,代码更具可读性。
基本用法:
import csvwith open('data.csv', 'r', encoding='utf-8') as file: reader = csv.DictReader(file) for row in reader: print(row['姓名'], row['年龄'])
技巧提示:
DictWriter 可将字典列表写入 CSV,并自动处理表头。适合从 JSON 或数据库导出结构化数据。
import csvfieldnames = ['姓名', '年龄', '城市'] data = [ {'姓名': '张三', '年龄': 25, '城市': '北京'}, {'姓名': '李四', '年龄': 30, '城市': '上海'} ]
with open('output.csv', 'w', encoding='utf-8', newline='') as file: writer = csv.DictWriter(file, fieldnames=fieldnames) writer.writeheader() writer.writerows(data)
关键注意点:
CSV 文件常涉及中文,编码设置不当会导致乱码。
实际应用中,原始字段名可能不规范。可在读取后做字段重命名或筛选。
# 读取时重命名字段
field_mapping = {'Name': '姓名', 'Age': '年龄', 'City': '城市'}
with open('raw.csv', 'r', encoding='utf-8') as f:
reader = csv.DictReader(f)
cleaned_data = []
for row in reader:
cleaned_row = {field_mapping.get(k, k): v for k, v in row.items()}
cleaned_data.append(cleaned_row)
写入时也可动态控制输出字段,只保留需要的列。
基本上就这些核心技巧。掌握好 DictReader 和 DictWriter 的参数和上下文管理,能大幅提升 CSV 处理效率和代码清晰度。