Python处理txt文件核心是open()函数配合字符串方法或标准库;推荐with语句逐行读取以节省内存,注意utf-8或gbk编码;写入用"w"覆盖、"a"追加;解析依格式选split、csv、正则或configparser。
Python 处理 txt 文件非常简单,核心是用内置的 open() 函数读写文本,再配合字符串方法或标准库(如 csv、re)做进一步分析。
最常用的是逐行读取,避免一次性加载大文件到内存:
with open("file.txt", "r", encoding="utf-8") as f: 安全打开(自动关闭)f.read() → 读全部为一个字符串f.readlines() → 返回每行带换行符的列表for line in f: → 推荐方式,内存友好,一行一行处理注意编码问题:中文 txt 常用 utf-8,Windows 记事本保存可能默认 gbk,报错时可试 encoding="gbk"。
写入用 "w" 模式(覆盖原文件),追加用 "a" 模式:
with open("out.txt", "w", encoding="utf-8") as f: f.write("Hello\nWorld")f.writelines(line_list),但需自行确保每行含 \n
纯文本没有固定格式,需根据实际内容选择策略:
line.split(",") 或更稳妥的 csv.reader(f, delimiter="\t")
line[0:10], line[10:20]
re.search(r"姓名:(.+?)\n", text)
configparser 模块(需先补上 section 头)
比如统计某词出现次数、提取所有邮箱、去重并保存:
text = f.read() → text.count("python")
re.findall(r"\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b", text)
set(lines) → 写回(注意保留换行)不复杂但容易忽略细节,关键是先看清 txt 的实际格式,再选对工具。