Python默认用\n(LF)作换行符,但文件读写受open()的newline参数影响:文本模式自动转换,二进制模式或newline=''则原样处理;print()默认结尾加\n,可用end控制;跨平台读取时\n统一归一化是便利也是陷阱;正则中.默认不匹配\n,需re.DOTALL。
\n和\r\n到底该用哪个Python默认用\n(LF)作为换行符,无论你在Windows、macOS还是Linux上运行。这是由Python解释器内部统一处理的,和系统原生换行符无关。但当你读写文件时,这个“默认”会受open()的newline参数影响。
常见错误现象:在Windows上用open('f.txt', 'w').write('a\nb')写入后,用记事本打开显示为一行——因为记事本只认\r\n,而Python默认只写\n。
open(..., 'w')会自动把\n转成系统原生换行符(Windows→\r\n,其他→\n)'wb')或显式指定newline=''时,\n会被原样写出,不转换\r\n(比如生成HTTP响应头、兼容老旧工具),直接写'\r\n'更可靠,别依赖系统自动转换print()输出的换行为什么不能删又不好改print()末尾默认加一个\n,这是它的行为契约,不是bug。想取消?用end='';想换成别的?比如空格或\t,就设end=' '或end='\t'。
容易踩的坑:在循环里反复调用print(x, end='')却不手动加\n,会导致所有输出挤在一行且光标卡住,终端看起来像“没反应”。
print('a', end='') # 不换行print('b', end='\n') # 显式换行(等价于默认)print('c', end='\r') # 回车不换行,适合覆盖同一行(如进度条)end只控制结尾,不影响内容里的\n——print('x\ny', end='!')仍会先输出x换行再y再!\r\n变成\n是好事还是陷阱Python在文本模式下读文件时,会把所有\r\n、\r、\n统一归一化为\n。这是PEP 278规定的“universal newlines”特性,目的是让开发者不用操心源文件来自哪个系统。
但这也埋了雷:如果你在Windows上读一个含\r\n的配置文件,再用print(line)原样输出到新文件,新文件在Linux上可能被某些严格工具拒绝——因为它们期望\r\n,而你只写了\n。
rb模式+自己解析)\r\n
os.linesep返回当前系统的换行符,但它只适合“生成本地文件”,不适合“复现原始文件”with open('input.txt', 'rb') as f:
raw = f.read()
# 手动替换:把 \r\n → \n(仅用于处理逻辑),或保持原样写回
with open('output.txt', 'wb') as f:
f.write(raw.replace(b'\r\n', b'\n')).为什么匹配不到\n
默认情况下,正则中的.元字符**不匹配**\n(也不匹配\r)。这是Python re模块的默认行为,和大多数正则引擎一致。
典型问题:用re.search(r'a.b', 'a\返回
nb')None,你以为是语法错,其实是.跳过了\n。
re.DOTALL标志(或re.S)让.匹配包括\n在内的任意字符\n、\r\n或\r字面量,比.更精准re.MULTILINE(re.M)只影响^和$的行为,和.无关换行符看着小,但混在文件IO、网络协议、正则、终端交互里,每个环节的处理逻辑都不同。最常出问题的不是“不知道用哪个”,而是“以为Python替你兜底了,结果在边界场景漏掉一层转换”。