with是资源安全的兜底机制,依赖上下文管理器协议(__enter__和__exit__),确保无论正常退出或异常抛出,资源均被释放;__exit__接收异常三元组,返回True可抑制异常。
别用 try/finally 手动关文件或连接了——with 不是语法糖,是资源泄漏的兜底机制。
with 能自动释放资源核心在于上下文管理器协议:对象必须实现 __enter__ 和 __exit__ 方法。__exit__ 在代码块退出时(无论正常结束、return、还是抛异常)必然执行,这才是“自动”的本质。
open()、threading.Lock、tempfile.TemporaryDirectory 都实现了该协议with
with open('a') as f1, open('b') as f2:,失败时已进入的资源仍会正确清理with 里抛异常,资源还安全吗安全。这是 with 最关键的价值点——它不依赖“代码是否跑完”,而依赖“作用域是否退出”。
with open('data.txt') as f:
data = f.read()
if 'error' in data:
raise ValueError('bad content') # 这里抛异常,f 依然被关闭
__exit__ 接收三个参数:exc_type、exc_value、traceback;返回 True 可抑制异常(慎用)__exit__ 自身抛异常,会覆盖原异常(Python 3.7+ 改为链式报错)__exit__ 里做耗时操作(如
重试上传),可能拖慢异常传播影响的是匹配的“伸缩方向”:贪婪(默认)尽可能吞最多字符,非贪婪(加 ?)尽可能吞最少字符,但都从左到右扫描。
text = 'helloworld' re.findall(r'.*', text) # ['helloworld'] re.findall(r'.*?', text) # ['hello', 'world']
.* 和 .*? 在换行符处理上一致,默认都不跨行;要跨行需加 re.DOTALL
? 更可靠(例如用 [^ 替代 .*? 匹配标签内文本)
当目标结构有嵌套、层级或语义约束时,正则极易出错且难维护。
BeautifulSoup 或 lxml;正则匹配 可能漏掉属性、自闭合、注释、CDATA 等- 提取 JSON 片段:用
json.loads() 配合字符串定位,别用正则解析 JSON
- 日期/邮箱/URL 等复杂格式:优先用成熟库(
dateutil、email-validator、urllib.parse),正则容易漏边角 case
正则适合简单提取、日志切分、路径替换这类线性文本操作;一旦出现括号嵌套、引号包裹、状态依赖,就是信号:该换工具了。