match()只认开头,search()哪都找:match强制从字符串开头匹配,search则全局扫描找首个匹配;前者适合格式校验,后者适合内容查找;match等价于search加^锚定,但不受多行模式影响。
核心就一条:match()只认开头,search()哪都找。
match()强制从字符串最开头(索引 0)开始尝试匹配。哪怕后面某处完全符合模式,只要开头不匹配,就直接返回 None。
search()则会从头到尾逐个位置扫描,只要找到第一个匹配位置,就立刻返回 Match 对象。
match()适合做“格式校验”:比如判断一行是否以 # 开头(注释)、是否是邮箱前缀、是否为特定协议头(如 http://)。
search()适合做“内容查找”:比如从一段日志里找 error 字样、从 HTML 中提取某个标签内容、在用户输入中定位关键词。
match(pattern, s) 的行为,逻辑上 ≡ search('^' + pattern, s),即自动加了行首锚定。
但注意:^ 在多行模式下含义不同,而 match 始终只看整个字符串的真正开头,不受 re.MULTILINE 影响。
两者匹配成功时都返回 re.Match 对象,失败都返回 None。区别不在返回类型,而在“什么情况下算成功”。
别指望 match() 返回中间的匹配;也别以为 search() 会返回全部匹配——它只返回第一个。要找全部,请用 finditer() 或 findall()。