str.strip()仅移除字符串首尾连续空白字符,不处理中间空格;lstrip()/rstrip()同理,且按字符集合而非顺序或前缀匹配;误用如lstrip("https://")会导致意外删字符。
很多人误以为 strip() 会“清理所有空白”,其实它只作用于字符串首尾连续的空白字符(包括空格、\t、\n、\r、\f、\v),中间哪怕全是空格也原封不动。
比如:" a b c ".strip() 结果是 "a b c" —— 开头两个空格和结尾两个空格没了,但中间的两个空格还在。
.replace(" ", "") 或正则 re.sub(r"\s+", "", s)
strip() 是惰性的:遇到第一个非目标字符就停,不会继续往里扫s.strip("x")),也是只处理两端连续出现的 "x",不是全局替换lstrip() 只动左边,rstrip() 只动右边,这点看似简单,但实际出问题常是因为没意识到它们的“字符集合”逻辑:
例如:"...xxx...".lstrip(".") → "xxx...";但 "..x.x..".lstrip(".") → "x.x..",因为 lstrip() 一旦碰到非 "." 字符(这里是 "x")就立刻停止,后面哪怕还有 "." 也不再处理。
"123abc456".lstrip("123") → "abc456",但 "321abc456".lstrip("123") 同样 → "abc456"(顺序无关)s.lstrip("https://") ,它会把每个字符 'h','t','t','p',':'... 都当独
"t" 或 "p"
这些场景下,边界函数行为和预期偏差最大:
.lstrip("http://") —— 改用 .removeprefix("http://")(Python 3.9+)或 url.removeprefix("https://").removeprefix("http://")
text.rstrip("\n") 只删末尾换行,但 text.rstrip() 会把末尾所有空白(包括空格、制表符)全干掉,可能破坏对齐"00123".lstrip("0") → "123" 没问题,但 "000".lstrip("0") → "",需额外判断空字符串它们都是 C 实现,O(n) 时间复杂度,且只遍历一次首尾,不建新字符串直到真需要。但要注意:
s.strip().lstrip("x").rstrip("y") 会创建多个中间字符串,不如一次性用正则或手动切片unicode 对象也支持,但传入 Unicode 字符串时,某些控制字符(如 \u2028 行分隔符)可能不被默认空白集识别\r\n:所有 strip 方法都认 \r 和 \n,所以 "\r\nhello\r\n".strip() 正确返回 "hello"
真正容易被忽略的是:这些方法对空字符串、None、不可变对象类型检查很严格,传错类型直接抛 AttributeError,而不是静默失败。