本文介绍在 go 语言中去除连续重复字母(如 "worrld" → "world")的两种主流方法:基于 `strings.map` 的高效无正则方案,以及对正则回溯局限性的分析,并提供可直接运行的示例代码与关键注意事项。
Go 标准库的 regexp 包不支持 Perl 风格的环视(lookahead/lookbehind)断言,因此无法像 (?=(\w))\1+ 这类正则那样“仅匹配重复部分中的一个位置”。你尝试的 (.?)\1 实际上会匹配两个连续相同字符(如 "rr"),但替换时若简单用 $1 替代,仍需额外逻辑控制——这不仅冗余,还易出错(例如处理 Unicode 字符或边界情况时)。
更推荐的做法是绕过正则,采用流式遍历 + 状态记忆,strings.Map 正是为此场景设计的高效工具:
package main
import (
"fmt"
"strings"
)
func stripConsecutiveDups(s string) string {
var last rune
return strings.Map(func(r rune) rune {
if r != last {
last = r
return r // 保留首个出现的字符
}
return -1 // 跳过重复字符(-1 表示删除)
}, s)
}
func main() {
fmt.Println(stripConsecutiveDups("Hello Worrld")) // 输出: "Hello World"
fmt.Println(stripConsecutiveDups("aaabbbcccaaa")) // 输出: "abca"
fmt.Println(stripConsecutiveDups("????")) // 输出: "??"(正确支持 Unicode)
}✅ 优势说明:
⚠️ 注意事项:

总结:面对 Go 中正则能力的限制,优先选择标准库提供的语义化工具(如 strings.Map、strings.Builder)。它比强行模拟 lookahead 更可靠、更高效,也更符合 Go “简洁即美”的工程哲学。