17370845950

新闻动态

如何在 Go 中高效去除字符串中连续重复的字符

本文介绍在 go 语言中去除连续重复字母（如 "worrld" → "world"）的两种主流方法：基于 `strings.map` 的高效无正则方案，以及对正则回溯局限性的分析，并提供可直接运行的示例代码与关键注意事项。

Go 标准库的 regexp 包不支持 Perl 风格的环视（lookahead/lookbehind）断言，因此无法像 (?=(\w))\1+ 这类正则那样“仅匹配重复部分中的一个位置”。你尝试的 (.?)\1 实际上会匹配两个连续相同字符（如 "rr"），但替换时若简单用 $1 替代，仍需额外逻辑控制——这不仅冗余，还易出错（例如处理 Unicode 字符或边界情况时）。

更推荐的做法是绕过正则，采用流式遍历 + 状态记忆，strings.Map 正是为此场景设计的高效工具：

package main

import (
    "fmt"
    "strings"
)

func stripConsecutiveDups(s string) string {
    var last rune
    return strings.Map(func(r rune) rune {
        if r != last {
            last = r
            return r // 保留首个出现的字符
        }
        return -1 // 跳过重复字符（-1 表示删除）
    }, s)
}

func main() {
    fmt.Println(stripConsecutiveDups("Hello Worrld")) // 输出: "Hello World"
    fmt.Println(stripConsecutiveDups("aaabbbcccaaa")) // 输出: "abca"
    fmt.Println(stripConsecutiveDups("????"))     // 输出: "??"（正确支持 Unicode）
}

✅ 优势说明：

零内存分配（除结果字符串外）：strings.Map 内部按 rune 迭代，天然支持 UTF-8；
时间复杂度 O(n)：单次遍历，无回溯开销；
语义清晰：通过 last 记录上一个有效字符，逻辑一目了然。

⚠️ 注意事项：

strings.Map 对空字符串、单字符输入均安全，无需额外判空；
若需区分大小写处理（如 "AaA" 不视为重复），当前逻辑已满足（'A' != 'a'）；
若需全局去重（非仅连续），应改用 map[rune]bool 辅助记录；
切勿在
Map 回调中修改 last 以外的状态变量——该函数可能被并发调用（尽管 strings.Map 当前是串行执行，但设计上应保持纯函数性）。

总结：面对 Go 中正则能力的限制，优先选择标准库提供的语义化工具（如 strings.Map、strings.Builder）。它比强行模拟 lookahead 更可靠、更高效，也更符合 Go “简洁即美”的工程哲学。

17370845950

关于我们

服务项目

广告推广

案例欣赏