Go中s[0]不能获取首字符,因string是UTF-8字节序列,需转为rune切片或用utf8.DecodeRuneInString按Unicode字符安全访问。
Go 语言里不能直接用 s[0] 拿到“第一个字符”,因为 string 底层是字节切片([]byte),不是 Unicode 字符数组。想安全访问或截取中文、emoji 等多字节字符,必须按 rune 处理。
s[i] 可能出错或返回乱码字符串字面量在 Go 中是 UTF-8 编码的只读字节序列。对中文或 emoji 执行 s[0] 返回的是首字节(比如 中 的 UTF-8 编码是 0xe4 0xb8 0xad,s[0] 就是 0xe4),不是完整字符,更不是 rune。
常见错误现象:
string 用 for i := 0; i + s[i] → 得到字节,不是字符,中文会显示为
s[0:2] 截取前两个字节 → 可能截断 UTF-8 编码,panic 或输出乱码len(s) 返回字节数,不是字符数(len("你好") == 6,但字符数是 2)[]rune 再索引这是最直观、适合中小长度字符串(len(s) )的做法。Go 运行时会把 UTF-8 解码为 Unicode 码点序列。
func charAt(s string, i int) (rune, bool) {
r := []rune(s)
if i < 0 || i >= len(r) {
return 0, false
}
return r[i], true
}
s := "Hello世界?"
if c, ok := charAt(s, 5); ok {
fmt.Printf("%c\n", c) // 输出:世
}
注意点:
[]rune(s) 都会分配新切片,频繁操作大字符串时有性能开销i
rune 切片和原 string 无关)utf8.RuneCountInString + strings.IndexRune 或循环解码如果要取 “前 3 个字符” 或 “从第 2 个字符开始截 4 个”,不能用字节偏移 s[start:end],得先算

推荐做法(兼顾清晰与可控):
func substringByRune(s string, start, count int) string {
if start < 0 || count < 0 {
return ""
}
r := []rune(s)
if start >= len(r) {
return ""
}
end := start + count
if end > len(r) {
end = len(r)
}
return string(r[start:end])
}
s := "a你好b?c"
fmt.Println(substringByRune(s, 1, 3)) // 输出:"你好b"
替代方案(零分配,适合超长文本或性能敏感场景):
utf8.DecodeRuneInString 手动迭代,累计字节偏移strings.IndexRune 定位某字符位置,再结合 utf8.RuneStart 判断是否在合法起始字节上bytes.Index 或正则匹配 Unicode 字符边界for i := 0; i
标准且安全的方式是用 range —— 它自动按 rune 迭代,并返回字节起始位置和 rune 值:
s := "αβγΔε"
for i, r := range s {
fmt.Printf("pos %d: %c (U+%04X)\n", i, r, r)
}
// 输出:
// pos 0: α (U+03B1)
// pos 2: β (U+03B2)
// pos 4: γ (U+03B3)
// pos 6: Δ (U+0394)
// pos 8: ε (U+03B5)
关键点:
i 是该 rune 在原字符串中的字节索引(不是序号),可用于后续字节级操作r 是真正的 Unicode 码点,可直接比较、转换、输出range 循环里对 s 做 s[i] 访问 —— i 不等于 rune 下标最易被忽略的一点:当你要做“按字符位置插入/删除”或“光标定位”这类编辑操作时,[]rune 转换虽然简单,但会丢失原始字节布局信息;如果后续还要跟网络协议、文件格式或 C 接口打交道,得随时记住“字符位置”和“字节位置”不是一回事,该缓存就缓存,该重算就重算。