MD5和SHA256的Sum()返回结构体,需用sum.Sum(nil)获取字节切片并转十六进制;MD5不安全,应优先使用SHA256;大文件哈希须流式处理;字符串需正确转[]byte并注意UTF-8编码。
很多人调用 md5.Sum() 或 sha256.Sum() 后直接 fmt.Println(),结果看到类似 {[123 45 67 ...]} 的字节切片输出,误以为“没算对”。其实这两个函数返回的是带字段的结构体,哈希值存在 Sum().Sum 字段里,且是 []byte 类型,需要显式转成十六进制字符串。
fmt.Sprintf("%x", sum.Sum(nil)) 或 hex.EncodeToString(sum.Sum(nil))
sum.Sum(nil) 中的 nil 表示不追加到已有切片,而是新建一个;传入非 nil 切片可复用底层数组(适合高频场景)Sum() 方法本身不重置状态,如需重复计算,得用新实例或调用 Reset()
md5 已被证实存在碰撞漏洞,RFC 6151 明确禁止其用于数字签名、密码存储等安全用途。Go 标准库仍保留它,主要是为了兼容旧协议(如 HTTP Digest 认证、某些校验和逻辑),但绝不该出现在新系统的鉴权或完整性校验中。
crypto/sha256,输出长度 32 字节(256 位),抗碰撞性强crypto/sha512,但多数场景 sha256 足够sha256 在现代 CPU 上比 md5 慢约 2–3 倍,但差距远小于安全性收益别把整个文件读进内存再调 hash.Sum(),尤其处理 GB 级日志或镜像时。标准库的 hash.Hash 接口支持流式写入,配合 io.Copy() 可边读边算,内存占用恒定在几 KB。
file, _ := os.Open("large.zip")
defer file.Close()
h := sha256.New()
io.Copy(h, file) // 自动分块读取并 Write()
sum := h.Sum(nil)
fmt.Printf("%x\n", sum)
h 实现了 io.Writer,所以能直接传给 io.Copy()
Copy 后检查 h.Size() 是否等于预期字节数os.Open() 后必须 defer file.Close(),否则句柄泄漏Go 字符串底层是 UTF-8 编码的只读字节序列,但初学者常误以为 md5.Sum([]byte("hello")) 和 md5.Sum([]byte("hello世界")) 是简单拼接——其实中文字符占多个字节,"世界" 对应 [228 184 150 229 165 189],不是单字节扩展。
[]byte(s
) 转换,不要用 string([]byte) 反向操作(会丢失原始字节)golang.org/x/text/encoding 转换