不能只写 io.Copy(dst, src) 就完事,因为它仅复制字节流,不处理文件元信息、完整性校验、原子性及错误检查,易导致数据损坏或不一致。
Go 语言里用 io.Copy 做文件备份是可行的,但直接调用它不处理错误、不校验、不支持大文件断点或并发时,很容易出问题——比如备份中途失败导致目标文件损坏,或者源文件被修改造成数据不一致。
io.Copy(dst, src) 就完事io.Copy 只负责字节流复制,不关心文件元信息(如修改时间、权限)、不校验完整性、也不保证原子性。实际备份中常见问题包括:
os.Create 会清空它,若复制中断,原备份就丢了io.Copy 返回的 n, err,错误被忽略,误以为备份成功int 溢出(虽然 Go 1.21+ 的 io.Copy 内部用 int64,但仍需注意调用方逻辑)避免覆盖正在使用的备份文件,标准做法是写到临时路径,校验后再 os.Rename 替换。这能保证目标文件始终是完整可用的。
src, err := os.Open("data.log")
if err != nil {
log.Fatal(err)
}
defer src.Close()
tmpFile, err := os.Create("data.log.bak.tmp")
if err != nil {
log.Fatal(err)
}
defer tmpFile.Close()
n, err := io.Copy(tmpFile, src)
if err != nil {
log.Fatal("copy failed:", err)
}
if err := tmpFile.Close(); err != nil {
log.Fatal(err)
}
// 校验长度(可选,简单防截断)
srcStat, _ := src.Stat()
if n != srcStat.Size() {
log.Fatal("incomplete copy:", n, "vs", srcStat.Size())
}
// 原子替换
if err := os.Rename("data.log.bak.tmp", "data.log.bak"); err != nil {
log.Fatal(err)
}
os.Chtimes 和 os.Chmod
io.Copy 不复制修改时间、权限等。如果需要严格镜像,得手动设置:
src.Stat() 获取 os.FileInfo
os.Chtimes(dstPath, fi.ModTime(), fi.ModTime()) 同步时间戳os.Chmod(dstPath, fi.Mode
()) 复制权限(注意:Windows 上部分 mode 位无效)os.Readlink / os.Lchown),普通备份通常不需要生产环境建议在 io.Copy 时注入校验逻辑。例如用 hash.Hash 包实时计算 SHA256:
src, _ := os.Open("huge.bin")
defer src.Close()
dst, _ := os.Create("huge.bin.bak.tmp")
defer dst.Close()
hash := sha256.New()
writer := io.MultiWriter(dst, hash)
n, err := io.Copy(writer, src)
if err != nil {
log.Fatal(err)
}
expectedSum := srcHashSum // 需提前算好或从 manifest 读取
if !bytes.Equal(hash.Sum(nil), expectedSum) {
os.Remove("huge.bin.bak.tmp")
log.Fatal("checksum mismatch")
}
进度反馈可用 io.TeeReader + 自定义 WriteTo 实现,但要注意避免影响性能;对秒级敏感场景,建议改用带缓冲的 bufio.Reader 并分块读取。
真正麻烦的不是复制本身,而是“什么时候才算一次成功的备份”——时间戳是否一致、校验和是否匹配、目标文件是否可读、旧备份是否该清理。这些逻辑 io.Copy 一个都不管,得自己补全。