17370845950

如何使用Golang net/mail解析邮件信息_获取发件人和正文
net/mail 可解析 RFC 5322 邮件头并读取原始正文,但不处理 multipart 结构及 Base64/Quoted-Printable 解码,需配合 mime、io 等包手动实现解码与分段解析。

Go 标准库 net/mail 可以解析符合 RFC 5322 的原始邮件文本(如 .eml 文件内容或 SMTP 接收的原始报文),提取发件人、主题、日期等头部字段,以及解码后的正文。但它不负责解析 multipart 结构(如附件、HTML/Plain 混合体)或自动处理 Base64/Quoted-Printable 编码——这些需配合 mimeio 相关包手动处理。

1. 解析邮件头:获取发件人(From)、主题(Subject)等

使用 mail.ReadMessage 读取 io.Reader(比如 strings.NewReader(rawEmail)),得到一个 *mail.Message。它的 Header 是一个映射,键为标准头字段名(忽略大小写),值是字符串切片(因头字段可重复)。注意:值仍是 RFC 2047 编码的原始字节(如 =?UTF-8?B?5L2g5aW9?=),需用 mail.ParseAddressmime.DecodeWord 解码。

示例获取发件人:

from, err := msg.Header.AddressList("From")
if err == nil && len(from) > 0 {
    // 自动解码 name 和 address(支持 RFC 2047)
    senderName := from[0].Name   // 如 "张三"
    senderAddr := from[0].Address // 如 "zhangsan@example.com"
}

2. 提取纯文本正文:处理 Content-Type 和编码

net/mail 不解析 body,只提供 msg.Body(一个 io.Reader)。要读取正文,需结合 msg.Header.Get("Content-Type") 判断类型,并检查 "Content-Transfer-Encoding" 字段(如 base64, quoted-printable)进行解码。

  • 若 Content-Type 是 text/plaintext/html,且无 multipart,则直接读取 msg.Body 并按编码解码
  • 使用 mime.DecodeWord 解码 header 中的字段(如 Subject)
  • 使用 base64.NewDecoderquotedprintable.NewReader 包装 msg.Body 再读取

3. 处理 multipart 邮件(含 HTML/Plain/附件)

大多数现代邮件是 multipart/alternativemultipart/mixed。此时 msg.Body 是原始 multipart 数据流,需用 mime.Reader(来自 net/http 或第三方库如 github.com/emersion/go-message)递归解析各部分。标准库 net/mail 本身不提供 multipart 解析能力

简易做法(适用于简单 alternative):

  • 读取整个 msg.Body 到字节切片
  • mime.ParseMediaType 解析 Content-Type 获取 boundary
  • 手动按 boundary 分割(不推荐,易出错)
  • 更稳妥:用 github.com/emersion/go-message(专为邮件设计,兼容 RFC)

4. 完整小例子:解析简单 text/plain 邮件

以下代码解析一封无 multipart、Base64 编码的纯文本邮件:

import (
    "bytes"
    "encoding/base64"
    "fmt"
    "net/mail"
    "strings"
)

func parseSimpleMail(raw string) {
    r := strings.NewReader(raw)
    msg, _ := mail.ReadMessage(r)

    // 解析 From
    from, _ := msg.Header.AddressList("From")
    if len(from) > 0 {
        fmt.Printf("发件人: %s <%s>\n", from[0].Name, from[0].Address)
    }

    // 解析 Subject(RFC 2047 解码)
    subject := msg.Header.Get("Subject")
    decoded, _ := mime.DecodeWord(subject)
    fmt.Printf("主题: %s\n", decoded)

    // 解码并读取正文(假设是 base64 text/plain)
    encoding := strings.ToLower(msg.Header.Get("Content-Transfer-Encoding"))
    body := msg.Body

    if encoding == "base64" {
        body = base64.NewDecoder(base64.StdEncoding, body)
    }

    plain, _ := io.ReadAll(body)
    fmt.Printf("正文: %s\n", strings.TrimSpace(string(plain)))
}