最可靠方案是 html-pdf-cli(基于 Puppeteer):支持 A4、页边距等参数,自动等待 DOM 加载,需本地 HTTP 服务或 --no-sandbox;wkhtmltopdf 仅适用于简单静态页且需 ≥0.12.6 版本;weasyprint 适合无 Node 环境,纯 Python 实现但不执行 JS。
puppeteer 命令行直接转 HTML 为 PDF 最可靠浏览器渲染引擎生成的 PDF 质量最高,puppeteer(基于 Chromium)是目前命令行下最稳定的选择。它能正确处理 CSS @media print、JavaScript 渲染、字体嵌入和分页,远胜于老旧的 wkhtmltopdf(已停止维护,不支持现代 CSS)。
安装后无需写 JS 脚本也能快速转换:
npx puppeteer render --pdf output.pdf input.html
但注意:puppeteer 默认不带 render CLI;需额外安装封装工具或自己写一行脚本。更通用的做法是用轻量封装 html-pdf-cli(底层仍是 Puppeteer):
npm install -g html-pdf-cli html-pdf-cli input.html output.pdf
--viewport-width、--format(如 A4)、--margin-top 等参数DOMContentLoaded,若页面有异步数据,需加 --wait-for-selector 指定加载完成标志file://
协议直读(会触发 CORS),必须起一个本地 HTTP 服务或用 --no-sandbox 启动 Chromium(仅限可信环境)wkhtmltopdf 还能用吗?兼容性与风险点可以,但只建议用于简单静态页面,且必须确认版本 ≥ 0.12.6(旧版对 Flex/Grid 支持极差)。常见报错如 QPainter::begin: Paint device returned engine == 0, type: 2,本质是缺少系统依赖(如 Ubuntu 需装 libxrender1 libfontconfig1 libx11-xcb1)。
典型命令:
wkhtmltopdf --page-size A4 --margin-top 20 --margin-bottom 20 input.html output.pdf
--enable-local-file-access 必须加,否则无法加载本地 CSS/JS--javascript-delay 2000 可缓解 JS 渲染未完成问题,但不如 Puppeteer 的 waitFor 精确--outline-depth 3 --font-family "SimSun",且确保该字体已安装weasyprint 而非 pdfkit
pdfkit 只是 wkhtmltopdf 的 Python 封装,没解决底层缺陷;而 weasyprint 是纯 Python 实现,支持 CSS3 大部分特性(包括 @page、break-before),且无二进制依赖。
pip install weasyprint python -m weasyprint input.html output.pdf
weasyprint input.html output.pdf --font-config /path/to/fonts.conf
chrome --headless --print-to-pdf?Chrome 官方确实支持该参数,但实际限制极多:
http:// 或 https://),不接受 file:// 路径--print-to-pdf=output.pdf --print-to-pdf-no-header --virtual-time-budget=5000 不生效)@media print 中的 break-after 常被忽略真正稳定的方案仍是封装好的工具链,而非裸调 Chrome 参数。如果已有 Node.js 环境,html-pdf-cli 是最省心的起点;若服务器受限(如无 GUI、无 Node),weasyprint 更可控。