HTML定时转PDF需服务端工具,Puppeteer最常用,配合cron每日执行;关键设printBackground:true,注意路径、字体和权限。
HTML 定时转 PDF 不是浏览器原生能力,必须借助服务端工具或自动化脚本实现。纯前端 JavaScript 无法直接生成带样式的 PDF 文件,更无法“定时”执行——那需要操作系统级调度(如 cron)或后台服务(如 Node.js 进程)。
Puppeteer 是最常用、最可控的方案:它启动真实 Chromium 实例,能完整渲染 CSS、字体、JavaScript 动态内容,生成高质量 PDF。
npm install puppeteer
setInterval() 或系统 cron 调用脚本,推荐后者(避免 Node 进程长期运行出错)page.pdf({ format: 'A4', printBackground: true }) ——printBackground: true 必须设为 true,否则背景色/图不显示file:// 协议加载,或起一个临时 HTTP 服务(推荐后者,避免跨域和资源加载失败)const puppeteer = require('puppeteer');
async function htmlToPdf() {
const browser = await puppeteer.launch();
const page = await browser.newPage();
await page.goto('https://www./link/4b98e90ba839623e88d5b3d6dce56562', { waitUntil: 'networkidle0' });
await page.pdf({
path: report_${Date.now()}.pdf,
format: 'A4',
printBackground: true
});
await browser.close();
}
// 每天上午 9 点执行(实际应由 cron 控制,此处仅示意)
// setInterval(htmlToPdf, 24 60 60 * 1000);
cron 是稳定可靠的定时机制,比在 Node 中用 setInterval() 更适合生产环境。
chmod +x /path/to/generate-pdf.js
crontab -e
0 9 * * * cd /path/to/project && /usr/bin/node /path/to/generate-pdf.js >> /var/log/pdf-gen.log 2>&1
/usr/bin/node 而非 node,cron 环境无 shell PATH 继承
如果服务器资源紧张、不需要 JS 渲染,wkhtmltopdf 启动快、内存低,但对 Flex/Grid、现代 CSS 支持弱,中文常需手动指定字体。
立即学习“前端免费学习笔记(深入)”;
apt-get install wkhtmltopdf(Ubuntu/Debian)wkhtmltopdf --enable-local-file-access --print-media-type --encoding utf-8 https://www./link/4b98e90ba839623e88d5b3d6dce56562 report.pdf
--enable-local-file-access 是关键,否则读取本地 HTML 或 CSS 失败--font-family "Noto Sans CJK SC" 并确保系统已安装该字体90% 的“转 PDF 失败”其实不是代码问题,而是环境或路径陷阱:
waitUntil: 'networkidle2' 或显式 await page.waitForSelector('#content')
printBackground: true,或 CSS 中用了 @media print 把内容隐藏了@font-face),要么在 Docker 中挂载字体目录whoami 和 env 对比 cron 环境与手动执行环境差异真正麻烦的从来不是“怎么写那几行代码”,而是让 PDF 在凌晨三点准时、稳定、样式分毫不差地落进指定目录——这取决于你是否提前压测过并发、是否监控了磁盘空间、是否验证过字体 fallback 链。别跳过日志和权限检查。