Python自动化报告核心是理清“数据→整理→呈现”流程:用pandas处理数据并生成HTML,Jinja2分离模板与逻辑,weasyprint转PDF或smtplib发邮件,辅以空数据/字段/路径校验。
用Python写自动化脚本生成报告,核心不是堆代码,而是理清“数据→整理→呈现”这条线。只要掌握几个关键模块和常用模式,半小时就能跑出一份可读、可复用、带格式的报告。
pandas不只是做分析,它天生适合当报告的数据中枢。读Excel、CSV或数据库结果后,直接用describe()、groupby().size()、to_html()等方法快速提取关键统计,避免自己循环算总数、平均值、重复项。
df.to_html(index=False, classes="table"),生成带class的HTML片段,后续好套CSS样式df.style.format({"rate": "{:.1%}", "amount": "{:,.0f}"}),再调.to_html()即可pd.concat([df1, df2], keys=["昨日", "本周"]) ,再用unstack()或reset_index()整理结构
ja2模板写报告,告别硬编码HTML把HTML结构和数据逻辑分开——模板写“长什么样”,Python脚本只管“填什么”。这样改样式不用动逻辑,换数据不用重写页面。
report.html.j2,里面用{{ title }}、{% for row in data %}...{% endfor %}、{{ stats.total | round(2) }}这类语法env = jinja2.Environment(loader=jinja2.FileSystemLoader(".")); template = env.get_template("report.html.j2")
html = template.render(title="销售日报", data=df.to_dict("records"), stats={"total": 1284.5})
生成HTML只是中间步。最终交付常需PDF存档或邮件通知,这两步有成熟方案,几行代码就能串起来。
weasyprint:安装pip install weasyprint,然后WeasyPrint(html).write_pdf("report.pdf"),支持CSS打印样式smtplib + email标准库:构造MIMEText(HTML正文)、MIMEApplication(附件),连上公司SMTP服务器即可发送os.getenv("EMAIL_PASS")
基本上就这些。不复杂但容易忽略的是:每次运行前检查数据是否为空、字段名是否变动、路径是否存在。加两三行if df.empty: raise ValueError("无数据,跳过报告生成"),能省下半夜排查的时间。