使用第三方库可删除PDF注释,首选Apache PDFBox或iText。1. PDFBox通过page.removeAnnotation(annot)遍历移除页面注释;2. iText 7需解析PdfArray并过滤Subtype类型后重建数组;3. 操作前需解密PDF,删除后须保存文件;4. 注意嵌套结构、交互影响及合规性验证;5. PDFBox适合开源场景,iText适合精细控制需求。
Java本身不直接支持PDF操作,需借助第三方库。最常用的是Apache PDFBox和iText,两者都可删除PDF中的注释(如高亮、下划线、文本注释等),但实现方式和限制略有不同。
PDFBox 2.x 提供了对注释(PDAnnotation)的完整访问能力。每个页面的注释保存在 PDPage.getAnnotations() 中,可遍历并移除:
page.getAnnotations() 获取注释列表page.removeAnnotation(annotation)
for (PDAnnotation annot : page.getAnnotations()) {
page.removeAnnotation(annot);
}
iText 7 的 PdfPage 提供 getAnnotations(),返回 PdfArray,需手动解析和过滤:
PdfDictionary
Subtype 字段(如 Text、Highlight、Underline)决定是否删除page.getPdfObject().removeItem(PdfName.Annots) 清空全部,或重建注释数组剔除目标项pdfDoc.close() 保存实际操作中容易忽略以下细节:
document.setUnethicalReading(true) 或提供密码),否则抛出 BadPasswordException
preFlight 工具)基本上就这些。选PDFBox适合轻量、开源优先场景;选iText 7适合已有iText生态或需要精细控制subtype的项目。不复杂但容易忽略解密和重保存步骤。