OOXML是微软主导制定的开放XML文档标准,2006年成为ECMA-376、2008年升级为ISO/IEC 29500,含WordprocessingML、SpreadsheetML、PresentationML和通用DrawingML,采用OPC ZIP打包机制,支持Transitional/Strict双模式及自定义扩展,实现跨平台互操作与长期归档。
Office Open XML(简称
OOXML)是一种基于 XML 的文档文件格式标准,由微软主导制定,2006 年被 ECMA 国际采纳为 ECMA-376,2008 年升级为国际标准 ISO/IEC 29500。它不是某种软件专属的私有格式,而是公开、可验证、可扩展的开放规范,目标是让不同办公软件之间真正实现互操作——比如 Word 文档能在 LibreOffice 中打开并保留样式,Excel 表格能被 Python 程序直接解析修改。
ECMA-376 标准定义了结构化、语义清晰的 XML 标记体系,按文档类型划分:
=SUM(A1:A10))、条件格式、数据验证、图表数据源等;OOXML 文件(如 test.docx)本质上是一个 ZIP 压缩包,内部不是单个大 XML,而是按功能拆分的多个“部件”(parts),这种结构叫 Open Packaging Conventions(OPC):
word/document.xml 存正文,xl/workbook.xml 存工作簿结构);[Content_Types].xml 统一声明(例如 application/vnd.openxmlformats-officedocument.wordprocessingml.document.main+xml);_rels/.rels 定义主部件入口,word/_rels/document.xml.rels 定义该文档引用的图片、样式等);ECMA-376 不是静态文档,已迭代至第五版(2025 年资料确认),关键演进方向包括:
my:customData),只要不破坏核心结构,其他软件可安全忽略——这对政务、金融等需定制元数据的场景很重要。OOXML 的价值远超文件后缀从 .doc 变成 .docx: