推荐使用xml.etree.ElementTree或lxml生成复杂XML嵌套结构,避免手动拼接;ElementTree适合多数场景,通过SubElement逐级构建并设属性与文本;lxml支持命名空间和自动缩进;字典递归法可实现数据驱动的动态生成。
用Python生成复杂的XML嵌套结构,核心是选对工具、理清层级逻辑、避免手动拼接字符串。推荐使用 xml.etree.ElementTree(标准库,轻量可靠)或 lxml(功能更强,支持XPath、命名空间、漂亮打印等)。手动字符串拼接容易出错,不推荐用于复杂嵌套。
ElementTree 适合大多数场景。关键思路是:从根节点开始,逐级创建子元素,用 append() 或 SubElement() 添加子节点,用 set() 设置属性,用赋值方式设置文本内容。
ET.Element() 创建根节点ET.SubElement(parent, tag, attrib={}) 快速添加带属性的子节点SubElement 实现深度嵌套.text,尾部空白用 .tail(较少用)示例:生成含客户、订单、多个商品的结构
import xml.etree.ElementTree as ETroot = ET.Element("business") client = ET.SubElement(root, "client", id="C1001") client.set("type", "premium")
order = ET.SubElement(client, "order", order_id="ORD-789") ET.SubElement(order, "date").text = "2025-06-15" items = ET.SubElement(order, "items")
item1 = ET.SubElement(items, "item", sku="SKU-001") ET.SubElement(item1, "name").text = "Laptop" ET.SubElement(item1, "qty").text = "1"
item2 = ET.SubElement(items, "item", sku="SKU-002") ET.SubElement(item2, "name").text = "Mouse" ET.SubElement(item2, "qty").text = "3"
tree = ET.ElementTree(root) tree.write("output.xml", encoding="utf-8", xml_declaration=True)
当XML需严格遵循命名空间(如 SOAP、Atom),或需要可读性高的格式化输出时,lxml 更合适。它原生支持 pretty_print=True 和命名空间声明。
pip install lxml
{namespace}tag 语法声明带命名空间的标签etree.tostring(..., pretty_print=True, encoding="unicode") 直接获得缩进良好的字符串etree.Comment、etree.PI 等高级节点类型示例:带命名空间的配置文件片段
from lxml import etreeNS = {"cfg": "https://www./link/98a5ad54e01fee0f3a9b88257b81c878"}
root = etree.Element("{https://www./link/98a5ad54e01fee0f3a9b88257b81c878}config") server = etree.SubElement(root, "{https://www./link/98a5ad54e01fee0f3a9b88257b
81c878}server") etree.SubElement(server, "{https://www./link/98a5ad54e01fee0f3a9b88257b81c878}host").text = "api.example.com" etree.SubElement(server, "{https://www./link/98a5ad54e01fee0f3a9b88257b81c878}port").text = "443"
自动缩进输出
print(etree.tostring(root, pretty_print=True, encoding="unicode"))
若嵌套结构来自配置或用户输入(如 JSON/YAML 转 XML),可写一个通用转换函数。规则:字典键为标签名,值为字符串(设为 .text)、字典(递归为子节点)或列表(多个同名子节点)。
.text
@attr 键定义属性None 值,忽略非法键(如以 @ 开头但非属性)这种模式让数据驱动结构更清晰,适合模板化生成。
生成复杂 XML 时容易踩的几个坑:
encoding="utf-8" 和 xml_declaration=True
xml.sax.saxutils.escape() 转义内容,而非标签名items_elem = build_items_list(items_data),再 order.append(items_elem)
不复杂但容易忽略。