Python处理XML最常用xml.etree.ElementTree(ET),轻量易用、标准库自带;支持解析、查找、遍历、修改和构建XML,自动处理转义。
Python处理XML最常用的是内置的xml.etree.ElementTree(简称ET),它轻量、易用、标准库自带,适合大多数日常解析与生成任务。
ElementTree把XML转成树状结构,根节点是Element对象,子节点用.find()、.findall()或XPath简写(如.find('book/title'))定位。支持直接遍历子元素:for child in root:。
ET.parse("file.xml")加载文件,或ET.fromstring(xml_str)解析字符串elem.text获取文本内容,elem.attrib获取属性字典tree.write("out.xml", encoding="utf-8", xml_declaration=True)保存不用手动拼标签和转义,用ET.Element()、ET.SubElement()逐层创建,自动处理特殊字符(如&、)和编码。
elem.set("name", "value"),设文本用elem.text = "text"
sub = ET.SubElement(parent, "item")
化可配合xml.dom.minidom或第三方库lxml
不是功能最多,而是“够用、顺手、无依赖”。相比lxml或xml.sax,它在简洁性和实用性之间平衡得最好。
find、iter、remove),学习门槛低{uri}tag语法)、注释、CDATA等,满足90%业务场景基本上就这些。真遇到超大XML、复杂XPath或XSLT需求,再考虑lxml;日常配置读写、接口数据交换、简单报表生成,ElementTree完全够用又省心。