xml.dom.minidom 是 Python 轻量级 DOM 解析器,适合中小型 XML 文件;支持创建、解析、修改和删除节点,但存在空白符解析、无 XPath、内存占用高等限制。
xml.dom.minidom 是 Python 标准库中轻量级的 DOM 解析器,适合处理中小型 XML 文件,语法直观、上手快,但不适用于超大文件或需要高性能解析的场景。
用 minidom.getDOMImplementation() 创建空文档,再通过 createElement 和 createTextNode 构建节点,最后用 appendChild 组织结构。
示例:生成一个简单的学生信息 XML:
from xml.dom.minidom import getDOMImplementation
impl = getDOMImplementation()
doc = impl.createDocument(None, "students", None)
root = doc.documentElement
student = doc.createElement("student")
student.setAttribute("id", "1001")
name = doc.createElement("name")
name.appendChild(doc.createTextNode("张三"))
student.appendChild(name)
age = doc.createElement("age")
age.appendChild(doc.createTextNode("20"))
student.appendChild(age)
root.appendChild(student)
print(doc.toprettyxml(indent=" "))
注意:toprettyxml() 默认会在每行末尾加换行符,若需去除空行,可传入 encoding="utf-8" 并自行处理字符串(如过滤空行),或使用第三方库如 xml.etree.ElementTree 替代。
用 parse()(读文件)或 parseString()(读字符串)加载 XML,返回 Document 对象。
常用操作包括:
建议在读取文本内容前先检查节点是否存在、是否为文本节点,避免 AttributeError。
minidom 支持动态修改文档结构:
例如更新学生年龄:
age_node = student.getElementsByTagName("age")[0]
age_node.firstChild.nodeValue = "21"
minidom 的 DOM 模型较“忠实”于 XML 规范,但也带来一些易错点:
不复杂但容易忽略。