使用xml.etree.ElementTree可解析XML,首先通过ET.parse()读取文件并获取根节点root,接着用root.findall()遍历book子节点,利用find()获取title、author、price等元素的文本内容,同时通过get()方法提取属性如id,支持.//语法进行递归查找,注意处理节点不存在情况及字符串转数值类型。
Python读取XML节点内容主要通过内置的xml.etree.ElementTree模块实现,操作简单且无需安装第三方库。本文带你一步步实战解析XML文件中的节点内容。
假设我们有一个名为books.xml的文件,内容如下:
使用ElementTree.parse()加载XML文件,获取根元素:
tree = ET.parse('books.xml')
root = tree.getroot()
print("根节点标签:", root.tag) # 输出: library
通过遍历root的子元素,访问每个book节点的内容:
输出结果:
书籍ID: 1如果只想获取所有节点,可以直接用findall或iter:
itles:输出所有书名。其中.//title表示递归查找所有title节点。
注意点:
FileNotFoundError
.find()时,若节点不存在会返回None,调用.text会出错,建议先判断是否存在float(book.find('price').text)
基本上就这些。掌握getroot()、find()、findall()和.text这几个核心方法,就能轻松处理大多数XML读取需求。