lxml.objectify将重复标签自动转为列表,单个标签为单个对象,访问前需用isinstance或getattr检查存在性与类型,推荐统一转为列表处理以避免AttributeError。
lxml.objectify 对重复标签的默认处理是把它们转成 Python 列表(list),而不是单个对象 —— 这是它和 etree 的关键区别之一,也是你“能直接用点号取值”的前提。
比如 XML 中有多个同名子元素:
- A
- B
- C
用 objectify 解析后:root = objectify.fromstring(xml)root.item 就是一个包含 3 个 StringElement 的 list,你可以用索引访问:root.item[0]、root.item[1] 等。
不能靠名字猜,得实际检查类型:
isinstance(root.item, list) 判断是不是多个,root.item 是单个 StringElement(不是 list)items = list(root.item) if isinstance(root.item, list) else [root.item]
如果 XML 里根本没有 ,root.item 会触发 AttributeError(不像 etree.find() 返回 None)。
getattr(root, 'item', []) 安全获取,默认返回空列表items = list(getattr(root, 'item', []))
items 都是可遍历的 list如果你希望所有字段都按“可能重复”来处理,可以封装一个辅助函数:
def aslist(obj, attr):
val = getattr(obj, attr, [])
return list(val) if isinstance(val, list) else [v
al] if val is not None else []
用法
for item in aslist(root, 'item'):
print(item.text)
这样就不用每次手动判断类型,逻辑更清晰。
基本上就这些。核心就三点:objectify 自动聚合重复标签为 list;单个标签不包 list;访问前务必做存在性或类型检查 —— 不复杂但容易忽略。