用 xmltodict + pyyaml 是最简洁可靠的 XML 转 YAML 方案:xmltodict 将 XML 解析为嵌套字典(属性转 @ 开头键,重复标签转列表),PyYAML 再格式化输出为可读 YAML;支持文件读写、UTF-8 编码和异常处理。
用 Python 将 XML 转为 YAML,核心思路是:先解析 XML 成 Python 原生数据结构(如字典、列表),再用 YAML 库将其序列化输出。关键在于 XML 结构到嵌套字典的合理映射,而非简单字符串替换。
xmltodict 能把 XML 树直接转成接近 JSON 的嵌套字典(保留属性、文本、子元素关系),PyYAML 则负责把字典格式化输出为可读 YAML。两者配合,几行代码就能完成转换。
pip install xmltodict pyyaml
import xmltodict import yamlxml_str = '''
''' Alice 30reading swimming 解析 XML → OrderedDict → 转普通 dict(可选)
data = xmltodict.parse(xml_str)
输出为 YAML 字符串(默认不带引号,缩进2空格)
yaml_str = yaml.dump(data, default_flow_style=False, indent=2, allow_unicode=True) print(yaml_str)
xmltodict 默认把属性转为以 @ 开头的键(如 @id),把元素内纯文本转为 #text 键。这对多数场景足够清晰,但需注意以下情况:
{'#text': 'xxx'}
),会被自动转为列表 —— 这正是 YAML 中数组的自然表示@ 前缀或自定义键名,可在 parse() 时传入 attr_prefix='' 或 attr_prefix='_' 等参数实际使用中多为文件间转换,注意编码和异常处理:
encoding='utf-8' 显式指定编码encoding='utf-8',并设 allow_unicode=True 避免中文乱码
import xmltodict import yamltry: with open('input.xml', encoding='utf-8') as f: xml_data = f.read() data = xmltodict.parse(xml_data)
with open('output.yaml', 'w', encoding='utf-8') as f: yaml.dump(data, f, default_flow_style=False, indent=2, allow_unicode=True)![]()
except Exception as e: print(f"转换失败:{e}")
替代方案:用标准库 xml.etree.ElementTree + 手动构建字典
如果不想引入第三方库(如受限环境),可用 Python 内置
xml.etree.ElementTree,但需自己递归遍历节点、处理属性/文本/子元素,并决定如何表示空元素或混合内容。工作量大、易出错,仅建议用于极简 XML 或学习目的。
基本上就这些。用 xmltodict + pyyaml 是目前最实用、稳定、可读性高的组合,能应对绝大多数真实 XML 场景,且代码干净易维护。