优先用子元素承载数据本身,如复杂内容、含特殊字符、多值、有序场景;属性仅用于标识、开关、技术元数据等修饰性信息。
选属性还是子元素,核心就一条:看它是不是“数据本身”。是数据,就用子元素;是修饰、说明、控制类的附加信息,才考虑属性。
子元素更适合承载真正要交换、展示或处理的内容。
张三 ,以后要拆成姓和名,子元素能直接嵌套:张 三
、&等,子元素文本更自由
138… 0755… ,属性做不到
属性顺序无定义,解析器可任意重排属性不是不能用,而是得用在“配角位”上。
id="1024"、version="2.1"、lang="zh-CN",不参与业务逻辑,只供程序识别或路由
active="true"、required="yes",值固定、无扩展需求xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance",属于文档结构支撑,和业务数据无关timestamp,用属性解析更快(但仅在量极大且实测有差异时才值得权衡)有些字段看似简单,选错会埋雷。
date="2025-12-10"。将来可能要拆年月日、加时区、支持多格式,用子元素2025 12 更稳address="深圳市南山区..."。这类字段天然易扩展、易国际化,子元素才是正解refId="user_789"这种关联字段,属性可用;但如果是主键定义(如789 ),建议仍用子元素,保持语义统一能被XPath查出来当内容用的,就该是子元素;只用来过滤、跳转、标记的,才考虑属性。 比如//user[@status='active']查的是属性,//user/status[text()='active']查的是子元素值——前者快但僵硬,后者灵活但稍重。按你的主要使用方式反推即可。
基本上就这些。不复杂,但容易忽略语义分层。