DTD是XML的结构规范,定义标签、嵌套、属性及内容规则;无DTD仅需well-formed,有DTD且通过验证才为valid;声明分内部(紧贴XML声明后)和外部(SYSTEM/PUBLIC引用),位置或路径错误将导致解析失败。

DTD 不是 XML 本身,而是一份独立的规则说明书,告诉解析器:“这个 XML 文档里,哪些标签能用、怎么嵌套、哪些属性必须有、哪些内容只能是文字”。没有 DTD,XML 只需满足基本语法(比如标签闭合、大小写敏感)就是 well-formed;加上 DTD 并通过验证,才叫 valid——也就是真正“合法”的 XML。
常见错误是把 DTD 声明位置搞错,导致解析器直接忽略或报 Invalid DOCTYPE declaration。关键点:
]]> 中,不能有空格或注释干扰SYSTEM 或 PUBLIC,路径要相对准确;例如:,如果 note.dtd 不在同目录或路径写错,解析器会静默失败或报 Failed to load external entity
]>Tove Jani Reminder Don't forget me
#PCDATA 当万能兜底#PCDATA 表示纯字符数据,但它不能和子元素共存——这是最常踩的坑。比如写成 看似灵活,实际违反 DTD 规则,因为 #PCDATA 若出现,就必须是该元素的唯一内容类型(且不能加 * 或 + 修饰)。
(顺序强制)或 (可选+或选一),不是
不是它没用,而是限制太硬:不支持命名空间、没有数据类型(比如无法约束 age 必须是整数)、语法非 XML 风格(难读难维护)。现代项目基本用 XSD 替代,但 DTD 仍有不可替代的场景:
config.dtd 约束配置文件结构,比搭 XSD 工具链快得多真正麻烦的不是语法,而是当你要表达“这个字段可选但一旦出现就得是邮箱格式”——DTD 做不到,这时候就得承认:它只是个结构草图,不是契约全书。