HTML5是当前事实标准,XHTML已基本退出日常开发;HTML5只需,XHTML需完整DTD和xmlns声明,且严格遵循XML规则,但因浏览器支持有限及生态转向HTML5+JSON,XHTML仅适用于需XML解析的特定场景。HTML5 和 XHTML 是两种不同理念的标记语言,**HTML5 是事实标准,XHTML 已基本退出日常开发**。如果你现在新建一个项目却还在纠结用 XHTML,大概率是踩进了过时规范的坑。
这是最直观、最容易暴露问题的地方:
标签必须带 xmlns 属性:xmlns 或 DTD 错误,XHTML 文档会被某些 XML 解析器直接拒收(比如用 XMLHttpRequest.responseXML 加载时返回 null)XHTML 要求所有元素严格遵循 XML 规则,而 HTML5 容忍大量松散写法——但浏览器行为未必如你所想:
在 HTML5 中合法;在 XHTML 中必须写成
(注意斜杠前的空格是历史兼容要求) 在 HTML5 中可运行;XHTML 中必须闭合:
hello
world 在 HTML5 中会被浏览器自动修正为 hello
world;XHTML 直接报错,因为 不允许嵌套在 内
- 属性值不加引号(如
class=header)在 HTML5 中常见且有效;XHTML 中属于语法错误,必须写成 class="header"
大小写、属性名、命名空间这些细节决定是否真能当 XML 用
很多人以为“XHTML 就是把 HTML 标签改成小写”,其实远不止:
- 所有标签名、属性名必须小写:
是非法 XHTML,必须是
-
name 属性在表单控件中仍可用,但其他地方(如 )应改用 id ——XHTML 推荐用 id 替代 name 实现锚点
- 若你想用 JavaScript 的
DOMParser 或后端 XML 工具处理页面,XHTML 必须真正格式良好(well-formed):有且仅有一个根节点、所有标签配对、无未转义字符(如 & 必须写成 &)
- HTML5 对此完全不强制,
可直接运行;XHTML 中会解析失败
为什么
现在几乎没人用 XHTML 了
不是它不好,而是它的设计前提已失效:
- 当初推 XHTML,是希望网页能被 XML 工具链统一处理(XSLT 转换、XPath 查询等),但实际 Web 生态选择了更务实的路径:HTML5 + JSON + REST API
- 浏览器对
application/xhtml+xml MIME 类型的支持始终有限(尤其 IE 系列完全不支持),多数所谓“XHTML 网站”其实是用 text/html 发送的——此时浏览器根本不会按 XML 解析,所有 XHTML 严格性形同虚设
- HTML5 明确放弃 XHTML 风格的语法强制,但吸收了其合理内核(如语义化标签、
、),同时保留向后兼容,开发者不用再为斜杠和引号分心
XHTML 的语法铁律只在一种场景下仍有意义:当你明确需要一份可被 XML 解析器加载、验证、转换的静态文档(比如生成 PDF 的中间模板、政务数据交换格式)。除此之外, 就是唯一该写的声明。