DOMParser是解析XML字符串最可靠方式,现代浏览器均支持;IE9–11需回退ActiveXObject;必须用"text/xml"参数并检查parsererror或parseError确保解析成功。
DOMParser 解析 XML 字符串是最可靠方式现代浏览器都支持 DOMParser,它专为解析 XML/HTML 字符串设计,比老式 XMLHttpRequest 或 ActiveXObject 更简洁、更安全。注意:不能用 JSON.parse(),XML 不是 JSON;也不能直接用 innerHTML,会丢失命名空间和处理指令。
关键点:
DOMParser 的 parseFromString() 第二个参数必须是 "text/xml"(不是 "application/xml" 或空字符串,否则在 Safari/Firefox 中可能失败)document.documentElement.tagName === "parsererror" 判断)querySelector、getElementsByTagName 等操作const xmlStr = ``; const parser = new DOMParser(); const xmlDoc = parser.parseFromString(xmlStr, "text/xml"); // 检查是否解析失败 if (xmlDoc.querySelector("parsererror")) { console.error("XML 解析失败:", xmlDoc.querySelector("parsererror").textContent); } else { const items = xmlDoc.getElementsByTagName("item"); console.log(items.length); // 2 } - A
- B
ActiveXObject
IE9–11 不支持 DOMParser 解析 XML(只支持 HTML),必须回退到 ActiveXObject("Microsoft.XMLDOM")。这不是“可选优化”,而是不加这段代码在 IE 下必然报错。
注意点:
async 必须设为 false,否则无法同步获取结果validateOnParse 设为 false 可避免因 DTD 或外部实体导致的加载阻塞parseError.errorCode !== 0 来判断是否解析失败function parseXML(xmlStr) {
if (typeof DOMParser !== "undefined") {
return new DOMParser().parseFromString(xmlStr, "text/xml");
} else if (typeof ActiveXObject !== "undefined") {
const doc = new ActiveXObject("Microsoft.XMLDOM");
doc.async = false;
doc.validateOnParse = false;
doc.loadXML(xmlStr);
if (doc.parseError.errorCode !== 0) {
throw new Error(`XML 解析错误: ${doc.parseError.reason}`);
}
return doc;
}
}
DOMParser 默认能正确处理 CDATA 块和 UTF-8 编码的中文,但若 XML 声明中指定了其他编码(如 encoding="gb2312"),而字符串实际是 UTF-8,就会乱码——此时应确保传入的字符串已是正确的 Unicode 字符串(浏览器环境通常已自动转义)。
命名空间支持有限:
)会被保留前缀,但 getElementsByTagName("item") 查不到,得用 getElementsByTagNameNS("*", "item")
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance")会被保留在 attributes 集合中,但不会自动映射到 JS 对象属性Text 节点子节点存在,可用 node.textContent 安全读取innerHTML 解析有人尝试把 XML 字符串赋给 div.innerHTML 再取 div.children,这看似简单,但后果严重:
、)会被浏览器当作未知 HTML 标签,强制标准化(例如变成 且丢失子节点)xmlns、xsi:type 全部丢失
触发控制台警告哪怕只是临时调试,也请坚持用 DOMParser —— 它多敲不了几行字,但省掉后续三天排查时间。
真正容易被忽略的是错误检测逻辑。很多人只写 parseFromString 就完事,结果 XML 格式一错,后面 getElementsByTagName 返回空集合,程序静默失败。务必检查 parsererror 或 IE 的 parseError。