必须先用DOMParser解析XML字符串为XMLDocument,再调用其evaluate()方法执行XPath查询;直接在HTML文档中对XML字符串使用document.evaluate()会因HTML解析规则导致失败。
document.evaluate() 在 HTML5 中查 XML 文档必须先解析为 XMLDocument
直接在 HTML 文档里对 XML 字符串用 document.evaluate() 会失败——浏览器把 XML 当成普通 HTML 解析,标签名被小写化、自闭合标签被补全,//book/title 这类表达式根本找不到节点。必须先用 DOMParser 解析成独立的 XMLDocument 实例。
DOMParser 的 parseFromString() 第二个参数必须是 "application/xml" 或 "text/xml",用 "text/html" 就白解析了XMLDocument,它的 evaluate() 才支持标准 XPath 功能(比如轴、谓词、命名空间)document 是 HTMLDocument,不保证支持 XPath 轴如 ancestor:: 或函数如 local-name()
// 和 / 在深层嵌套 XML 中的行为差异// 是 descendant-or-self 轴的简写,会递归搜索所有层级;/ 是绝对路径起点,必须从根节点开始严格匹配。写错一个斜杠,结果可能全空。
,里面有 ... ,想定位所有作者:用 //author 可以,但 /author 一定返回空 下的 ,写 /library/section/shelf/book/title 比 //book/title 更快更准,尤其 XML 很大时//book[2]/title 表示“文档中第二个 元素下的 ”,不是“每个 的第二个子元素”——XPath 的谓词作用于当前轴上的节点集,不是嵌套层级evaluate() 查不到任何节点很多实际 XML(如 SVG、Atom、SOAP)带命名空间,例如 。此时 //item 会返回空,因为默认命名空间没绑定到任何前缀。
evaluate() 时传入命名空间解析函数,不能靠 setAttribute("xmlns", ...) 临时补(prefix) => prefix === "rss" ? "http://purl.org/rss/1.0/" : null,返回对应 URI 或 null
//rss:item,不能省略前缀——即使你只用了一个命名空间textContent 取值却忽略空白文本节点XML 中换行缩进会产生 Text 节点,evaluate() 返回的 NodeIterator 或 Snapshot 里混着它们。直接取 textContent 会把前后空白、换行全拼进去,看着像数据异常。
node.nodeType === Node.ELEMENT_NODE 再取值,跳过 TEXT_NODE
node.querySelector("title")?.textContent.trim() 配合 DOM 方法兜底(前提是已解析为 XMLDocument)iterateNext() 一定有值——要循环判断 !== null,否则容易报 TypeError
const xmlStr = `深层嵌套本身不难,难的是 XML 解析上下文、命名空间绑定、节点类型判断这三处——漏掉任意一个,`; const parser = new DOMParser(); const xmlDoc = parser.parseFromString(xmlStr, "application/xml"); const result = xmlDoc.evaluate("//book[@id='1']/title/text()", xmlDoc, null, XPathResult.STRING_TYPE, null); console.log(result.stringValue); // "JavaScript Guide" ![]()
JavaScript Guide John Doe
evaluate() 都可能静默失败或返回意外结果。