17370845950

XPath怎么选择所有兄弟节点 following-sibling和preceding-sibling用法
XPath中“所有兄弟节点”需用../child::排除自身,而非仅用following-sibling::或preceding-sibling::*;前者只选同父下全部子元素,后者分别只选当前节点后/前的同级节点。

XPath 中选择“所有兄弟节点”不能直接用 following-sibling::*preceding-sibling::* 就完事——它们只选**同级中位于当前节点之后或之前的所有节点**,但**不包含父节点下的全部兄弟**(比如不包括当前节点自己左侧+右侧全部,也不含父节点下所有子元素)。真正要选“所有兄弟节点”,得结合 parent::*/child::*,再排除自身。

✅ 正确获取“所有兄弟节点”(含前+后,不含自己)

最可靠写法是:先找父节点的所有子元素,再用 except(XPath 2.0+)或谓词过滤掉当前节点:

  • XPath 2.0/3.0+../child::* except .
  • XPath 1.0(兼容性更好)../child::*[not(ancestor-or-self::node() is $currentNode)](需外部绑定变量);更常用的是:../child::*[generate-id() != generate-id(current())](配合支持 generate-id 的处理器,如 XSLT)
  • 简单实用替代(XPath 1.0):../child::* 先拿到全部子节点,再在代码里手动过滤掉当前节点(推荐,尤其在 Selenium、lxml 等库中)

? following-sibling::* 是什么?

它选取**当前节点之后、在同一父元素下的所有同级节点**(顺序从上到下),只朝后,不回头:

  • //span[@id='target']/following-sibling::* → 选 id='target' 的 后面所有同级兄弟(如后面的 div、p、span 等)
  • //span[@id='target']/following-sibling::div → 只选后面所有的
  • 注意:following-sibling::* 不包含文本节点、注释等(除非显式写 following-sibling::text()
  • ◀ preceding-sibling::* 是什么?

    与 above 相反,它选**当前节点之前、同一父元素下的所有同级节点**(顺序从上到下,即 DOM 中靠前的先出现):

    • //span[@id='target']/preceding-sibling::* → 选该 前面所有同级元素
    • //span[@id='target']/preceding-sibling::*[1] → 选紧邻前面那个兄弟节点(最近的前一个)
    • 和 following-sibling 一样,它也不跨父级,不包含自己,也不含祖先

    ⚠️ 常见误区提醒

    别混淆这几个概念:

    • following-sibling ≠ “所有兄弟”:它只管后面,不管前面
    • parent::*/child::* ≈ “所有孩子”,也就是当前节点的全部兄弟(含自己),再减去自己才是纯兄弟集
    • following::*preceding::* 是**文档顺序上的后续/前置所有节点**(含后代、祖先的后代等),不是兄弟!范围大得多,慎用
    • 兄弟节点必须满足:相同父节点 + 同为元素节点(默认情况下 ::* 指 element node)

    基本上就这些。选兄弟不复杂,但容易忽略“不含自己”和“XPath 版本差异”这两个关键点。