XPath中“所有兄弟节点”需用../child::排除自身,而非仅用following-sibling::或preceding-sibling::*;前者只选同父下全部子元素,后者分别只选当前节点后/前的同级节点。
XPath 中选择“所有兄弟节点”不能直接用 following-sibling::* 或 preceding-sibling::* 就完事——它们只选**同级中位于当前节点之后或之前的所有节点**,但**不包含父节点下的全部兄弟**(比如不包括当前节点自己左侧+右侧全部,也不含父节点下所有子元素)。真正要选“所有兄弟节点”,得结合 parent::*/child::*,再排除自身。
最可靠写法是:先找父节点的所有子元素,再用 except(XPath 2.0+)或谓词过滤掉当前节点:
../child::* except .
../child::*[not(ancestor-or-self::node() is $currentNode)](需外部绑定变量);更常用的是:../child::*[generate-id() != generate-id(current())](配合支持 generate-id 的处理器,如 XSLT)../child::* 先拿到全部子节点,再在代码里手动过滤掉当前节点(推荐,尤其在 Selenium、lxml 等库中)它选取**当前节点之后、在同一父元素下的所有同级节点**(顺序从上到下),只朝后,不回头:
//span[@id='target']/following-sibling::* → 选 id='target' 的 后面所有同级兄弟(如后面的 div、p、span 等)
//span[@id='target']/following-sibling::div → 只选后面所有的
- 注意:
following-sibling::* 不包含文本节点、注释等(除非显式写 following-sibling::text())
◀ preceding-sibling::* 是什么?
与 above 相反,它选**当前节点之前、同一父元素下的所有同级节点**(顺序从上到下,即 DOM 中靠前的先出现):
-
//span[@id='target']/preceding-sibling::* → 选该 前面所有同级元素
-
//span[@id='target']/preceding-sibling::*[1] → 选紧邻前面那个兄弟节点(最近的前一个)
- 和 following-sibling 一样,它也不跨父级,不包含自己,也不含祖先
⚠️ 常见误区提醒
别混淆这几个概念:
-
following-sibling ≠ “所有兄弟”:它只管后面,不管前面
-
parent::*/child::*
≈ “所有孩子”,也就是当前节点的全部兄弟(含自己),再减去自己才是纯兄弟集
-
following::* 和 preceding::* 是**文档顺序上的后续/前置所有节点**(含后代、祖先的后代等),不是兄弟!范围大得多,慎用
- 兄弟节点必须满足:相同父节点 + 同为元素节点(默认情况下
::* 指 element node)
基本上就这些。选兄弟不复杂,但容易忽略“不含自己”和“XPath 版本差异”这两个关键点。