XPath 2.0 的 for、if、in 均为表达式而非语句,必须嵌入合法上下文;for 需 return 构造序列,if 必须带 else 且类型一致,in 仅用于成员判断且右操作数须为序列。
XPath 2.0 的 for、if、in 不是独立语句,而是表达式的一部分,必须嵌入在合法的 XPath 表达式上下文中(比如路径结尾、函数参数里),不能单独执行。
for 是一个序列映射构造器,类似函数式语言的 map,不是传统 for 循环。它必须配合 return 子句,且整个表达式返回一个序列。
for $x in $seq return $x * 2,$x 是绑定变量,$seq 必须是可迭代序列(如节点集、数字列表)return → 报错 XPDY0002(unexpected token "in")for $i in (1, 2, 3) return $i * 10
结果是序列:(10, 20, 30)
if 是三元表达式,不是控制语句。XPath 2.0 要求必须有 else 分支,否则语法错误(XPST0003)。
false(),非空→true())then 和 else 返回值类型最好一致;若不一致(如一个返回字符串、一个返回数字),XPath 引擎可能隐式转换,也可能报错(取决于实现)if (@type = 'email') then xdmp:log('found') 在标准 XPath 中无效——xdmp:log 是 MarkLogic 扩展,纯 XPath 2.0 没有副作用函数if (@price > 100) then 'expensive' else 'affordable'
in 是二元运算符,用于测试单个项是否属于某个序列,和 Python 的 in 类似,但**不能**出现在 for $x in ... 之外的任意位置作逻辑判断(比如不能写 @id in ('a', 'b') 当作谓词直接用——这是合法的;但不能写 if (@id in 'a') then ...,因为右边不是序列)。
@status in 'active' → 错,'active' 是字符串,不是序列;应写成 @status = 'active' 或 @status in ('active')
=(自动集合比较),in 更适合明确枚举多个候选值@role in ('admin', 'editor', 'reviewer')真正实用的写法往往是嵌套组合,比如过滤后映射:
for 遍历节点,再在 return 里用 if 分支处理,其中条件可能含 in
for $n in //item return if ($n/@cat in ('book', 'mag')) then $n/title else ()
() 表示跳过该节点,最终结果只含匹配项的 title
for 内部重复执行耗时路径(如 //config/value),应提前绑定到变量for $u in /users/user
return if ($u/role in ('vip', 'staff'))
then concat('VIP-', $u/id)

else $u/name最容易被忽略的是:所有这些表达式都运行在静态上下文里,没有变量赋值、没有状态、不能递归调用自身——它们只是对输入序列的一次性、无副作用的函数式变换。写之前先确认你的处理器(如 Saxon、BaseX、浏览器 DOM)确实支持 XPath 2.0;多数浏览器仅支持 XPath 1.0,for/if/in 会直接报语法错误。