GPath是Groovy内置的路径表达式语法,专为遍历XmlSlurper/JsonSlurper解析后的嵌套数据设计,通过点号链式访问、@属性名、text()等实现简洁导航,区别于XPath和JSONPath。
GPath 是 Groovy 内置的路径表达式语法,专为遍历嵌套数据结构(如 XmlSlurper 解析后的 XML、JsonSlurper 解析后的 JSON、List/Map)设计。它看起来像属性访问,但背后是动态方法调用和重载操作符,不是标准规范,也不依赖外部引擎。
关键区别:XPath 是通用查询语言,需显式调用 evaluate();而 GPath 在 Groovy 中直接作用于对象,比如 xml.book.author 会自动匹配所有 下的 节点,返回一个 NodeChild 列表。
XmlSlurper 是 Groovy 推荐的轻量级 XML 解析器,解析后返回可 GPath 导航的对象树。它默认忽略空白文本节点,适合快速提取内容。
常见操作包括:
.)逐级下钻,如 xml.root.child.grandchild
xml.item)find{} 或 findAll{} 配合 GPath 表达式,如 x
ml.book.find{ it.@category == 'fiction' }
@属性名,如 book.@id 获取 的 id 值text() 方法,如 author.text()
def xml = new XmlSlurper().parseText('''
The Great Gatsby
F. Scott Fitzgerald
Sapiens
Yuval Noah Harari
''')
// 获取所有书名
def titles = xml.book.title*.text()
// → ['The Great Gatsby', 'Sapiens']
// 找出 fiction 类别的书的作者
def fictionAuthors = xml.book.findAll{ it.@category == 'fiction' }.author*.text()
// → ['F. Scott Fitzgerald']
XmlParser 返回的是标准 DOM-like Node 对象,不支持 GPath 的点号链式访问(如 node.book.title 会报 MissingPropertyException)。它更接近 Java 原生 XML 处理,适合需要修改节点、保留注释/命名空间等场景,但牺牲了 GPath 的简洁性。
如果你写了 new XmlParser().parse(...) 却想用 GPath,会遇到:
groovy.lang.MissingPropertyException: No such property: book for class: groovy.util.Nodeit.@attr 不生效,必须改用 it.attribute('attr')
it.children() 才能拿到子节点,无法直接 it.child
所以:要 GPath,必须用 XmlSlurper;要精确控制或写回 XML,再考虑 XmlParser + 手动遍历。
GPath 看似简单,但 Groovy 的动态性和懒加载特性会让一些行为出人意料:
xml.nonexistent 没有匹配项,也返回空 NodeChild 列表,不会 NPE,但 text() 会返回空字符串,size() 是 0 —— 别用 == null 判断是否存在)必须用 new XmlSlurper(false, true) 关闭命名空间感知,或用 declareNamespace 注册前缀,否则 GPath 匹配失败xml.book 不是立即执行,而是返回一个代理对象;只有调用 text()、size() 或参与迭代时才真正解析。这在循环中重复调用 xml.book 是安全的,但不要误以为它是“缓存结果”最常被忽略的一点:GPath 表达式本身不抛异常,错误只在你试图从空结果调用方法时暴露(比如对空列表调 [0].text()),建议用 ?.text() 或先检查 size() > 0。