本文详解如何利用 jsonata 的上下文变量(特别是 $$)对嵌套数组按字段分组、聚合数值,并重构为全新结构,解决常见聚合失效问题。
在 API 响应处理或 ETL 场景中,常需将扁平化的原始 JSON 数组按某字段(如 enterpriseid)分组,并对数值字段(如 bookingvalue)求和,最终输出结构清晰的聚合结果。JSONata 是专为 JSON 转换设计的轻量级查询语言,其函数式语法强大但上下文敏感——尤其在嵌套操作中,当前上下文($)易被隐式切换,导致路径解析失败。
以原始数据为例:
{
"response": [
{"enterpriseid": 53898, "enterprise": " Absolute F and B Facilities Management LLC ", "bookingvalue": 46},
{"enterpriseid": 53898, "enterprise": " Absolute F and B Facilities Management LLC ", "bookingvalue": 275},
{"enterpriseid": 53898, "enterprise": " Absolute F and B Facilities Management LLC ", "bookingvalue": 199.5},
{"enterpriseid": 53899, "enterprise": " testing Buyer ", "bookingvalue": 200}
]
}目标是按 enterpriseid 合并重复项,累加 bookingvalue,并包裹进 "output" 数组。
错误写法(如题中所试):
{
"output": $distinct(response.{
"enterpriseid": enterpriseid,
"enterprise": enterprise,
"bookingvalue": $sum($filter(response, function($item) {$item.enterpriseid = enterpriseid}).bookingvalue)
})
}问题在于:$filter(response, ...) 中的 response 在 $distinct 内部执行时,$ 指向的是当前迭代对象(即单个 {enterpriseid, enterprise, bookingvalue}),而非原始根对象,因此 response 未定义,$sum 返回 null。
正确解法是使用 $$ 引用原始输入根节点:
{
"output": $distinct(response.{
"enterpriseid": enterpriseid,
"enterprise": enterprise,
"bookingvalue": $sum($filter($$.response, function($item) { $item.enterpriseid = enterpriseid }).bookingvalue)
})
}该表达式输出完全符合预期:
{
"output": [
{
"enterpriseid": 53898,

"enterprise": " Absolute F and B Facilities Management LLC ",
"bookingvalue": 520.5
},
{
"enterpriseid": 53899,
"enterprise": " testing Buyer ",
"bookingvalue": 200
}
]
}{
"output": $$.response.$groupby(enterpriseid).{
"enterpriseid": $key,
"enterprise": $first(enterprise),
"bookingvalue": $sum(bookingvalue)
}
}掌握 $$ 的语义与适用场景,是写出健壮、可维护 JSONata 表达式的关键一步。推荐在 JSONata Exerciser 中实时验证逻辑,快速定位上下文问题。