本文旨在解决在过滤深度嵌套的对象数组时,如何保留匹配项的父级层级结构的问题。通过将数据结构统一为使用`children`键表示子项,并采用自定义的递归过滤函数,可以有效地实现这一目标,确保仅包含符合条件的子项及其所有祖先节点,同时保持数据结构的完整性。
在处理复杂的、多层级的数据结构(如产品目录、组织架构等)时,我们经常需要根据特定条件对数据进行深度过滤。一个常见的挑战是,当子节点满足过滤条件时,如何确保其所有父节点也被保留在结果中,即使这些父节点本身不直接满足过滤条件。传统的深度过滤库,如deepdash的_.filterDeep,在默认情况下可能会移除不匹配的父节点,导致结果丢失上下文信息。
考虑一个包含多层产品分类的数组,每个产品都有唯一的code。我们的目标是根据code进行搜索,并返回所有匹配的产品及其完整的祖先路径(从顶层分类到产品本身)。
原始数据结构可能如下所示:
const products_array = [
{
name: 'Food to Go',
filter: 'food',
categories_list: [ // 第一层子项
{
name: 'Bepulp Compostable',
sub_categories: [ // 第二层子项
{
name: 'BOWLS & CONTAINERS',
products: [ // 第三层子项
{
type: 'RECTANGULAR',
products_list: [ // 第四层子项 (实际产品)
{ color: 'natural', code: 'PAP46120', description: 'Rectangular tray 600ml' },
{ color: 'natural', code: 'PUL46130', description: 'Rectangular tray 950ml' },
// ...更多产品
]
},
// ...更多类型
]
},
// ...更多子分类
],
},
// ...更多分类
],
},
// ...更多顶级产品组
];如果使用 deepdash 的 _.filterDeep 并且只在叶子节点上匹配,结果可能会是这样的:
const current_output = [
{
categories_list: [
{
sub_categories: [
{
products: [
{
products_list: [
{ code: 'PUL46130' },
{ code: 'PUL51601' },
// ...
]
}
]
}
]
}
]
}
];可以看到,current_output 仅保留了匹配项及其直接父级的空壳,丢失了所有父节点的其他属性(如name, filter, color等),并且层级结构也变得不完整。
我们期望的输出是这样的:如果某个产品(例如 code: 'PUL46130')匹配,那么它的所有父级(RECTANGULAR 类型、BOWLS & CONTAINERS 子分类、Bepulp Compostable 分类、Food to Go 顶级组)都应该被完整地保留下来,包括它们的非子项属性。
const expected_output = [
{
name: 'Food to Go',
filter: 'food',
color: '#f9dd0a',
categories_list: [
{
name: 'Bepulp Compostable',
sub_categories: [
{
name: 'BOWLS & CONTAINERS',
products: [
{
type: 'RECTANGULAR',
products_list: [
{ color: 'natural', code: 'PUL46130', description: 'Rectangular tray 950ml' },
{ color: 'clear', code: 'PUL51601', description: 'rPET lid' },
// ...其他匹配产品
]
},
// ...其他匹配类型
]
},
// ...其他匹配子分类
],
},
// ...其他匹配分类
],
},
// ...其他匹配顶级产品组
];为了优雅地实现这种带有层级保留的深度过滤,一个有效的策略是统一数据结构中表示子节点的键名,例如全部使用children。然后,我们可以编写一个自定义的递归过滤函数。
如果你的原始数据结构像products_array那样,子节点键名不统一(categories_list, sub_categories, products, products_list),你需要先将其转换为统一使用children键的结构。例如:
const transformed_products = [
{
name: 'Food to Go',
filter: 'food',
color: '#f9dd0a',
children: [ // 原来的 categories_list
{
name: 'Bepulp Compostable',
children: [ // 原来的 sub_categories
{
name: 'BOWLS & CONTAINERS',
children: [ // 原来的 products
{
name: 'RECTANGULAR', // 或者 type 属性
children: [ // 原来的 products_list
{ name: 'PUL46120', color: 'natural', code: 'PUL46120', description: 'Rectangular tray 600ml' },
{ name: 'PUL46130', color: 'natural', code: 'PUL46130', description: 'Rectangular tray 950ml' },
// ...
]
},
// ...
]
},
// ...
],
},
// ...
],
},
// ...
];注意:此转换步骤本身不在本教程的过滤函数中实现,但它是使以下递归过滤函数简洁高效的前提。
核心思路是:对于每个节点,首先检查它是否满足过滤条件。如果满足,则保留该节点。如果它不满足,但它的任何子节点满足过滤条件,那么也保留该节点(因为它是一个祖先),并对其子节点进行递归过滤。
/**
* 深度复制对象,避免直接修改原数据
* @param {Object} o - 要复制的对象
* @returns {Object} 复制后的对象
*/
function copy(o) {
return Object.assign({}, o);
}
/**
* 递归过滤深度嵌套的对象数组,并保留匹配项的父级层级
* @param {Array假设我们已经将原始数据转换成了 transformed_products 结构。
// 假设 transformed_products 已经准备好 // ... (transformed_products 数据结构如上所示) const searchVal = 'PUL'; // 搜索包含 'PUL' 的产品 const filteredResult = filterDeepHierarchy(transformed_products, searchVal); console.log(JSON.stringify(filteredResult, null, 2));
运行上述代码,你将得到一个与期望输出类似的结果,其中所有匹配PUL的产品及其完整的父级层级都被保留。
通过采用这种统一数据结构和自定义递归过滤的方法,我们可以有效地解决在深度嵌套对象数组中保留父级层级的问题,从而生成既精确又具有完整上下文的过滤结果。