本文介绍如何通过递归下降解析器将括号嵌套表达式(如 `["(", "a", "&", "b", ")", "|", "c"]`)构建成 n 叉树,并支持在任意深度动态定位、修改或添加子节点,避免硬编码 `.nodes[x].nodes[y]...`。
在处理多层嵌套逻辑表达式(如 ["(", "MORE", "&", "(", "COMPLICATED", "|", "(", "EXPRESSION", "&", "PRESENTING", ")", "|", "MANY", ")", ")", "|", "(", "DEEPER", "&", "(", "LEVELS", "|", "FOR", "|", "TREE", ")", ")"])时,传统“逐级索引”方式(如 root.nodes[0].nodes[1].nodes[2].add_node(...))既不可扩展也不可维护——因为嵌套深度动态变化(2 层到 5 层不等),无法预知路径长度。
根本解法是用递归替代路径拼接:不构造字符串形式的 .nodes[0].nodes[2],而是设计一个能接受“路径坐标列表”的通用访问函数,并配合递归建树逻辑实现自顶向下的结构化构建。
我们重构树类,增强其可操作性,并提供 get_node_by_path() 和 set_child_at_path() 等工具方法:
class NonBinTree:
def __init__(self, val):
self.val = val
self.nodes = [] # 子节点列表,支持任意数量子节点
def add_node(self, val):
"""添加新子节点(值为 val 的新 Node)"""
self.nodes.append(NonBinTree(val))
return self.nodes[-1]
def get_node_by_path(self, path):
"""
根据路径列表访问节点,例如 path=[0, 1, 2] → root.nodes[0].nodes[1].nodes[2]
若路径越界或非整数,抛出 IndexError 或 TypeError
"""
node = self
for idx in pat
h:
if not isinstance(idx, int):
raise TypeError(f"Path index must be int, got {type(idx).__name__}")
if not (0 <= idx < len(node.nodes)):
raise IndexError(f"Index {idx} out of range for node with {len(node.nodes)} children")
node = node.nodes[idx]
return node
def set_child_at_path(self, path, new_child):
"""
在指定路径位置替换子节点(path[:-1] 定位父节点,path[-1] 指定下标)
例如 path=[0, 2] 表示:root.nodes[0] 的第 2 个子节点被 new_child 替换
"""
if not path:
raise ValueError("Path cannot be empty for set_child_at_path")
parent_path, child_idx = path[:-1], path[-1]
parent = self if not parent_path else self.get_node_by_path(parent_path)
if not isinstance(child_idx, int) or not (0 <= child_idx < len(parent.nodes)):
raise IndexError(f"Invalid child index {child_idx} for parent with {len(parent.nodes)} children")
parent.nodes[child_idx] = new_child
def __repr__(self):
children_repr = ", ".join(repr(n) for n in self.nodes)
return f"NonBinTree({self.val}): [{children_repr}]"核心思想是迭代器 + 递归下降:用 iter(expr) 创建消耗式遍历器,每遇到 "(" 就递归调用解析子表达式,遇到 ")" 或运算符时回溯。该方法天然支持无限嵌套,无需手动管理栈或深度计数。
def expr_to_tree(expr):
it = iter(expr)
def parse_operand():
token = next(it, None)
if token is None:
raise ValueError("Unexpected end of expression")
if token == "(":
return parse_expr()
elif token in ("&", "|", ")"):
raise ValueError(f"Expected operand, got {repr(token)}")
else:
return NonBinTree(token)
def parse_expr():
# 解析首个操作数
left = parse_operand()
# 查看下一个 token:是否为顶层运算符?
op = next(it, None)
if op not in ("&", "|"):
# 无运算符 → 单节点表达式,直接返回
if op == ")":
return left
elif op is None:
return left
else:
raise ValueError(f"Unexpected token after operand: {repr(op)}")
# 构建以 op 为根的子树
root = NonBinTree(op)
root.add_node(left) # 左操作数作为第一个子节点
# 继续读取后续操作数(直到遇到 ')' 或结束)
while True:
token = next(it, None)
if token is None or token == ")":
break
elif token in ("&", "|"):
# 新运算符出现:说明当前 op 是更高层的运算符,应停止本层解析
# 将 token “推回”,由上层处理
it = iter([token] + list(it)) # 简单模拟 peek + pushback(生产环境建议用更健壮方式)
break
else:
# 普通操作数或 '('
if token == "(":
operand = parse_expr()
else:
operand = NonBinTree(token)
root.add_node(operand)
return root
# 启动解析(顶层无括号约束)
result = parse_expr()
# 检查是否还有未消费 token(防多余内容)
leftover = list(it)
if leftover:
raise ValueError(f"Unconsumed tokens: {leftover}")
return result? 注意:上述 parse_expr 中的 it = iter([token] + list(it)) 是教学简化写法;实际项目中推荐使用 itertools.chain([token], it) 或封装带 peek() 的迭代器类,避免多次 list(it) 导致性能损耗。
complicated_expr = ["(", "MORE", "&", "(", "COMPLICATED", "|","(","EXPRESSION","&","PRESENTING",")","|", "MANY", ")", ")", "|", "(", "DEEPER", "&", "(", "LEVELS", "|", "FOR", "|", "TREE", ")",")"]
tree = expr_to_tree(complicated_expr)
print(tree)
# 输出结构化树(省略部分细节):
# NonBinTree(|): [NonBinTree(&): [...], NonBinTree(&): [...]]
# ✅ 动态访问第 0 层子节点的第 1 个子节点的第 2 个子节点(假设存在)
try:
target = tree.get_node_by_path([0, 1, 2])
print("Found node:", target.val)
except (IndexError, TypeError) as e:
print("Path invalid:", e)
# ✅ 在 [0, 1, 0] 处插入新子节点
new_node = NonBinTree("DYNAMICALLY_ADDED")
tree.set_child_at_path([0, 1, 0], new_node)面对动态深度的 n 叉表达式树,破局点在于:
这套模式不仅适用于布尔表达式,还可扩展至 JSON Schema 解析、AST 构建、配置树加载等场景——只要输入具备嵌套文法,即可复用该递归+路径范式。