编译期正则表达式是在C++编译阶段完成匹配与验证的constexpr机制,以CTRE库为代表,支持模板化字符串字面量解析、编译期错误检查及constexpr结果推导,用于格式校验、常量提取和元编程驱动。
编译期正则表达式,是指在 C++ 编译阶段就完成正则匹配、解析与验证的机制,不依赖运行时库(如 std::regex),所有逻辑由编译器在 constexpr 上下文中求值。它的核心是利用 C++17 起强化的 constexpr 能力,配合模板元编程和字符串字面量处理,把“正则引擎”搬进编译器。
CTRE(Compile-Time Regular Expressions)是目前最主流的编译期正则库,由 Hans Dembinski 开发,支持 C++17 及以上。它不使用宏、不依赖运行时,所有匹配操作(ctre::search、ctre::find、ctre::split 等)均可在 constexpr 函数中调用。
ctre::re(),编译器据此生成专用匹配状态机constexpr 值,可用于数组大小、if constexpr 分支、模板参数推导等场景"[a-z[")会触发 SFINAE 或静态断言,直接报错编译期正则不是为了替代运行时匹配,而是解决“已知固定格式”的编译期校验与结构提取问题。
"k[A-Z][a-zA-Z0-9]*",可在 static_assert 中直接验证"v2.15.0" 得到 constexpr int MAJOR = 2, MINOR = 15,用于条件编译或版本特化ctre::captures 和 std::tuple 拆解,把匹配到的各组转为不同类型,驱动后续模板实例化标准库 std::regex 是运行时引擎:构造对象开销大、匹配过程不可预测、无法参与 constexpr 计算;而 CTRE 的每个正则表达式都是一个独立的、零成本的模板特化,无动态内存、无虚函数、
无分支预测失败惩罚。
std::regex 的模式字符串在运行时解析,可能抛异常;CTRE 模式在编译期解析,错误即编译失败std::regex_match("123", std::regex("\\d+")) 返回 bool;CTRE 的 ctre::match("123") 是 constexpr bool,可用于 if constexpr
基本上就这些。编译期正则不是银弹,但它让“字符串即类型信息”真正可行——只要格式确定、内容已知,就能把文本解析这件事,提前到编译器做决定。