String.prototype.match() 完全不匹配时返回 null 而非空数组,易致 TypeError;全局匹配返回字符串数组,非全局才含 index、groups 等属性。
String.prototype.match() 返回 null 而不是空数组因为目标字符串完全不匹配正则时,match() 明确返回 null,不是 []。这是最容易踩的坑——直接对返回值调用 .length 或遍历会报 TypeError: Cannot read property 'length' of null。
const result = str.match(/pattern/); if (result) { ... }
g 标志)时,match() 返回匹配字符串数组,不包含捕获组信息;非全局时才返回含 index、groups 等属性的数组str.match(/pattern/g) || [],但注意这会丢失非全局模式下的位置和分组数据RegExp.prototype.exec() 和 test() 的真实分工exec() 不只是“另一个匹配方法”,它是唯一支持**连续查找**和**捕获组提取**的正则方法;test() 则专为布尔判断设计,性能更高,但不返回任何匹配细节。
exec(),且要手动重置 lastIndex(对全局正则)或确保正则对象未复用test(),比 match() 或 exec() 快,尤其在大量校验场景(如表单验证)exec() 而不重置 lastIndex,会导致第二次调用返回 null(因上次匹配后 lastIndex 指向末尾)const re = /a(b)/g; let str = 'abab'; console.log(re.exec(str)); // ['ab', 'b'] console.log(re.exec(str)); // ['ab', 'b'] —— 正确,re.lastIndex 已更新 // 但如果 re 是 const 声明且跨多次调用,需注意状态残留
[^...] 和负向先行断言 (?!...) 别混用[^abc] 是“除 a、b、c 外的任意单字符”,作用域仅限一个位置;(?!abc) 是“接下来三个字符不能是 abc”,是零宽断言,不消耗字符,常用于排除特定前缀。
^(?!http:\/\/).+,不是 ^[^http:\/\/].+(后者语法错误,且 [^http://] 实际等价于 [^htp:/])[a-z](?!\d);若写成 [a-z][^\d],会多匹配一个非数字字符,语义完全不同/(? 是否报错(lookbehind 在 Node.js
u 和 s 不是可有可无的配置项u(Unicode)让正则正确处理 UTF-16 代理对(如 emoji、中文、数学符号);s(dotAll)让 . 匹配换行符。忽略它们,在处理现代文本时大概率出错。
/??{2}/.test('????') 返回 false,加 u 后才为 true(否则正则把 emoji 当作两个孤立代理符)/(.*?)/s 中的 s 让 .*? 能穿过换行;没它,. 会停在第一行末尾
- Node.js 12+、Chrome 64+ 支持
s,但 IE 完全不支持;u 在 Node.js 0.12+ 和主流浏览器均可用
复杂点在于:正则逻辑本身简单,但字符编码、引擎差异、修饰符组合带来的行为变化非常隐蔽。写完正则别急着提交,拿边界数据(空字符串、emoji、换行、中文、特殊符号)跑一遍 test() 和 exec()。