17370845950

JavaScript中的正则表达式是什么_它如何匹配和处理文本呢
JavaScript正则表达式是用于匹配、查找、替换文本模式的对象,支持字面量和构造函数两种创建方式,含g/i/m等标志,提供match/test/replace/split等方法,依赖\d/\w/\s/+/*/?/^/$/\b等元字符及捕获组实现精准文本处理。

JavaScript中的正则表达式(Regular Expression,简称RegExp)是一种用于匹配、查找、替换文本中特定模式的工具。它不是字符串,而是一个对象,能高效识别符合规则的字符组合——比如邮箱格式、手机号、日期、重复单词等。

正则表达式的基本写法

有两种创建方式:

  • 字面量写法:直接用斜杠包裹模式,如 /abc//\d{3}-\d{4}/,推荐用于静态模式
  • 构造函数写法new RegExp('abc')new RegExp('\\d{3}-\\d{4}', 'g'),适合动态拼接模式(注意转义要双反斜杠)

后面可加标志(flags),常用有:g(全局匹配)、i(忽略大小写)、m(多行模式)。例如 /hello/gi 会找到所有不区分大小写的 "hello"。

常用匹配方法

正则对象和字符串都提供匹配能力:

  • str.match(/pattern/):返回匹配结果数组,无匹配时返回 null
  • str.test(/pattern/):只返回 truefalse,适合条件判断
  • str.replace(/pattern/, 'new'):替换匹配内容,支持字符串或函数作为替换值
  • str.split(/pattern/):按模式切分字符串,如 'a,b;c'.split(/[;,]/)['a','b','c']

核心元字符与实际例子

真正让正则“活起来”的是这些符号:

  • \d 匹配数字,\w 匹配字母/数字/下划线,\s 匹配空白符
  • + 表示“一个或多个”,* 是“零个或多个”,? 是“零个或一个”
  • ^ 开头,$ 结尾,\b 单词边界——比如 /\bcat\b/ 只匹配独立的 "cat",不匹配 "scatter"
  • [\u4e00-\u9fa5] 可匹配中文字符;[a-z0-9_] 自定义字符集

例子:验证简单邮箱 /^[^\s@]+@[^\s@]+\.[^\s@]+$/ —— 要求 @ 前后都有非空格非@字符,且含一个点和域名部分。

捕获组与提取信息

用小括号 () 可“捕获”匹配的子串,方便后续提取:

  • '2025-04-15'.match(/(\d{4})-(\d{2})-(\d{2})/) 返回数组 ['2025-04-15', '2025', '04', '15'],索引 1~3 就是各组内容
  • replace 中可用 $1$2 引用捕获组,如 '12-34'.replace(/(\d{2})-(\d{2})/, '$2/$1')"34/12"

非捕获组 (?:...) 仅分组不保存,节省资源;命名捕获组 (?\d{4}) 在较新环境支持,更易读。

基本上就这些。正则不是越复杂越好,关键是理解目标文本结构,再选合适符号组合。写完建议用在线工具(如 regex101.com)实时测试,避免盲目调试。