在 java 中,正则表达式是一种用于匹配、提取和处理字符串的强大工具。1. 正则表
达式的基本语法由普通字符、元字符(如 .、\d、\w、\s)、量词(如 *、+、?、{n,m})以及分组与边界符号(如 ()、^、$)组成,例如 ^\d{3}-\d{8}$ 可匹配中国大陆固定电话号码;2. java 使用 java.util.regex 包中的 pattern 和 matcher 类进行正则操作,常见步骤包括编译正则为 pattern 对象、创建 matcher 对象并调用 matches() 或 find() 方法进行匹配,此外 string 类也提供了 matches()、split()、replaceall() 等简化方法;3. 常见使用场景包括数据校验(如验证手机号、邮箱)、字符串提取(如日志分析)、替换与格式化(如敏感词过滤)、以及灵活分割字符串,提升了字符串处理的效率和灵活性。
在 Java 中,正则表达式(Regular Expression,简称 regex)是一种用于匹配字符串的强大工具。它通过定义特定的模式规则,来判断一个字符串是否符合某种格式,或者从字符串中提取出符合条件的内容。Java 提供了 java.util.regex 包来支持正则表达式的使用。
正则表达式本质上是一串由普通字符和特殊符号组成的字符串,用来描述一个匹配规则。下面是一些常见的语法元素:
a, b, 0, @ 等,直接匹配自身。.:匹配任意单个字符(除了换行符)\d:匹配任意数字,等价于 [0-9]
\w:匹配字母、数字或下划线\s:匹配空白字符(空格、制表符等)*:0 次或多次+:1 次或多次?:0 次或 1 次{n}:正好 n 次{n, m}:至少 n 次,最多 m 次():将多个字符作为一个整体进行处理^:表示开头$:表示结尾举个例子,正则表达式 ^\d{3}-\d{8}$ 可以用来匹配中国大陆固定电话号码,比如 010-12345678。
Java 使用 Pattern 和 Matcher 类来进行正则匹配操作。常见步骤如下:
Pattern 对象Matcher 对象对目标字符串进行匹配matches()、find() 等方法判断结果示例代码:
import java.util.regex.Pattern;
import java.util.regex.Matcher;
public class RegexExample {
public static void main(String[] args) {
String regex = "\\d+"; // 匹配一个或多个数字
String input = "年龄是25岁";
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(input);
if (matcher.find()) {
System.out.println("找到数字: " + matcher.group());
}
}
}此外,String 类也提供了一些简化的方法,比如 matches()、split()、replaceAll(),适用于简单场景。
正则表达式在实际开发中应用非常广泛,以下是几个典型场景:
^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$
split() 方法按指定规则拆分字符串,比普通分割更灵活。基本上就这些。正则表达式虽然看起来有点复杂,但掌握基本语法后,在很多字符串处理任务中会非常高效。不过也要注意避免写出过于复杂的表达式,影响可读性和性能。