用 array_filter() 配合 stripos() 排除含某字符的项时,应回调中用 stripos($v, 'xxx') === false 判断「未找到」,避免 !strpos() 误判位置0;多禁用词用 preg_match() 正则匹配并转义元字符;中文等多字节字符须用 mb_stripos() 并指定 UTF-8 编码。
array_filter() 配合 stripos() 排除含某字符的项直接用 array_filter() 是最常用也最稳妥的方式,关键在回调函数里判断是否「不含」目标字符串。注意别用 strpos(),它对大小写敏感;stripos() 更符合日常筛选需求(比如过滤掉所有含 "test" 或 "TEST" 的字符串)。
常见错误是写成 !strpos($v, 'xxx') —— 这会在匹配到开头(位置 0)时误判为 false,导致该项被错误剔除。
stripos($v, 'xxx') === false 明确判断「未找到」strpos(),但必须仍用 === false
array_values()
php
$items = ['apple', 'banana_test', 'cherry', 'TESTing'];
$result = array_filter($items, function($v) {
return st
ripos($v, 'test') === false;
});
// $result = ['apple', 'cherry']
stripos(),改用 preg_match()
当要排除含「a」或「b」或「_」的项时,硬写多个 stripos() 判断既啰嗦又难维护。正则更清晰,且性能差异在常规数据量下可忽略。
注意点:preg_match() 默认是 PCRE,模式需加定界符(如 /.../i),i 修饰符实现不区分大小写,比手动转小写再查更省事。
preg_match('/a|b|_/', $v) 后取反——逻辑易错,应直接让正则匹配「含任一禁用字符」,然后用 !preg_match(...)
.、*、[),必须先用 preg_quote() 转义null 值传入 preg_match() 不会报错,但建议提前 is_string() 校验,尤其处理用户输入时php
$forbidden = ['test', 'demo', '_tmp'];
$pattern = '/'.implode('|', array_map('preg_quote', $forbidden)).'/i';
$result = array_filter($items, function($v) use ($pattern) {
return !is_string($v) || !preg_match($pattern, $v);
});
foreach 手动遍历虽慢但可控,适合要同时做其他操作的场景如果筛选过程中还要记录被剔除的项、统计原因、或根据内容动态调整规则,硬套 array_filter() 反而绕弯。这时候老老实实 foreach + unset() 或 array_push() 更直观。
性能上,foreach 比函数式写法略低,但除非数组超 10 万项,否则感知不到差别。真正要注意的是键名处理:
unset($arr[$k]) 后,原键名还在,只是值没了;后续 foreach 仍会遍历该键(值为 null)$filtered[] = $v;,天然重索引,语义也干净$filtered = array_filter($filtered); 清掉 null 值(但通常没必要)mb_stripos() 替代 stripos()
遇到中文、日文、emoji 或带音调的字母(如 café),stripos() 会按字节匹配,极大概率出错。例如搜索「测试」可能匹配不上,因为 UTF-8 下一个汉字占 3 字节,stripos() 把它当 3 个独立 ASCII 字符看了。
解决方法很简单:把 stripos() 换成 mb_stripos(),并显式指定编码(通常是 'UTF-8')。不指定编码参数时,它依赖 mb_internal_encoding() 设置,线上环境容易不一致。
header('Content-Type: text/html; charset=utf-8');)mb_* 函数族,别图省事用 str_*
mb_stripos() 返回 int 或 false,判断逻辑和 stripos() 完全一致,替换成本很低php
$result = array_filter($items, function($v) {
return mb_stripos($v, '测试', 0, 'UTF-8') === false;
});
实际项目里最容易漏的是多字节支持和正则元字符转义——尤其是从配置文件读取禁用词时,谁也不知道运营同事会不会填个 * 进去。