array_unique()最快去重但丢失键名,需用SORT_REGULAR保持类型安全;保留键名须手动遍历+isset();多维数组需序列化或按字段去重;排序前须先重索引或用uasort。
array_unique() 最快去重,但要注意键名丢失array_unique() 是 PHP 原生最直接的去重函数,它会保留第一个出现的值,后续重复项被剔除。但它默认按字符串比较(即会强制类型转换),且**不保留原始键名**——重复值被删后,数组会自动重索引为数字键(除非你传入 SORT_REGULAR 并配合 array_values() 显式重排)。
常见误用:
- 直接对关联数组调用后还指望用原 'name'、'id' 键访问 → 实际只剩数字键
- 处理含 0、false、'' 的混合类型数组时,因默认字符串比较导致 0 == '' 被判重复
正确做法示例:
$arr = ['a' => 1, 'b' => '1', 'c' => 0, 'd' => '']; var_dump(array_unique($arr, SORT_REGULAR)); // 严格类型比较,保留键名 // 输出:['a'=>1, 'c'=>0, 'd'=>'']
in_array() 或 isset() 判断当必须维持键名结构(比如配置项、表单字段映射),又不能接受 array_unique() 的键重排行为时,就得自己控制逻辑。此时优先用 isset() 配合临时标记数组,比 in_array() 性能高得多(尤其大数据量)。
$seen = [] 记录已出现的值,每次检查 !isset($seen[$value])
serialize($value) 作键,但注意性能损耗$result[$key] = $value 即可示例(保留键名的整数去重):
$arr = ['x' => 5, 'y' => 3, 'z' => 5, 'w' => 3];
$result = [];
$seen = [];
foreach ($arr as $k => $v) {
if (!isset($seen[$v])) {
$seen[$v] = true;
$result[$k] = $v;
}
}array_unique(),得先序列化或自定义比较array_unique() 对多维数组无效,它只比较一维元素(即子数组本身),而子数组在比较时会被转成字符串 "Array",结果所有子数组都“相同”,只剩第一个。
两种可靠解法:
array_map('serialize', $arr) 转成字符串数组,再 array_unique(),最后 array_map('unserialize',
...) —— 简单但有安全风险(反序列化不可信数据)array_diff_assoc() 或逐字段比较(推荐用于结构明确的二维数组,如数据库记录)轻量安全示例(按指定字段去重,如 id):
$arr = [['id'=>1,'name'=>'A'], ['id'=>2,'name'=>'B'], ['id'=>1,'name'=>'C']];
$ids = [];
$result = [];
foreach ($arr as $item) {
if (!in_array($item['id'], $ids)) {
$ids[] = $item['id'];
$result[] = $item;
}
}array_unique() + sort(),小心键名错乱如果去重后还需升序/降序,很多人写成 sort(array_unique($arr)),这会导致两个问题:一是 sort() 返回布尔值而非数组;二是即使修正为 $uniq = array_unique($arr); sort($uniq),也会把关联键全转成数字键,且顺序打乱。
正确组合方式取决于需求:
array_values(array_unique($arr)),再 sort() 或 rsort()
uasort($arr, function($a,$b){ return $a $b; }),但得先去重(否则重复项还在)array_unique($arr) 后用 natcasesort()
关键点:PHP 数组函数链式调用极易隐性丢失键名,每一步都要确认返回值结构是否符合预期。