strlen()统计字节数,将\n、\r各计1字节,\r\n计2字节;统计可见字符长需trim()预处理;查换行数用substr_count();含中文等多字节字符时须用mb_strlen()。
strlen() 统计的是字节数,不是“视觉上的字符数”。在 PHP 中,\n(LF)、\r(CR)或 \r\n(Windows 换行)都会被当作 1 或 2 个字节计入长度:
\n → 1 字节 → strlen() 返回 +1\r → 1 字节 → strlen() 返回 +1\r\n → 2 字节 → strlen() 返回 +2比如:strlen("a\r\nb") 返回 4(a、\r、\n、b),不是 3。
如果目标是判断用户输入的“实际文字长度”,不希望把开头/结尾的空白(含换行、制表、空格)算进去,得先清理:
strlen(trim($str, "\r\n\t " )) —— 显式指定要去除的字符strlen(trim($str)),因为 trim() 默认就处理 \r、\n、\t、\0、\x0B 和空格strlen() 计入如果需求是“这个字符串里有几个换行”,strlen() 完全不适用。正确方式是:
\n 个数:substr_count($str, "\n")
\r\n(Windows 风格)个数:substr_count($str, "\r\n")
substr_count($str, "\n") + substr_count($str, "\r") - substr_count($str, "\r\n")(避免 \r\n 被重复计算)直接对含 \r\n 的字符串用 substr_count($str, "\r") + substr_count($str, "\n") 会多算 1 次,这点容易错。
如果字符串含中文、emoji 或其他 UTF-8 多字节字符,strlen() 返回的是字节数,不是字符数。例如:strlen("你好") 返回 6(UTF-8 下每个汉字占 3 字节),但你通常想要的是 “2 个字符”。
mb_strlen($str, 'UTF-8')
\n、\r 当作 1 个字符计数(因为它们在 UTF-8 中也是单字节)mb_detect_encoding($str),但生产环境建议显式指定 'UTF-8'
换行符本身不改变 mb_strlen() 的字符计数逻辑,但它和中文混在一起时,strlen() 和 mb_strlen() 的结果差异会更刺眼——这点常被忽略。