str_getcsv() 是处理带引号 CSV 文本最稳妥方案,自动识别双引号包裹、内部转义及换行,避免正则误切与边界问题,且支持自定义分隔符、封装符和转义符。
str_getcsv() 处理带引号的 CSV 风格文本最稳PHP 自带的 str_getcsv() 就是专为这种场景设计的:字段含逗号、双引号包裹、引号内可含换行或转义引号。它比手写正则更可靠,也避开引号嵌套、转义等边界问题。
常见错误是直接用 explode(',', $text) 或简单正则 /[^,]+/,结果在 "a,b",c,"d""e" 这类字符串上直接崩——逗号被误切,引号内的双引号 "" 也被当分隔符。
str_getcsv() 默认以逗号为分隔符,自动识别双引号包裹的字段,支持内部 "" 转义str_getcsv($text, ';', "'", '\\')
如果硬要用正则(比如只提取所有引号包裹的片段,不关心字段结构),/"([^"]*)"/ 看似简单,但遇到 "a\"b" 或 "foo","bar" 会漏匹配或跨字段捕获。
真正可用的模式是:/"((?:[^"\\]|\\.)*)"/(支持转义引号),或更保守的 /"([^"]*(?:""[^"]*)*)"/(支持两个双引号表示一个字面引号)。
.*?,得显式排除引号和处理转义preg_match_all() 时,务必加 PREG_SET_ORDER 或检查 $matches[1],避免取到整个匹配串str_getcsv() 慢一倍以上,尤其长文本;且无法还原原始字段顺序或空字段有需求要保留原始字段位置、区分空字段 ,"", 和缺失字段 ,,,或者输入根本不是 CSV 格式(如日志行:time="2025-01-01",msg="user logged in"),这时正则或 str_getcsv() 都不合适。
必须按字符遍历,维护「是否在引号内」「上一个字符是否为转义符」两个状态。PHP 中可参考 fgetcsv() 的底层逻辑,但自己实现时容易漏掉:\"、""、引号后紧跟分隔符等 case。

"" 在 CSV 中等于一个字面双引号,不是结束标记如果文本是 UTF-8 但含中文或 emoji,而 PHP 内部编码设为 ISO-8859-1,str_getcsv() 可能将多字节引号(如全角“”)或某些代理对识别错,导致截断或乱码。
mb_internal_encoding() 是 UTF-8,且输入字符串本身是合法 UTF-8(可用 mb_check_encoding($s, 'UTF-8') 验证)str_getcsv() 不支持全角引号,若日志里混用 “abc”,必须先用 str_replace() 替换为英文双引号u 修饰符,[^"] 仍只排除 ASCII 引号;全角引号需显式写进字符类,如 ["“”]
str_getcsv(),不行再退到状态机,别一开始就扎进正则里调 pattern。