一条SQL语句从发送到返回经历了什么_mysql执行流程说明_技术教程

新闻动态

一条SQL语句从发送到返回经历了什么_mysql执行流程说明

MySQL客户端SQL经连接校验、语法解析生成SELECT_LEX、优化器重写统计选择执行路径、执行器调用引擎逐行读取并过滤、结果缓存后返回；全过程涉及权限、缓存、语法、成本估算、MVCC、网络缓冲等环节。

MySQL 不是直接执行你写的 SQL 字符串，而是走一套完整的解析、优化、执行链路。真正决定性能的，往往不是 SELECT 写得多漂亮，而是这条语句在服务端经历了哪些环节、卡在哪一步。

客户端通过 TCP 或 Unix socket 连上 mysqld，发送的是一个带长度前缀的二进制包（COM_QUERY 协议包），不是纯文本流。MySQL 线程池拿到这个包后，先做基础校验：

用户权限是否允许执行该语句（比如 SELECT 需要 SELECT 权限，哪怕只是查 information_schema）
是否命中查询缓存（MySQL 8.0 已移除，但 5.7 及以前仍存在，且默认关闭）
语句长度是否超 max_allowed_packet 限制（超了会直接报错 Packets larger than max_allowed_packet bytes are not allowed）

过了连接层，SQL 字符串交给 SQL 解析器（基于 LALR(1) 的 yacc/bison 生成器）。它不关心表是否存在、字段有没有索引，只管是否符合语法规则：

SELECT * FROM t WHERE id = ? AND name LIKE '%x' → 合法
SELECT * FROM t WHERE id = ? ORDER BY → 报错：You have an error in your SQL syntax

解析成功后，生成 SELECT_LEX 结构体（MySQL 内部表示），包含 JOIN_LIST、WHERE_COND、ORDER_LIST 等子结构。这步不访问表，也不查元数据。

优化器才是真正的“决策者”。它拿到逻辑结构后，做三件事：

这就是为什么你写 SELECT * FROM a JOIN b ON a.id = b.a_id，EXPLAIN 却显示 b 是第一行——优化器认为先扫 b 再回表 a 更快。参数 optimizer_switch（如 firstmatch=off）会显著改变这个行为。

优化器输出执行计划后，执行器按节点逐个调用接口。关键点在于：

也就是说，WHERE id > 100 AND status = 'active'，如果只有 id 有索引，status 的过滤是在 MySQL Server 层做的，不是 InnoDB。

执行器拿到最终结果集后，并不立即发给客户端：

最常被忽略的是：长事务 + 大结果集会让 net_buffer 持续占用内存，且 SHOW PROCESSLIST 里看到的 Status 是 Sending data，其实卡在网卡缓冲区或客户端收包慢，不是数据库慢。

17370845950