当前位置:网站首页>MySQL45讲 01 | 基础架构:一条SQL查询语句是如何执行的?
MySQL45讲 01 | 基础架构:一条SQL查询语句是如何执行的?
2022-06-12 11:21:00 【蓝布棉】
MySQL 45讲 01 | 基础架构:一条SQL查询语句是如何执行的?
MySQL的基本架构示意图
- 大体来说,MySQL可以分为Server层和存储引擎层两部分。
- Server层包括连接器、查询缓存、分析器、优化器、执行器等,涵盖MySQL的大多数核心服务功能,以及所有的内置函数(如日期、时间、数学和加密函数等),所有跨存储引擎的功能都在这一层实现(如存储过程、触发器、视图等。)
- 存储引擎层负责数据的存储和提取。其架构模式是插件式的,支持InnoDB、MyISAM、 Memory等多个存储引擎。现在最常用的存储引擎是InnoDB,它从MySQL 5.5.5版本开始成为了默认存储引擎。
- 不同的存储引擎共用一个Server 层,也就是从连接器到执行器的部分。

连接器
- 连接器负责跟客户端建立连接、获取权限、维持和管理连接。
- 连接命令一般是这么写的:
mysql -h$ip -P$port -u$user -p - 连接命令中的mysql是客户端工具,用来跟服务端建立连接。在完成经典的TCP握手后,连接器就要开始认证你的身份,这个时候用的就是你输入的用户名和密码。
- 如果用户名或密码不对,会收到一个"Access denied for user"的错误,然后客户端程序结束执行。
- 如果用户名密码认证通过,连接器会到权限表里面查出你拥有的权限。之后,这个连接里面的权限判断逻辑,都将依赖于此时读到的权限。
- 即使你用管理员账号对这个用户的权限做了修改,也不会影响已经存在连接的权限。修改完成后,只有再新建的连接才会使用新的权限设置。
- 连接完成后,如果你没有后续的动作,这个连接就处于空闲状态,你可以在
show processlist命 令中看到它。
- 客户端如果太长时间没动静,连接器就会自动将它断开。由参数
wait_timeout控制 的,默认值是8小时。
连接被断开之后,客户端再次发送请求的话,就会收到一个错误提醒: Lost connection to MySQL server during query。这时候如果你要继续,就需要重连,然后再执行请求了。
- 长连接是指连接成功后,如果客户端持续有请求,则一直使用同一个连接。
- 短连接则是指每次执行完很少的几次查询就断开连接,下次查询再重新建立一个。
- 建立连接的过程通常是比较复杂的,在使用中要尽量减少建立连接的动作,也就是
尽量使用长连接。
问题:但是全部使用长连接后,你可能会发现,有些时候MySQL占用内存涨得特别快,这是因为 MySQL在执行过程中临时使用的内存是管理在连接对象里面的。这些资源会在连接断开的时候 才释放。所以如果长连接累积下来,可能导致内存占用太大,被系统强行杀掉(OOM),从现 象看就是MySQL异常重启了。
解决:
定期断开长连接。使用一段时间,或者程序里面判断执行过一个占用内存的大查询后,断开连接,之后要查询再重连。
如果你用的是MySQL 5.7或更新版本,可以在每次执行一个比较大的操作后,通过执行
mysql_reset_connection来重新初始化连接资源。这个过程不需要重连和重新做权限验证, 但是会将连接恢复到刚刚创建完时的状态。
查询缓存
MySQL拿到一个查询请求后,会先到查询缓存看看,之前是不是执行过这条语句。之前执行过的语句及其结果可能会以
key-value对的形式,被直接缓存在内存中。- 如果查询能够直接在缓存中找到key,那么这个value就会被直接返回给客户端。
- 如果语句不在查询缓存中,就会继续后面的执行阶段。执行完成后,执行结果会被存入查询缓存 中。
但是大多数情况下建议不要使用查询缓存,为什么呢?因为查询缓存往往弊大于利。
查询缓存的失效非常频繁,只要有对一个表的更新,这个表上所有的查询缓存都会被清空。因此
很可能你费劲地把结果存起来,还没使用呢,就被一个更新全清空了。对于更新压力大的数据库来说,查询缓存的命中率会非常低。除非你的业务就是有一张静态表,很长时间才会更新一次。比如,一个系统配置表,那这张表上的查询才适合使用查询缓存。
MySQL也提供了这种“按需使用”的方式。你可以将参数
query_cache_type设置成DEMAND,这样对于默认的SQL语句都不使用查询缓存。而对于你确定要使用查询缓存的语 句,可以用SQL_CACHE显式指定,像下面这个语句一样:mysql> select SQL_CACHE * from T where ID=10;
- 注意:MySQL 8.0版本直接将查询缓存的整块功能删掉了,也就是说8.0开始彻底没有 这个功能了。
分析器
如果没有命中查询缓存,就要开始真正执行语句了。首先需要对SQL语句做解析。
分析器先会做**“词法分析”**。你输入的是由多个字符串和空格组成的一条SQL语句,MySQL需要识别出里面的字符串分别是什么,代表什么。
然后要做**“语法分析”**。根据词法分析的结果,语法分析器会根据语法规则, 判断你输入的这个SQL语句是否满足MySQL语法。
如果你的语句不对,就会收到“You have an error in your SQL syntax”的错误提醒
一般语法错误会提示第一个出现错误的位置,所以你要关注的是紧接“use near”的内容。
优化器
在开始执行之前,还要先经过优化器的处理。
优化器是在表里面有多个索引的时候,决定使用哪个索引;或者在一个语句有多表关联(join) 的时候,决定各个表的连接顺序。
比如你执行下面这样的语句,这个语句是执行两个表的join:
mysql> select * from t1 join t2 using(ID) where t1.c=10 and t2.d=20;- 既可以先从表t1里面取出c=10的记录的ID值,再根据ID值关联到表t2,再判断t2里面d的值是 否等于20。
- 也可以先从表t2里面取出d=20的记录的ID值,再根据ID值关联到t1,再判断t1里面c的值是否 等于10。
这两种执行方法的逻辑结果是一样的,但是执行的效率会有不同,而优化器的作用就是决定选择使用哪一个方案。
执行器
MySQL通过分析器知道了你要做什么,通过优化器知道了该怎么做,于是就进入了执行器阶段,开始执行语句。
开始执行的时候,要先判断一下你对这个表T有没有执行查询的权限
如果没有,就会返回没有 权限的错误,如下所示。
mysql> select * from T where ID=10; ERROR 1142 (42000): SELECT command denied to user 'b'@'localhost' for table'T'如果有权限,就打开表继续执行。打开表的时候,执行器就会根据表的引擎定义,去使用这个引
擎提供的接口。
执行器的执行流程:
- 比如我们这个例子中的表T中,ID字段没有索引:
- 调用InnoDB引擎接口取这个表的第一行,判断ID值是不是10,如果不是则跳过,如果是则 将这行存在结果集中;
- 调用引擎接口取“下一行”,重复相同的判断逻辑,直到取到这个表的最后一行。
- 执行器将上述遍历过程中所有满足条件的行组成的记录集作为结果集返回给客户端。
对于有索引的表,执行的逻辑也差不多。第一次调用的是“取满足条件的第一行”这个接口,之后 循环取“满足条件的下一行”这个接口,这些接口都是引擎中已经定义好的。
数据库的慢查询日志中看到一个
rows_examined的字段,表示这个语句执行过程中扫描了多少行。是在执行器每次调用引擎获取数据行的时候累加的。在有些场景下,执行器调用一次,在引擎内部则扫描了多行,因此引擎扫描行数跟引擎扫描行数跟 rows_examined rows_examined并不是完全相同的。
小结
- 连接器:建立连接
- 查询缓存(8.0删除了)
- 分析器:做什么
- 优化器:怎么做
- 执行器:开始执行
边栏推荐
- AcWing 1921. 重新排列奶牛(环图)
- The most detailed explanation of the top ten levels of sqli labs platform
- PHP Apple internal purchase callback processing
- Golang基础(6)
- M-arch (fanwai 12) gd32l233 evaluation -cau encryption and decryption (tease Xiaobian)
- 深度学习与CV教程(14) | 图像分割 (FCN,SegNet,U-Net,PSPNet,DeepLab,RefineNet)
- 890. find and replace mode
- Using stairs function in MATLAB
- DS18B20数字温度计 (一) 电气特性, 供电和接线方式
- VirtualBox 虚拟机因系统异常关机虚拟机启动项不见了
猜你喜欢

InfoQ geek media's 15th anniversary solicitation |position:fixed virtual button cannot take effect after being triggered. Problem analysis and Solution Exploration

Malicious code analysis practice - lab03-01 Exe basic dynamic analysis

^34作用域面试题

k58.第一章 基于kubeadm安装kubernetes v1.23 -- 集群部署

Why check the @nonnull annotation at run time- Why @Nonnull annotation checked at runtime?

890. find and replace mode

模块8作业

SOT23(Small Outline Transistor)

redis 总结

Clickhouse column basic data type description
随机推荐
Handwritten common interview questions
Golang基础(6)
力扣(LeetCode)162. 寻找峰值(2022.06.11)
PHP download station B video
Common configuration commands for Cisco network device security management
十折交叉验证代码中的问题
Using the echart plug-in to dynamically refresh charts in uview/uni-app
Index query efficiency of MySQL
AI - face
K58. Chapter 1 installing kubernetes V1.23 based on kubeadm -- cluster deployment
卡鱼刺别再喝醋吞米饭了!教你2招,让鱼刺安全“跑出来”
2022-06-11: note that in this document, graph is not the meaning of adjacency matrix, but a bipartite graph. In the adjacency matrix with length N, there are n points, matrix[i][j]
AcWing 1986. Mirror (simulation, ring diagram)
PHP specifies the number of people to distribute the specified amount equally at random (scaling method)
Vite Basics
890. find and replace mode
Malicious code analysis practice - use IDA pro to analyze lab05-01 dll
Reading mysql45 lecture - self summary (part)
SOT23(Small Outline Transistor)
Les humains veulent de l'argent, du pouvoir, de la beauté, de l'immortalité, du bonheur... Mais les tortues ne veulent être qu'une tortue.