一、前言
上一篇我们说了 腾讯一面:说一说 MySQL 中索引的底层原理,相信你对索引有个很清晰的认识了,这一篇我们来说一说慢 SQL 的排查以及调优。为啥面试官要问这个问题,其实跟上一篇的索引底层原理有一定关联关系的,一般慢 SQL 很大一部分原因对索引底层原理不够特别了解导致的,比如没建索引、索引失效、索引没满足最左前缀匹配原则导致慢 SQL,像腾讯这样数据量很大的公司,人家肯定有专门的 DBA 去做优化的,面试官考察的主要是你排查问题的能力以及知道索引的底层原理、以及知道优化的方向,不至于让你进来把人家规规矩矩的数据库搞乱了。
我们下面直接进入正题了,首先来说下怎么排查慢 SQL 的。
二、开启慢查询日志
MySQL 中与慢 SQL 有关的几个重要系统变量如下:
参数 | 含义 |
---|---|
slow_query_log | 是否启用慢查询日志,ON 为启用,OFF 为未启用,默认为 OFF。开启会影响性能,MySQL 重启会失效。 |
slow_query_log_file | 指定慢查询日志文件的路径和名字,缺省文件名 host_name-slow.log。 |
long_query_time | 执行时间超过该值才记录到慢查询日志,单位为秒,默认为 10。 |
log_output | 日志输出位置,默认为 FILE,即保存为文件,若设置为 TABLE,则将日志记录到 mysql.show_log 表中,支持设置多种格式。 |
执行如下语句看是否启用了慢查询日志,ON 为启用,OFF 为未启用,默认为 OFF。
SHOW VARIABLES LIKE '%slow_query_log%';
[图片上传失败...(image-e1bea9-1649685069878)]
可以看到,我这里是已经开启了的。如果你的没有开启,可以使用如下两种方式来开启慢查询。
2.1 修改配置文件
修改配置文件 vim /etc/my.cnf
,在 [mysqld] 段落在加入如下配置:
[mysqld]
slow_query_log=1
slow_query_log_file=/var/lib/mysql/data/slow.log
long_query_time=3
log_output=FILE,TABLE
需要重启 MySQL 才可以生效,命令为 service mysqld restart
2.2 设置全局变量
如下打开慢查询日志,设置超时时间为 3 秒,并且将日志记录到文件以及 mysql.show_log 表中。
SET GLOBAL slow_query_log = 1;
SET GLOBAL slow_query_log_file='/var/lib/mysql/data/slow.log';
SET GLOBAL long_query_time=3;
SET GLOBAL log_output='FILE,TABLE';
想要永久生效得用上面那个配置文件里配置,否则数据库重启后,这些配置失效。
三、分析慢查询日志
3.1 获取慢 SQL 信息
查看慢查询日志记录数:
SHOW GLOBAL STATUS LIKE '%Slow_queries%';
[图片上传失败...(image-2b432b-1649685069878)]
模拟语句:
select sleep(5);
查看日志:
cat /var/lib/mysql/data/slow.log
[图片上传失败...(image-7c7307-1649685069878)]
3.2 mysqldumpslow
MySQL 内置了 mysqldumpslow 这个工具来帮我们分析慢查询日志。
[图片上传失败...(image-a2e3e1-1649685069878)]
#得到返回记录集最多的10个SQL
mysqldumpslow -s r -t 10 /var/lib/mysql/data/slow.log
#得到访问次数最多的10个SQL
mysqldumpslow -s c -t 10 /var/lib/mysql/data/slow.log
#得到按照时间排序的前10条里面含有左连接的查询语句
mysqldumpslow -s t -t 10 -g "LEFT JOIN" /var/lib/mysql/data/slow.log
#结合| more使用,防止爆屏情况
mysqldumpslow -s r -t 10 /var/lib/mysql/data/slow.log | more
s:表示按何种方式排序
c:访问次数
l:锁定时间
r:返回记录
t:查询时间
al:平均锁定时间
ar:平均返回记录数
at:平均查询时间
t:返回前面多少条的数据
g:后边搭配一个正则匹配模式,大小写不敏感
3.3 pt-query-digest
pt-query-digest 是一款很强大的慢查询日志分析工具,可以分析 MySQL 数据库的 binary log 、 general log 日志,同时也可以使用 show processlist 或从 tcpdump 抓取的 MySQL 协议数据来进行分析。
这里老周不带大家搭建以及使用了哈,想进一步了解的可以看这份文档:pt-query-digest
四、Explain 执行计划分析慢 SQL
上一篇我们非常详细的去介绍了,一文读懂 MySQL Explain 执行计划
五、Show Profile 分析慢 SQL
Show Profile 也可以分析慢 SQL,比 explain 获取的信息更详细,比如能分析当前会话中语句执行的资源消耗情况,能分析这条 SQL 整个生命周期的耗时。但没有上面 pt-query-digest 那款慢查询日志分析工具强大,但 pt-query-digest 是外置的需要单独下载,如果你想用内置的话,能够满足你的需求的话,选择 Show Profile 就行。
5.1 如何开启
默认关闭。开启后,会在后台保存最近 15 次的运行结果,然后通过 Show Profile 命令查看结果。
-- 开启
SET profiling = ON;
-- 查看
SHOW VARIABLES LIKE 'profiling%';
[图片上传失败...(image-93584a-1649685069878)]
5.2 SHOW profiles 查看 SQL 的耗时
[图片上传失败...(image-b31d7d-1649685069878)]
5.3 SQL 整个生命周期的耗时
通过 Query_ID 可以得到具体 SQL 从连接——服务——引擎——存储四层结构完整生命周期的耗时
SHOW profile CPU, BLOCK IO FOR QUERY 4;
[图片上传失败...(image-d195e1-1649685069878)]
可用参数 type:
ALL # 显示所有的开销信息
BLOCK IO # 显示块IO相关开销
ConTEXT SWITCHES # 上下文切换相关开销
CPU # 显示CPU相关开销信息
IPC # 显示发送和接收相关开销信息
MEMORY # 显示内存相关开销信息
PAGE FAULTS # 显示页面错误相关开销信息
SOURCE # 显示和 Source_function,Source_file,Source_line 相关的开销信息
SWAPS # 显示交换次数相关开销的信息
5.4 危险状态
SHOW profile CPU, BLOCK IO FOR QUERY 2;
GROUP BY 可能创建了临时表
[图片上传失败...(image-1387bc-1649685069878)]
危险状态:
converting HEAP to MyISAM # 查询结果太大,内存不够用了,在往磁盘上搬。
Creating tmp table # 创建了临时表,回先把数据拷贝到临时表,用完后再删除临时表。
Copying to tmp table on disk # 把内存中临时表复制到磁盘
locked # 记录被锁了
看到这些危险状态可以进行相应的调优,然后我们线上也会针对慢 SQL 进行监控,存在慢 SQL 的话会触发告警机制,通知相应的人员快速定位慢 SQL 并优化。