Mysql怎么老是慢查询啊？阿里P6:导致慢查询的因素都总结在这里了

小哈学Java 03-25 2693

前言：

此刻你们对“mysql使用事务为什么变慢”大约比较珍视，各位老铁们都需要学习一些“mysql使用事务为什么变慢”的相关知识。那么小编在网络上收集了一些有关“mysql使用事务为什么变慢””的相关内容，希望看官们能喜欢，我们一起来了解一下吧！

正文开始前，分享一份非常不错的干货《Java 核心知识体系&面试资料.pdf》！

分享一份非常不错的 Java 进阶干货《Java 核心知识体系&面试资料.pdf》, 内容覆盖很广，Java 核心基础、Java 多线程、高并发、Spring、微服务、Netty 与 RPC、Zookeeper、Kafka、RabbitMQ、Habase、设计模式、负载均衡、分布式缓存、Hadoop、Spark、Storm、云计算等。

获取方式：【关注 + 转发】后，私信我，回复关键字【资源】，即可免费无套路获取哦~

以下是资源的部分目录以及内容截图：

重要的事再说一遍，获取方式：【关注 + 转发】后，私信我，回复关键字【资源】，即可免费无套路获取哦~

一前言

不管是开发同学还是DBA,想必大家都遇到慢查询(select,update,insert,delete 语句慢)，影响业务稳定性。这里说的慢，有两个含义一是比正常的慢，有可能正常执行时间是10ms，异常的是100ms 。二是sql执行时间超过设置的慢查询标准比如500ms。

本文从IT架构以及数据库纬度来分析导致sql执行慢的原因/场景，抛砖引玉，有不足之处还请大家多多提建议。

二基础知识

分析慢查询之前，我们先看看sql执行的路径,理清楚可能会影响sql执行速度的相关因素。

执行路径

app ---[proxy]---db

app --- db

目前大部分的数据库架构基本都是上面的路径，sql从app的应用服务器发起经过proxy然后到db，db执行sql进过proxy或者直接返回给app应用服务器。分析这个过程我们可以得到几个会影响sql执行速度的因素

1 网络，各个节点之间的网络2 OS系统 ，即数据库服务器3 MySQL 数据库本身

三基础系统层面

3.1 网络层面

1 网络丢包，重传

其实这个比较容易理解。当sql 从app端发送到数据库，执行完毕，数据库将结果返回给app端，这个将数据返回给app端的过程本质是网络包传输。因为链路的不稳定性，如果在传输过程中发送丢包会导致数据包重传，进而增加数据传输时间。从app端来看，就会觉得sql执行慢。

图来自

2 网卡满比如大字段

这个场景可能不容易遇到，如果公司业务体量很大，比如平时每天300w订单的电商平台，平台大促(双十一，618)的时候极有可能出现网卡被打满。网卡带宽被占满类似各种节假日高速公路收费站(网卡)拥堵导致车流(数据包传输的速度)行动缓慢。

3 网络链路变长

该场景会影响应用纬度的一个事务比如交易下单整体耗时。

我们知道每个节点之间的数据传输是需要时间的，比如同城跨机房(15KM)之间的访问一般网络耗时1.5ms左右。

链路1 [app1]--调用--[app2]---[proxy]---[db]

相比

链路2[app1] -- [proxy] --[db]

执行一条sql请求会增加 [app1]--[app2]之间的网络传输耗时大约3ms。如果一个业务事件包含30个sql ，那么链路1要比链路2 多花至少90ms的时间成本。导致业务整体变慢。

3.2 受到影响IO的场景

1 磁盘io被其他任务占用

有些备份策略为了减少备份空间的使用，基于xtrabckup备份的时候使用了compress选项将备份集压缩。当我们需要在数据库服务器上恢复一个比较大的实例，而解压缩的过程需要耗费cpu和占用大量io导致数据库实例所在的磁盘io使用率100%，会影响MySQL 从磁盘获取数据的速度，导致大量慢查询。

2 raid卡充放电，raid 卡重置

RAID卡都有写cache(Battery Backed Write Cache),写cache对IO性能的提升非常明显,因为掉电会丢失数据,所以必须由电池提供支持。电池会定期充放电,一般为90天左右,当发现电量低于某个阀值时,会将写cache策略从writeback置为writethrough,相当于写cache会失效,这时如果系统有大量的IO操作,可能会明显感觉到IO响应速度变慢,cpu 队列堆积系统load飙高。下面是一个raid充放电导致sql慢查的案例。

raid 卡充电将磁盘的写策略有write back 修改为write through ，io性能急剧下降导致sql慢查，进而影响应用层的逻辑处理。

raid 卡重置当raid卡遇到异常时，会进行重置，相当于程序重启，导致系统io hang。此时也会导致sql慢。下图是生产中遇到的 RAID卡重置案例。

3 io调度算法

noop（电梯式调度策略）：

NOOP实现了一个FIFO队列，它像电梯的工作方式一样对I/O请求进行组织，当有一个新的请求到来时，它将请求合并到最近的请求之后，以此来保证请求同一个介质。NOOP倾向于饿死读而利于写，因此NOOP对于闪存设备，RAM以及嵌入式是最好的选择。

deadline（介质时间调度策略）：

Deadline确保了在一个截至时间内服务请求，这个截至时间是可调整的，而默认读期限短于写期限。这样就防止了写操作因为不能被读取而饿死的现象。Deadline对数据库类应用是最好的选择。

anticipatory（预料I/O调度策略）：

本质上与Deadline一样，但在最后一次读操作后，要等待6ms，才能继续进行对其他I/O请求进行调度。它会在每个6ms中插入新的I/O操作，而会将一些小写入流合并成一个大写入流，用写入延时换取最大的写入吞吐量。AS适合于写入较多的环境，比如文件服务器，AS对数据库环境表现很差。

3.3 cpu 类型

cpu 电源策略是控制cpu运行在哪种模式下的耗电策略的，对于数据库服务器推荐最大性能模式以下内容摘自《Red Hat Enterprise Linux7 电源管理指南》

2 指令集

最近遇到的一个性能案例是hw的机器,因为指令集合默认关闭导致性能下降15%。

自己对CPU并不精通，所以这里的2个点并非CPU优化配置的全部，自建机房的运维朋友依赖官方技术支持的建议或者技术资料的指导来设置cpu相关参数。

四数据库层面

4.1 没有索引，或者索引不正确

这个场景其实比较容易理解。相信每个DBA工作过程中都会或多或少遇到性能案例都和索引设计有关:创建表，没有索引，sql随着数据量增大全表扫描而变慢。这个就不额外举例子了。

4.2 隐式转换

发生隐式转换时，MySQL选择执行计划并不能利用到合适的索引而是选择全表扫描导致慢查询。常见的引发隐式转换的场景如下:

in 参数包含多个类型,简单说,就是在IN的入口有一个判断, 如果in中的字段类型不兼容, 则认为不可使用索引.例如 --图

判断符号左边是字符串，右边是数字，比如 where a=1;其中a是字符串

多表join时，where 左右两边的字段的字符集类型不一致。

推荐阅读聊聊隐式转换

4.3 执行计划错误

由于MySQL优化器本身的不足，选择执行计划时会导致错误的执行计划使sql走了错误的索引或者没有做索引。比如

在检查某业务数据库的slowlog 时发现一个慢查询,查询时间 1.57s ,检查表结构 where条件字段存在正确的组合索引,正确的情况下优化器应该选择组合索引,而非为啥会导致慢查询呢？

推荐阅读 order by 主键id导致全表扫描的问题

4.4 数据巨大

比如select count(*) from t1 where a='xxxx'; 尽管字段a有索引，但是如果符合条件的记录数超高10w，查询速度还是会比较慢。

 select count(*) from t1 where app = 'marketing';+----------+| count(*) |+----------+| 2671690 |+----------+1 row in set (0.92 sec)

4.5 MetaData Lock锁等待

MDL锁这个场景其实蛮多案例的，比如ddl开始时，针对同一个表的长查询还没结束，后续的写操作都会被堵住导致 thread running 飙高。实例整体的sql执行慢。

案例一长查询/mysqldump 阻塞DDL

未提交事务阻塞ddl 阻塞查询