`

MySQL Sending data导致查询很慢的问题详细分析

 
阅读更多

使用sphinx支持倒排索引,但sphinx从mysql查询源数据的时候,查询的记录数才几万条,但查询的速度非常慢,大概要4~5分钟左右


【处理过程】

1)explain

首先怀疑索引没有建好,于是使用explain查看查询计划,结果如下:


从explain的结果来看,整个语句的索引设计是没有问题的,除了第一个表因为业务需要进行整表扫描外,其它的表都是通过索引访问


2)show processlist;

explain看不出问题,那到底慢在哪里呢?

于是想到了使用 show processlist查看sql语句执行状态,查询结果如下:


发现很长一段时间,查询都处在 “Sending data”状态

查询一下“Sending data”状态的含义,原来这个状态的名称很具有误导性,所谓的“Sending data”并不是单纯的发送数据,而是包括“收集 + 发送 数据”。

这里的关键是为什么要收集数据,原因在于:mysql使用“索引”完成查询结束后,mysql得到了一堆的行id,如果有的列并不在索引中,mysql需要重新到“数据行”上将需要返回的数据读取出来返回个客户端。


3)show profile

为了进一步验证查询的时间分布,于是使用了show profile命令来查看详细的时间分布

首先打开配置:set profiling=on;
执行完查询后,使用show profiles查看query id;
使用show profile for query query_id查看详细信息;

结果如下:


从结果可以看出,Sending data的状态执行了216s


4)排查对比

经过以上步骤,已经确定查询慢是因为大量的时间耗费在了Sending data状态上,结合Sending data的定义,将目标聚焦在查询语句的返回列上面

经过一 一排查,最后定为到一个description的列上,这个列的设计为:`description`varchar(8000) DEFAULT NULL COMMENT '游戏描述',

于是采取了对比的方法,看看“不返回description的结果”如何。show profile的结果如下:


可以看出,不返回description的时候,查询时间只需要15s,返回的时候,需要216s,两者相差15倍


【原理研究】

至此问题已经明确,但原理上我们还需要继续探究。

这篇淘宝的文章很好的解释了相关原理:innodb使用大字段text,blob的一些优化建议

这里的关键信息是:当Innodb的存储格式是 ROW_FORMAT=COMPACT (or ROW_FORMAT=REDUNDANT)的时候,Innodb只会存储前768字节的长度,剩余的数据存放到“溢出页”中

我们使用show table status来查看表的相关信息:


可以看到,平均一行大约1.5K,也就说大约1/10行会使用“溢出存储”,一旦采用了这种方式存储,返回数据的时候本来是顺序读取的数据,就变成了随机读取了,所以导致性能急剧下降。


另外,在测试过程中还发 现,无论这条语句执行多少次,甚至将整个表select *几次,语句的执行速度都没有明显变化。这个表的数据和索引加起来才150M左右,而整个Innodb buffer pool有5G,缓存整张表绰绰有余,如果缓存了溢出页,性能应该大幅提高才对。

但实测结果却并没有提高,因此从这个测试可以推论Innodb并没有将溢出页(overflow page)缓存到内存里面

这样的设计也是符合逻辑的,因为overflow page本来就是存放大数据的,如果也放在缓存里面,就会出现一次大数据列(blob、text、varchar)查询,可能就将所有的缓存都更新了,这样会导致其它普通的查询性能急剧下降。


【解决方法】

找到了问题的根本原因,解决方法也就不难了。有几种方法:

1)查询时去掉description的查询,但这受限于业务的实现,可能需要业务做较大调整

2)表结构优化,将descripion拆分到另外的表,这个改动较大,需要已有业务配合修改,且如果业务还是要继续查询这个description的信息,则优化后的性能也不会有很大提升。

 

分享到:
评论

相关推荐

    解决MySQL Sending data导致查询很慢问题的方法与思路

    MySQL数据库在处理查询时,有时会遇到"Sending data"状态导致查询速度变慢的问题。这种情况通常意味着MySQL正在收集并发送数据给客户端,特别是当查询涉及到大字段如`TEXT`或`VARCHAR(8000)`等时,性能瓶颈可能就在...

    深入分析MySQL Sending data查询慢问题

    通过一个实例给大家分享了MySQL Sending data表查询慢问题解决办法。 最近在代码优化中,发现了一条sql语句非常的慢,于是就用各种方法进行排查,最后终于找到了原因。 一、事故现场 SELECT og.goods_barcode, og....

    Mysql查询很慢卡在sending data的原因及解决思路讲解

    MySQL查询在"Sending data"阶段变得非常慢,通常是因为数据传输效率低下或数据库处理机制不当导致的。在本文中,我们将深入探讨这个问题的原因,并提供一些可能的解决方案。 首先,"Sending data"阶段指的是MySQL在...

    mysql 卡死 大部分线程长时间处于sending data的状态

    在实际操作中,需要结合慢查询日志、性能分析工具(如pt-query-digest)和监控工具(如MySQL Enterprise Monitor)来定位和解决问题。对于大型、高负载的数据库系统,了解和优化MySQL的配置、性能调优以及问题排查...

    mysql查询缓慢分析.pdf

    MySQL Sending data导致查询很慢的问题详细分析 sphinx支持倒排索引,但sphinx从mysql查询源数据的时候,查询的记录4~5分钟左右 show processlist查看sql语句执行状态,查询结果如下

    mysql-常见问题,索引优化

    2. MySQL Sending data 导致查询很慢 当查询涉及大量数据传输时,`Sending data`状态可能持续很长时间。这通常是因为没有有效的索引或查询优化。检查查询语句,确保正确使用了WHERE条件,并考虑添加合适的索引来加快...

    MySQL数据库疑难杂症排查.pptx

    MySQL数据库疑难杂症排查 MySQL 数据库是一种关系型数据库管理系统,广泛应用...我们可以通过确认问题的来源、确认 MySQL 存在瓶颈、优化 MySQL 性能和解决 Sending data 状況等步骤来解决 MySQL 数据库的常见问题。

    MYSQL常见故障分析

    对于慢查询日志的分析,可以使用mk-query-digest工具进行全面分析。通过设置global long_query_time为0,可以让系统记录所有的查询到slowlog中,从而找到执行慢的SQL语句。 在Case2中,描述了多个MySQL线程卡住的...

    mysql疑难杂症

    一旦确认问题是由于MySQL导致的,下一步则是分析MySQL的性能瓶颈所在。常用的工具包括但不限于: 1. **top** - 显示系统中各进程的资源占用情况,可以帮助我们快速定位到mysqld进程。 2. **free** - 查看系统的...

    MySQL调优利器【show profiles】

    在实际的数据库性能优化过程中,`show profiles`提供的信息可以帮助识别慢查询的原因,比如是否有过多的磁盘I/O操作,或者CPU利用率过高。通过对这些信息的分析,可以调整SQL语句的结构,优化索引,或者调整数据库...

    MySQL使用profile查询性能的操作教程

    1. **避免全表扫描**:如果`Sending data`或`Copying to tmp table`阶段时间较长,可能是因为查询没有有效的索引或者索引使用不当,导致大量数据需要读取或临时表创建。 2. **减少锁等待**:如果`Waiting for query ...

    mysql show processlist 显示mysql查询进程

    7. **State**:这是线程执行SQL语句的具体阶段,例如Waiting for table metadata lock(等待表元数据锁)、Sending data(发送数据)或Locked(锁定)。这些状态可以帮助分析查询的执行流程。 8. **Info**:展示...

    MySQL线上常见故障剖析

    - **Processlist分析**: 查看线程状态,如“Waiting for table”表示等待表锁,“Sending data”表示正在发送数据。 - **Pstack**: 分析线程堆栈,了解具体挂起原因。 - 例如:`pthread_cond_wait`表示线程在等待...

    MySQL性能分析show profiles详解(csdn)————程序.pdf

    MySQL的性能分析是数据库管理中至关重要的任务,有助于提升查询效率和整体系统性能。`SHOW PROFILES`是MySQL提供的一种工具,用于分析SQL语句在执行过程中的资源消耗情况,帮助我们定位性能瓶颈。本篇将深入讲解`...

    基于MySql的海量日志分析系统设计

    基于 MySql 的海量日志分析系统设计 本系统设计旨在解决海量日志数据的分析需求,通过对日志数据的实时处理和分析,提供可靠的数据支持给决策者。系统架构基于功能模块可以分为多个节点,包括采集节点、运算节点、...

Global site tag (gtag.js) - Google Analytics