一次非常有意思的sql优化经历

全部 Hibernate Spring Struts iBATIS 企业应用 Lucene SOA Java综合 Tomcat 设计模式 OO JBoss

浏览 8392 次

锁定老帖子主题：一次非常有意思的sql优化经历精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者	正文
tangyanbo 等级: 性别: 文章: 47 积分: 260 来自: 上海	发表时间：2015-05-11 最后修改：2015-05-11 相关推荐: 一次非常有意思的SQL优化经历:从30248.271s到0.001s 一次非常有意思的 SQL 优化经历：从 30248.271s 到 0.001s 有意思的mysql之最_一次非常有意思的sql优化经历一次非常有意思的 SQL 优化经历一次非常有意思的 SQL 优化经历！更多相关推荐 MySQL 企业应用我的这篇博客出自我的博客园，原文地址：http://www.cnblogs.com/tangyanbo/p/4462734.html 今天放到iteye来和大家分享补充：看到这么多朋友对sql优化感兴趣，我又重新补充了下文章的内容，将更多关于sql优化的知识分享出来，喜欢这篇文章的朋友给个赞吧，哈哈，欢迎交流，共同进步。 2015-4-30补充：非常感觉编辑的推荐，同时又对慢查询语句优化了一遍，并附上优化记录，欢迎阅读文章。同时欢迎加入我的技术讨论群：261502547 场景我用的数据库是mysql5.6，下面简单的介绍下场景课程表 create table Course( c_id int PRIMARY KEY, name varchar(10) ) 数据100条学生表: create table Student( id int PRIMARY KEY, name varchar(10) ) 数据70000条学生成绩表SC CREATE table SC( sc_id int PRIMARY KEY, s_id int, c_id int, score int ) 数据70w条查询目的：查找语文考100分的考生查询语句： select s.* from Student s where s.s_id in (select s_id from SC sc where sc.c_id = 0 and sc.score = 100 ) 执行时间：30248.271s 晕,为什么这么慢，先来查看下查询计划： EXPLAIN select s.* from Student s where s.s_id in (select s_id from SC sc where sc.c_id = 0 and sc.score = 100 ) 发现没有用到索引，type全是ALL，那么首先想到的就是建立一个索引，建立索引的字段当然是在where条件的字段。先给sc表的c_id和score建个索引 CREATE index sc_c_id_index on SC(c_id); CREATE index sc_score_index on SC(score); 再次执行上述查询语句，时间为: 1.054s 快了3w多倍，大大缩短了查询时间，看来索引能极大程度的提高查询效率，建索引很有必要，很多时候都忘记建索引了，数据量小的的时候压根没感觉，这优化的感觉挺爽。但是1s的时间还是太长了，还能进行优化吗，仔细看执行计划：查看优化后的sql: SELECT `YSB`.`s`.`s_id` AS `s_id`, `YSB`.`s`.`name` AS `name` FROM `YSB`.`Student` `s` WHERE < in_optimizer > ( `YSB`.`s`.`s_id` ,< EXISTS > ( SELECT 1 FROM `YSB`.`SC` `sc` WHERE ( (`YSB`.`sc`.`c_id` = 0) AND (`YSB`.`sc`.`score` = 100) AND ( < CACHE > (`YSB`.`s`.`s_id`) = `YSB`.`sc`.`s_id` ) ) ) ) 补充：这里有网友问怎么查看优化后的语句方法如下：在命令窗口执行有type=all 按照我之前的想法，该sql的执行的顺序应该是先执行子查询 select s_id from SC sc where sc.c_id = 0 and sc.score = 100 耗时：0.001s 得到如下结果：然后再执行 select s.* from Student s where s.s_id in(7,29,5000) 耗时：0.001s 这样就是相当快了啊，Mysql竟然不是先执行里层的查询，而是将sql优化成了exists子句，并出现了EPENDENT SUBQUERY， mysql是先执行外层查询，再执行里层的查询，这样就要循环700078次。那么改用连接查询呢？ SELECT s. from Student s INNER JOIN SC sc on sc.s_id = s.s_id where sc.c_id=0 and sc.score=100 这里为了重新分析连接查询的情况，先暂时删除索引sc_c_id_index，sc_score_index 执行时间是：0.057s 效率有所提高，看看执行计划：这里有连表的情况出现，我猜想是不是要给sc表的s_id建立个索引 CREATE index sc_s_id_index on SC(s_id); show index from SC 在执行连接查询时间: 1.076s，竟然时间还变长了，什么原因？查看执行计划：优化后的查询语句为： SELECT `YSB`.`s`.`s_id` AS `s_id`, `YSB`.`s`.`name` AS `name` FROM `YSB`.`Student` `s` JOIN `YSB`.`SC` `sc` WHERE ( ( `YSB`.`sc`.`s_id` = `YSB`.`s`.`s_id` ) AND (`YSB`.`sc`.`score` = 100) AND (`YSB`.`sc`.`c_id` = 0) ) 貌似是先做的连接查询，再进行的where条件过滤回到前面的执行计划：这里是先做的where条件过滤，再做连表，执行计划还不是固定的，那么我们先看下标准的sql执行顺序：正常情况下是先join再进行where过滤，但是我们这里的情况，如果先join，将会有70w条数据发送join做操，因此先执行where 过滤是明智方案，现在为了排除mysql的查询优化，我自己写一条优化后的sql SELECT s.* FROM ( SELECT * FROM SC sc WHERE sc.c_id = 0 AND sc.score = 100 ) t INNER JOIN Student s ON t.s_id = s.s_id 即先执行sc表的过滤，再进行表连接，执行时间为：0.054s 和之前没有建s_id索引的时间差不多查看执行计划：先提取sc再连表，这样效率就高多了，现在的问题是提取sc的时候出现了扫描表，那么现在可以明确需要建立相关索引 CREATE index sc_c_id_index on SC(c_id); CREATE index sc_score_index on SC(score); 再执行查询： SELECT s.* FROM ( SELECT * FROM SC sc WHERE sc.c_id = 0 AND sc.score = 100 ) t INNER JOIN Student s ON t.s_id = s.s_id 执行时间为：0.001s，这个时间相当靠谱，快了50倍执行计划：我们会看到，先提取sc，再连表，都用到了索引。那么再来执行下sql SELECT s.* from Student s INNER JOIN SC sc on sc.s_id = s.s_id where sc.c_id=0 and sc.score=100 执行时间0.001s 执行计划：这里是mysql进行了查询语句优化，先执行了where过滤，再执行连接操作，且都用到了索引。 2015-04-30日补充：最近又重新导入一些生产数据，经测试发现，前几天优化完的sql执行效率又变低了调整内容为SC表的数据增长到300W,学生分数更为离散。先回顾下： show index from SC 执行sql SELECT s.* from Student s INNER JOIN SC sc on sc.s_id = s.s_id where sc.c_id=81 and sc.score=84 执行时间：0.061s，这个时间稍微慢了点执行计划：这里用到了intersect并集操作，即两个索引同时检索的结果再求并集，再看字段score和c_id的区分度，单从一个字段看，区分度都不是很大，从SC表检索，c_id=81检索的结果是70001,score=84的结果是39425 而c_id=81 and score=84 的结果是897，即这两个字段联合起来的区分度是比较高的，因此建立联合索引查询效率将会更高，从另外一个角度看，该表的数据是300w，以后会更多，就索引存储而言，都是不小的数目，随着数据量的声明：ITeye文章版权属于作者，受法律保护。没有作者书面许可不得转载。推荐链接
返回顶楼

ranwei09321115 等级: 初级会员文章: 5 积分: 30	发表时间：2015-05-13 楼主好人！很不错的优化过程。
返回顶楼	回帖地址 0 0 请登录后投票

dbaspider 等级: 性别: 文章: 46 积分: 230 来自: 南京	发表时间：2015-05-13 good@@@
返回顶楼	回帖地址 0 0 请登录后投票

liubey 等级: 性别: 文章: 224 积分: 160 来自: 大连	发表时间：2015-05-14 CREATE index sc_c_id_index on SC(c_id); CREATE index sc_score_index on SC(score); 楼主为何不见个联合索引？不太明白
返回顶楼	回帖地址 0 0 请登录后投票

zhunengfei 等级: 初级会员性别: 文章: 26 积分: 30 来自: 武汉	发表时间：2015-05-14 期待更新
返回顶楼	回帖地址 0 0 请登录后投票

thc1987 等级: 初级会员性别: 文章: 28 积分: 30 来自: 杭州	发表时间：2015-05-15 MYSQL最好不要用in,如果有些字段不会改变的话,可以考虑冗余几个字段进去,然后单表查询
返回顶楼	回帖地址 0 0 请登录后投票

niweiwei 等级: 初级会员性别: 文章: 24 积分: 70 来自: 成都	发表时间：2015-05-15 写的这么详细，辛苦楼主了，以备后用
返回顶楼	回帖地址 0 0 请登录后投票

牛BB 等级: 初级会员性别: 文章: 1 积分: 30 来自: 厦门	发表时间：2015-07-02 很感谢楼主的经历，对我很有帮助。
返回顶楼	回帖地址 0 0 请登录后投票

论坛首页 → Java企业应用版

跳转论坛:

一次非常有意思的sql优化经历

场景