- 浏览: 1542648 次
- 性别:
- 来自: 厦门
-
文章分类
- 全部博客 (516)
- Java (49)
- Java/Struts 2.0 (25)
- Java/Spring、Spring MVC (11)
- Java/Quartz (3)
- Java/Lucene (6)
- Java/Hibernate (19)
- Java/openJPA (7)
- Java/DWR (7)
- Java/Security、Spring Security/OAuth2 (6)
- Java/Threading (9)
- Java/XML (22)
- java/design pattern (4)
- Android (2)
- JavaScript (46)
- jquery (3)
- DB/MySQL (23)
- DB/Oracle (16)
- PHP (25)
- CSS (20)
- Linux (38)
- C/C++、DLL、Makefile、VC++ (31)
- 正则 (9)
- Eclipse (4)
- 安全、网络等概念 (25)
- 集群 (7)
- 网页 (5)
- 视频\音频 (1)
- HTML (6)
- 计算机数学/算法 (3)
- Virtualbox (1)
- LDAP (2)
- 数据挖掘 (6)
- 工具破解 (1)
- 其他 (13)
- Mail (1)
- 药材 (3)
- 游戏 (2)
- hadoop (13)
- 压力测试 (3)
- 设计模式 (3)
- java/Swing (2)
- 缓存/Memcache (0)
- 缓存/Redis (1)
- OSGI (2)
- OSGI/Gemini (0)
- 文档写作 (0)
- java/Servlet (3)
- MQ/RabbitMQ (2)
- MQ/RocketMQ (0)
- MQ/Kafka (1)
- maven (0)
- SYS/linux (1)
- cache/redis (1)
- DB/Mongodb (2)
- nginx (1)
- postman (1)
- 操作系统/ubuntu (1)
- golang (1)
- dubbo (1)
- 技术管理岗位 (0)
- mybatis-plus (0)
最新评论
-
pgx89112:
大神,请赐我一份这个示例的项目代码吧,万分感谢,1530259 ...
spring的rabbitmq配置 -
string2020:
不使用增强器 怎么弄?
OpenJPA的增强器 -
孟江波:
学习了,楼主,能否提供一份源代码啊,学习一下,十分感谢!!!4 ...
spring的rabbitmq配置 -
eachgray:
...
spring-data-redis配置事务 -
qljoeli:
学习了,楼主,能否提供一份源代码啊,学习一下,十分感谢!!!1 ...
spring的rabbitmq配置
转载自:http://linux.chinaitlab.com/MYSQL/779956.html
由于 GROUP BY 实际上也同样会进行排序操作,而且与 ORDER BY 相比,GROUP BY 主要只是多了排序之后的分组操作。当然,如果在分组的时候还使用了其他的一些聚合函数,那么还需要一些聚合函数的计算。所以,在GROUP BY 的实现过程中,与 ORDER BY 一样也可以利用到索引。
在 MySQL 中,GROUP BY 的实现同样有多种(三种)方式,其中有两种方式会利用现有的索引信息来完成 GROUP BY,另外一种为完全无法使用索引的场景下使用。下面我们分别针对这三种实现方式做一个分析。
1.使用松散(Loose)索引扫描实现 GROUP BY
何谓松散索引扫描实现 GROUP BY 呢?实际上就是当 MySQL 完全利用索引扫描来实现 GROUP BY 的时候,并不需要扫描所有满足条件的索引键即可完成操作得出结果。
下面我们通过一个示例来描述松散索引扫描实现 GROUP BY,在示例之前我们需要首先调整一下 group_message 表的索引,将 gmt_create 字段添加到 group_id 和 user_id 字段的索引中:
sky@localhost : example 08:49:45
> create index idx_gid_uid_gc
-> on group_message(group_id,user_id,gmt_create);
Query OK, rows affected (0.03 sec) Records: 96 Duplicates: 0 Warnings: 0
sky@localhost : example 09:07:30
> drop index idx_group_message_gid_uid
-> on group_message; Query OK, 96 rows affected (0.02 sec) Records: 96 Duplicates: 0 Warnings: 0
然后再看如下 Query 的执行计划: sky@localhost : example 09:26:15 -> EXPLAIN -> SELECT user_id,max(gmt_create) -> FROM group_message -> WHERE group_id < 10 -> GROUP BY group_id,user_id\G *************************** 1. row *************************** id: 1 select_type: SIMPLE table: group_message type: range possible_keys: idx_gid_uid_gc key: idx_gid_uid_gc key_len: 8 ref: NULL rows: 4 Extra: Using where; Using index for group-by 1 row in set (0.00 sec) 我们看到在执行计划的 Extra 信息中有信息显示“Using index for group-by”,实际上这就是告诉我们,MySQL Query Optimizer 通过使用松散索引扫描来实现了我们所需要的 GROUP BY 操作。 下面这张图片描绘了扫描过程的大概实现: 要利用到松散索引扫描实现 GROUP BY,需要至少满足以下几个条件: ◆GROUP BY 条件字段必须在同一个索引中最前面的连续位置; ◆在使用GROUP BY 的同时,只能使用 MAX 和 MIN 这两个聚合函数; ◆如果引用到了该索引中 GROUP BY 条件之外的字段条件的时候,必须以常量形式存在; 为什么松散索引扫描的效率会很高? 因为在没有WHERE子句,也就是必须经过全索引扫描的时候, 松散索引扫描需要读取的键值数量与分组的组数量一样多,也就是说比实际存在的键值数目要少很多。而在WHERE子句包含范围判断式或者等值表达式的时候, 松散索引扫描查找满足范围条件的每个组的第1个关键字,并且再次读取尽可能最少数量的关键字。 2.使用紧凑(Tight)索引扫描实现 GROUP BY
紧凑索引扫描实现 GROUP BY 和松散索引扫描的区别主要在于他需要在扫描索引的时候,读取所有满足条件的索引键,然后再根据读取恶的数据来完成 GROUP BY 操作得到相应结果。
sky@localhost : example 08:55:14 -> EXPLAIN -> SELECT max(gmt_create) -> FROM group_message -> WHERE group_id = 2 -> GROUP BY user_id\G *************************** 1. row *************************** id: 1 select_type: SIMPLE table: group_message type: ref possible_keys: idx_group_message_gid_uid,idx_gid_uid_gc key: idx_gid_uid_gc key_len: 4 ref: const rows: 4 Extra: Using where; Using index 1 row in set (0.01 sec)
这时候的执行计划的 Extra 信息中已经没有“Using index for group-by”了,但并不是说 MySQL 的 GROUP BY 操作并不是通过索引完成的,只不过是需要访问 WHERE 条件所限定的所有索引键信息之后才能得出结果。这就是通过紧凑索引扫描来实现 GROUP BY 的执行计划输出信息。 下面这张图片展示了大概的整个执行过程: 在 MySQL 中,MySQL Query Optimizer 首先会选择尝试通过松散索引扫描来实现 GROUP BY 操作,当发现某些情况无法满足松散索引扫描实现 GROUP BY 的要求之后,才会尝试通过紧凑索引扫描来实现。 当 GROUP BY 条件字段并不连续或者不是索引前缀部分的时候,MySQL Query Optimizer 无法使用松散索引扫描,设置无法直接通过索引完成 GROUP BY 操作,因为缺失的索引键信息无法得到。但是,如果 Query 语句中存在一个常量值来引用缺失的索引键,则可以使用紧凑索引扫描完成 GROUP BY 操作,因为常量填充了搜索关键字中的“差距”,可以形成完整的索引前缀。这些索引前缀可以用于索引查找。而如果需要排序GROUP BY结果,并且能够形成索引前缀的搜索关键字,MySQL还可以避免额外的排序操作,因为使用有顺序的索引的前缀进行搜索已经按顺序检索到了所有关键字。 MySQL 在进行 GROUP BY 操作的时候要想利用所有,必须满足 GROUP BY 的字段必须同时存放于同一个索引中,且该索引是一个有序索引(如 Hash 索引就不能满足要求)。而且,并不只是如此,是否能够利用索引来实现 GROUP BY 还与使用的聚合函数也有关系。 前面两种 GROUP BY 的实现方式都是在有可以利用的索引的时候使用的,当 MySQL Query Optimizer 无法找到合适的索引可以利用的时候,就不得不先读取需要的数据,然后通过临时表来完成 GROUP BY 操作。
sky@localhost : example 09:02:40 -> EXPLAIN -> SELECT max(gmt_create) -> FROM group_message -> WHERE group_id > 1 and group_id < 10 -> GROUP BY user_id\G *************************** 1. row *************************** id: 1 select_type: SIMPLE table: group_message type: range possible_keys: idx_group_message_gid_uid,idx_gid_uid_gc key: idx_gid_uid_gc key_len: 4 ref: NULL rows: 32 Extra: Using where; Using index; Using temporary; Using filesort
这次的执行计划非常明显的告诉我们 MySQL 通过索引找到了我们需要的数据,然后创建了临时表,又进行了排序操作,才得到我们需要的 GROUP BY 结果。整个执行过程大概如下图所展示: 当 MySQL Query Optimizer 发现仅仅通过索引扫描并不能直接得到 GROUP BY 的结果之后,他就不得不选择通过使用临时表然后再排序的方式来实现 GROUP BY了。 在这样示例中即是这样的情况。 group_id 并不是一个常量条件,而是一个范围,而且 GROUP BY 字段为 user_id。所以 MySQL 无法根据索引的顺序来帮助 GROUP BY 的实现,只能先通过索引范围扫描得到需要的数据,然后将数据存入临时表,然后再进行排序和分组操作来完成 GROUP BY。
3.使用临时表实现 GROUP BY
评论
`id` int(11) NOT NULL DEFAULT '0',
`u` char(100) DEFAULT NULL,
`v` char(100) DEFAULT NULL,
`w` char(100) DEFAULT NULL,
`x` char(100) DEFAULT NULL,
`y` char(100) DEFAULT NULL,
`z` char(100) DEFAULT NULL,
`iu` int(11) DEFAULT NULL,
`iv` int(11) DEFAULT NULL,
`iw` int(11) DEFAULT NULL,
`ix` int(11) DEFAULT NULL,
`iy` int(11) DEFAULT NULL,
`iz` int(11) DEFAULT NULL,
UNIQUE KEY `i_id` (`id`) USING BTREE,
KEY `i_u_v_w` (`u`,`v`,`w`) USING BTREE,
KEY `i_iu_iv_iw` (`iu`,`iv`,`iw`) USING BTREE
) ENGINE=InnoDB DEFAULT CHARSET=utf8
我发现只有一种情况会出现Using index for group-by
那就是describe select iu, max(iv) from t3 group by iu;
其他的比如
describe select iu, iv from t3 group by iu;
describe select iu, max(iv) from t3 group by iu, iv;
都是using index,
请问using index是否效率比Using index for group-by高,
using index的意思是紧凑索引扫描吗?
网上的文章看不太懂, mysql手册关于group的介绍感觉很绕口, 而且手册上提供的本来可以使用松散索引扫描的例子直接测试是using index
这是为什么呢??????
发表评论
-
mysql中计算两点坐标距离
2016-09-12 15:35 112CREATE FUNCTION `calc_distanc ... -
在window 单机环境下将mysql cluster创建为自启动服务
2013-08-22 21:17 2074假设我的mysql cluster根目录是:D:\d ... -
mysql cluster 的一些错误解决方法记录。
2013-08-21 14:57 13531、ndb_mgmd的配置文件编码问题导致解析错误 ... -
Ubuntu 11.04 x64 编译安装mysql
2012-09-15 18:28 1392转自:http://www.cnblogs.com/sin ... -
面试时 遇到一个数据库SQL 成绩排名
2012-07-17 09:55 10551、累积排名 SELECT NAME ... -
ubuntu 11.4 二进制文件(tar.gz) 安装 mysql 5.5.x
2012-02-22 21:11 1216sudo /etc/init.d/mysql.server ... -
SQL 分组统计 两个字段 行转列
2012-02-08 17:20 4148select c.MRL,c.OPERATION_ID,c. ... -
记录错位方法
2011-05-28 21:03 947目的: select `value` ... -
你的MySQL安全了吗?加铸23道安全门
2011-03-22 12:39 1066使用MySQL,安全问题不能不注意。以下是MySQL提示的 ... -
MySQL 存储过程的使用
2011-03-20 20:10 1551drop procedure if exists tes ... -
MySQL函数的创建
2011-03-19 23:15 1028drop function if exists shorten ... -
Mysql 配置SSL
2011-03-16 10:26 1297[client] ssl-ca=$DIR/cacert.pe ... -
Mysql SSL 配置
2011-03-16 10:15 3637转自:http://www.cnblogs.com/huqin ... -
在Navicate中使用 提示输入 方式输入SQL的参数。
2011-03-01 17:56 972select [$输入A] 输入参考: sele ... -
MySQL 地理时区管理
2011-01-14 11:33 2018MySQL经常被人们 ... -
两个不同表的SUM值相减
2011-01-12 15:39 1347select z.num2 - x.num1 from ( ... -
查询某条记录的前后两条
2011-01-07 11:05 704id target num 1 Gen ... -
navicate 9 注册码
2011-01-02 13:44 1619名:I Love China 组织:I Love China ... -
Percona Server 5.1.47-11.1 试用手记
2010-11-12 14:44 1993转自:http://seo3721.appspot.com/6 ... -
SQL获取上个月最后一个周末两天
2010-10-28 16:41 1505该语句可以获得: 上个月最后一个周末两天 ...
相关推荐
在MySQL 中,GROUP BY 的实现同样有多种(三种)方式,其中有两种方式会利用现有的索引信息来完成 GROUP BY,另外一种为完全无法使用索引的场景下使用。下面我们分别针对这三种实现方式做一个分析。 1、使用松散...
GROUP BY是MySQL中进行数据分组的强大工具,它与聚合函数一起使用,可以轻松实现复杂的数据分析。理解GROUP BY的工作原理和高级用法对于数据库开发者和分析师来说至关重要。通过合理使用GROUP BY,可以有效地从大量...
SQL中的`GROUP BY`语句是数据库查询中的一个重要部分,它用于将数据按照一个或多...记住,合理使用`GROUP BY`和相关的聚合函数是数据分析和报表制作的关键步骤。希望这些信息能帮助你更好地理解和运用`GROUP BY`语句。
MySQL中的`DISTINCT`关键字用于从查询结果中去除重复的行,它在处理数据时与`GROUP BY`语句有着类似的底层实现。然而,两者之间存在微妙的差异。`DISTINCT`主要的目标是去重,而不是对数据进行聚合计算。 在实现...
MySQL中的DISTINCT和GROUP BY都是用于处理数据集的两种不同方法,它们在去重方面有交集,但在功能和用途上存在显著差异。理解这两者的区别对于优化查询性能至关重要。 首先,DISTINCT关键字的主要功能是去重。它...
用户通常通过`ORDER BY`语句实现结果集的排序,但`GROUP BY`和`DISTINCT`语句也会隐含地进行排序。了解如何优化排序性能,尤其是如何利用索引,对于提升MySQL查询效率至关重要。 1. **排序优化与索引使用** - **...
插入、更新和删除数据是基本操作,而SELECT语句用于查询数据,掌握其子句如WHERE、GROUP BY、HAVING和ORDER BY是查询优化的关键。 三、数据库设计 良好的数据库设计可以提高数据的一致性和完整性,减少冗余。学习...
7.2.13. MySQL如何优化GROUP BY 7.2.14. MySQL如何优化LIMIT 7.2.15. 如何避免表扫描 7.2.16. INSERT语句的速度 7.2.17. UPDATE语句的速度 7.2.18. DELETE语句的速度 7.2.19. 其它优化技巧 7.3. 锁定事宜 7.3.1. ...
这些练习有助于加深对SQL联接(JOIN)、子查询、聚合函数(GROUP BY)和排序(ORDER BY)等概念的理解。 五、应用场景 在实际项目中,Northwind数据库可以用来模拟真实的商业环境,测试和优化查询性能,验证数据库...
6. **GROUP BY优化**:在5.7中,GROUP BY语句的处理得到了显著优化,可以更快地处理大量数据的分组操作。 7. **安全增强**:MySQL 5.7提升了安全性,如强化了默认密码策略、增加了认证插件的灵活性,以及引入了更...
7.2.13. MySQL如何优化GROUP BY 7.2.14. MySQL如何优化LIMIT 7.2.15. 如何避免表扫描 7.2.16. INSERT语句的速度 7.2.17. UPDATE语句的速度 7.2.18. DELETE语句的速度 7.2.19. 其它优化技巧 7.3. 锁定事宜 7.3.1. ...
- 在 `ORDER BY` 或 `GROUP BY` 子句中,如果排序字段没有建立索引,则可能无法利用索引加速排序过程。 - 当执行条件包含函数时,如果函数不是索引友好的,也可能导致索引失效。 #### 四、MySQL 性能优化 **慢...
此外,它还涉及了SQL语句的重构技巧,如避免子查询、合理使用JOIN操作和GROUP BY语句,以实现更高效的查询。 3. **系统监测**:系统监控是识别性能瓶颈的关键步骤。书中阐述了如何通过监控MySQL的性能指标,如QPS...
总的来说,MySQL的用户变量提供了一种灵活的方式来处理动态累加计算,使得我们可以在SQL查询中实现类似循环累加的功能,这对于数据分析师和数据库管理员来说是非常有用的工具。理解并熟练运用用户变量,可以极大地...
- **分组(GROUP BY)与聚合**:使用GROUP BY对数据进行分组,并使用聚合函数计算每个组的统计信息。 - **排序(ORDER BY)与分页(LIMIT)**:对查询结果进行排序和分页,以提高用户体验。 3. **数据插入与更新*...
**1.2 MySQL Query Optimizer 基本工作原理** - **Query Tree**: 当 MySQL 收到一个查询请求后,会首先将其解析为一棵 Query Tree。这棵树描述了查询的结构及其各个组成部分之间的关系,是生成执行计划的基础。 - *...
7.2.13. MySQL如何优化GROUP BY 7.2.14. MySQL如何优化LIMIT 7.2.15. 如何避免表扫描 7.2.16. INSERT语句的速度 7.2.17. UPDATE语句的速度 7.2.18. DELETE语句的速度 7.2.19. 其它优化技巧 7.3. 锁定事宜 7.3.1. ...
7.2.13. MySQL如何优化GROUP BY 7.2.14. MySQL如何优化LIMIT 7.2.15. 如何避免表扫描 7.2.16. INSERT语句的速度 7.2.17. UPDATE语句的速度 7.2.18. DELETE语句的速度 7.2.19. 其它优化技巧 7.3. 锁定事宜 7.3.1. ...