之前看了网上的一些测试,感觉不是很准确,今天亲自测试了一番。得出了结论(仅在个人计算机上测试,可能不全面,仅供参考)
测试过程:
准备一张测试表
1 CREATE TABLE `test_test` ( 2 `id` int(11) NOT NULL auto_increment, 3 `num` int(11) NOT NULL default '0', 4 PRIMARY KEY (`id`) 5 ) ENGINE=MyISAM DEFAULT CHARSET=utf8 AUTO_INCREMENT=1 ;
建个储存过程向表中插入10W条数据
01 create procedure p_test(pa int(11)) 02 begin 03 04 declare max_num int(11) default 100000; 05 declare i int default 0; 06 declare rand_num int; 07 08 select count(id) into max_num from test_test; 09 10 while i < pa do 11 if max_num < 100000 then 12 select cast(rand()*100 as unsigned) into rand_num; 13 insert into test_test(num)values(rand_num); 14 end if; 15 set i = i +1; 16 end while; 17 end
调用存储过程插入数据
1 call p_test(100000);
开始测试:(不加索引)
01 select distinct num from test_test; 02 select num from test_test group by num; 03 04 [SQL] select distinct num from test_test; 05 受影响的行: 0 06 时间: 0.078ms 07 08 [SQL] 09 select num from test_test group by num; 10 受影响的行: 0 11 时间: 0.031ms
二、num字段上创建索引
1 ALTER TABLE `test_test` ADD INDEX `num_index` (`num`) ;
再次查询
01 select distinct num from test_test; 02 select num from test_test group by num; 03 [SQL] select distinct num from test_test; 04 受影响的行: 0 05 时间: 0.000ms 06 07 [SQL] 08 select num from test_test group by num; 09 受影响的行: 0 10 时间: 0.000ms
这时候我们发现时间太小了 0.000秒都无法精确了。
我们转到命令行下 测试
01 mysql> set profiling=1; 02 mysql> select distinct(num) from test_test; 03 mysql> select num from test_test group by num; 04 mysql> show profiles; 05 +----------+------------+----------------------------------------+ 06 | Query_ID | Duration | Query | 07 +----------+------------+----------------------------------------+ 08 | 1 | 0.00072550 | select distinct(num) from test_test | 09 | 2 | 0.00071650 | select num from test_test group by num | 10 +----------+------------+----------------------------------------+
加了索引之后 distinct 比没加索引的 distinct 快了 107倍。
加了索引之后 group by 比没加索引的 group by 快了 43倍。
再来对比 :distinct 和 group by
不管是加不加索引 group by 都比 distinct 快。因此使用的时候建议选 group by
相关推荐
在MySQL数据库中,`DISTINCT` 和 `GROUP BY` 是两个非常重要的SQL关键字,它们都可以用来处理数据的去重问题,但在实际应用中,两者的使用场景和效果有所差异。 首先,`DISTINCT` 关键字的主要作用是去除查询结果中...
在MySQL数据库中,`DISTINCT` 和 `GROUP BY` 是两种用于数据去重和分组统计的SQL语句,它们虽然都可以帮助我们处理重复数据,但有着不同的应用场景和执行机制。 1. `DISTINCT` 关键字: - `DISTINCT` 主要用于去除...
在MySQL数据库中,`DISTINCT` 和 `GROUP BY` 是两个用于数据去重的语句,但它们在功能和性能上有显著的区别。这次的测试主要比较了这两种方法在不同条件下的执行效率,尤其是在数据量较大的情况下。 首先,`...
在MySQL数据库中,优化`DISTINCT`操作是一个关键的性能提升策略,特别是在处理大量数据时。上述场景中,用户遇到了一个问题:对一个10G以上的单表`user_access_xx_xx`执行`SELECT COUNT(DISTINCT nick)`以统计唯一...
在MySQL数据库中,`DISTINCT`和`GROUP BY`是两个非常重要的查询语句,它们在处理数据去重和分组方面发挥着关键作用。本文将详细介绍这两个语句的使用方法。 首先,`DISTINCT`关键字是用来去除查询结果中重复记录的...
在MySQL数据库中,`...总的来说,`DISTINCT`和`GROUP BY`在功能上有一定的重叠,但在具体的应用场景和性能上各有优势。了解它们的底层工作原理可以帮助我们更好地编写和优化SQL查询,以满足特定的数据库操作需求。
MySQL通常使用GROUPBY(本质上是排序动作)完成DISTINCT操作,如果DISTINCT操作和ORDERBY操作组合使用,通常会用到临时表.这样会影响性能. 在一些情况下,MySQL可以使用索引优化DISTINCT操作,但需要活学活用.本文涉及一个...
因此,对于`DISTINCT`查询的更多优化细节,可以参考[MySQL官方文档](http://dev.mysql.com/doc/refman/5.6/en/group-by-optimization.html)中关于`GROUP BY`优化的部分。 #### 四、DISTINCT与LIMIT的结合使用 当`...
我们了解到`DISTINCT`关键字在MySQL中的运用远不止去除简单重复值这么简单,它与`GROUP BY`、`COUNT`、`GROUP_CONCAT`等其他SQL功能结合,能够应对更为复杂的查询需求,极大地提升了数据处理的灵活性和效率。...
在MySQL数据库中,`DISTINCT` 和 `COUNT(*)` 是两种常见的SQL查询关键字,它们各自有不同的用途和场景。本文将详细探讨这两种方法的使用方法及其差异。 首先,`DISTINCT` 关键字用于从查询结果中去除重复的记录。在...
MySQL DISTINCT 是一种用于消除查询结果集中重复行的SQL语句,它的基本实现原理与GROUP BY类似,但在细节上有一定的区别。在理解DISTINCT的工作方式时,我们首先要了解它如何与索引交互,以及在无法利用索引时如何...
在数据库查询中,统计记录的数量是一个常见的需求,特别是在涉及到分组(GROUP BY)操作时。当使用GROUP BY子句对记录进行分组后,如果我们需要统计每个分组中的记录数量,往往会用到聚合函数COUNT()。然而,如何...