`

mysql 实战 or、in与union all 的查询效率

阅读更多

OR、in和union all 查询效率到底哪个快。

网上很多的声音都是说union all 快于 or、in,因为or、in会导致全表扫描,他们给出了很多的实例。

但真的union all真的快于or、in?本文就是采用实际的实例来探讨到底是它们之间的效率。

1:创建表,插入数据、数据量为1千万【要不效果不明显】。

drop table if EXISTS BT;
create table BT(
    ID int(10) NOT NUll,
    VName varchar(20) DEFAULT '' NOT NULL,
    PRIMARY key( ID )
)ENGINE=INNODB;

 该表只有两个字段 ID为主键【索引页类似】,一个是普通的字段。(偷懒就用简单的表结构呢)

向BT表中插入1千万条数据

这里我写了一个简单的存储过程【所以你的mysql版本至少大于5.0,俺的版本为5.1】,代码如下。

注意:最好

    INSERT INTO BT ( ID,VNAME )  VALUES( i, CONCAT( 'M', i ) );---1

    修改为

   INSERT INTO BT ( ID,VNAME )  VALUES( i, CONCAT( 'M', i, 'TT' ) );---2

   修改原因在

   非索引列及VNAME使用了联合进行完全扫描请使用1

   非索引列及VNAME使用了全表扫描请使用2

 

DROP PROCEDURE IF EXISTS test_proc;
CREATE PROCEDURE test_proc()
BEGIN
declare i int default 0;
set autocommit = 0;
while i<10000000 do
INSERT INTO BT ( ID,VNAME )  VALUES( i, CONCAT( 'M', i ) );
set i = i+1;
if i%2000 = 0 then
commit;
end if;
end while;
END;

 就不写注释呢,挺简单的。

存储过程是最好设置下innob的相关参数【主要和日志、写缓存相关这样能加快插入】,俺没有设置插入1千万条数据插了6分钟。

部分数据如下:1千万数据类似

2:实战

    2.1 :分别在索引列上使用 or、in、union all

           我们创建的表只有主键索引,所以只能用ID做查询呢。我们查 ID 为 98,85220,9888589的三个数据各个耗时如下:

 时间都为0.00,怎么会这样呢,呵呵所有查询都是在毫秒级别。

我使用其他的工具--EMS SQL Manager  for mysql

查询显示时间为

93 ms, 94ms,93 ms,时间相差了多少几乎可以忽略。

然后我们在看看各自的执行计划

这里要注意的字段type 与ref字段

我们发现union all 的所用的 type【type为显示连接使用了何种类型】 为ref 而or和in为range【ref连接类型优于range,相差不了多少】,而查询行数都一样【看rows字段都是为3】。

从整个的过程来看,在索引列使用常数or及in和union all查询相差不了多少。

但为什么在有的复杂查询中,再索引列使用or及in 比union all 速度慢很多呢,这可能是你的查询写的不够合理,让mysql放弃索引而进行全表扫描。

2.2:在非索引列中使用 or、in及union all。

    我们查 VNAME 为 M98,M85220,M9888589的三个数据各个耗时如下:

我们发现为啥union all查询时间几乎为 or 和in的三倍。

这是为什么呢,我们先不说,先看看三个的查询计划。

这里我们发现计划几乎一样。

但我们要注意扫描的此时对于 or及in 来说 只对表扫描一次即rows是列为9664782。

而对于union all 来说对表扫描了三次即rows的和为9664782*3。

这也是为什么我们看到union all 为几乎为三倍的原因。

备注: 如果使用存储过程使用第二sql该执行计划所有的type列 为 all,其实这个是我最想演示的,但现在已经快写完毕了才发现问题将错就错呢。

3:总结

     3.1:不要迷信union all 就比 or及in 快,要结合实际情况分析到底使用哪种情况。

     3.2:对于索引列来最好使用union all,因复杂的查询【包含运算等】将使or、in放弃索引而全表扫描,除非你能确定or、in会使用索引。

    3.3:对于只有非索引字段来说你就老老实实的用or 或者in,因为 非索引字段本来要全表扫描而union all 只成倍增加表扫描的次数。

    3.4:对于及有索引字段【索引字段有效】又包含非索引字段来时,按理你也使用or 、in或者union all 都可以,

       但是我推荐使用or、in。

      如以下查询:

select * from bt where bt.VName = 'M98' or bt.id ='9888589'

select * from bt where bt.VName = 'M98'
UNION ALL
select * from bt where  bt.id = '9888589'

     该两个查询速度相差多少 主要取决于 索引列查询时长,如索引列查询时间太长的话,那你也用or或者in代替吧。

   3.5: 以上主要针对的是单表,而多表联合查询来说,考虑的地方就比较多了,比如连接方式,查询表数据量分布、索引等,再结合单表的策略选择合适的关键字。  

 

个人观点仅供参考、需要结合实际数据用例测试选择合适的关键字.......................

 

以上测试mysql5.1

 

 

 

 

 

 

  • 大小: 10 KB
  • 大小: 43.8 KB
  • 大小: 97.4 KB
  • 大小: 43 KB
  • 大小: 111.8 KB
5
1
分享到:
评论
6 楼 花易歌 2018-03-23  
如果是不同的字段,2.2里面的or也会多次扫描表,这样的话union all是更快的。
5 楼 itbingqi 2012-12-13  
好文章 谢谢
4 楼 baohanddd 2012-11-26  
如果OR并不是在相同字段上,那么分别为这两个字段创建索引,使用union all会快许多,因为一个查询只使用一个索引。
3 楼 zzj_2046 2012-08-13  
   
2 楼 cfan_haifeng 2012-05-31  
好文章,学习了
1 楼 nsrainbow 2011-10-18  
真是一篇好文章,为我们使用union all 提供了指引!

相关推荐

    MySQL中使用or、in与union all在查询命令下的效率对比

    在MySQL数据库中,进行数据查询时,我们经常需要使用到`OR`、`IN`和`UNION ALL`这些操作符。这些操作符在不同的场景下有不同的效率表现,但并不是像网络上普遍认为的那样,`UNION ALL`总是比`OR`和`IN`更快。实际上...

    mysql实战性能优化

    ### MySQL实战性能优化 #### 一、什么是优化? 在MySQL中,优化是指通过合理地配置资源和调整系统参数,使得数据库能够更快地响应查询请求,同时尽可能减少资源消耗。优化的目标在于减少系统的瓶颈,降低资源占用...

    MySQL索引用法实例分析

    合理地创建复合索引、避免 `IN` 和 `OR` 引起的全表扫描,以及掌握 `UNION` 和 `UNION ALL` 的正确用法,都能有效地提高查询效率,尤其是在处理大量数据时。在编写SQL查询时,考虑到这些因素,可以帮助我们编写出更...

    ecplain详解和索引最佳实战.doc

    4. **type** 列:表示MySQL如何连接表,按性能从优到差排序:`SYSTEM`、`const`、`eq_ref`、`ref`、`fulltext`、`ref_or_null`、`index_merge`、`unique_subquery`、`index_subquery`、`range`、`index`和`ALL`。...

    25.1 MySQL SELECT语句

    2. **UNION ALL**:包含所有记录,包括重复值。 ### 七、子查询 1. **嵌套查询**:一个查询嵌套在另一个查询中,用于获取外部查询所需的数据。 ```sql SELECT column1 FROM table1 WHERE column1 IN (SELECT ...

    90 再次重温写出各种SQL语句的时候,会用什么执行计划?(3).pdf

    例如,在使用OR连接的查询中,可能会对每个条件使用不同的索引,然后通过intersection(交集)或union(并集)的方式合并结果集。识别这一点同样对优化SQL执行计划很重要。 4. 全表扫描与二级索引扫描:index类型相...

    数据库 面试题 实战解答

    9、 where和Having区别:10、on和in的区别:11、union和union ALL 的区别:12、数据库的备份类型:13、数据库运行于哪种状态下可以防止数据的丢失?14、SQL 约束有哪几种?15、数据库的乐观锁和悲观锁是什么?16、事务...

    dvwa环境搭建以及模拟攻击

    - 使用`union all`结合内置函数如`user()`, `database()`, `version()`等,获取敏感信息。 - 示例: `1' and 1=2 union select user(), database(), version()`。 #### 三、总结与扩展 通过上述步骤,您不仅可以...

Global site tag (gtag.js) - Google Analytics