`

复合索引

阅读更多

概要
什么是单一索引,什么又是复合索引呢? 何时新建复合索引,复合索引又需要注意些什么呢?本篇文章主要是对网上一些讨论的总结。

一.概念

单一索引是指索引列为一列的情况,即新建索引的语句只实施在一列上。

用户可以在多个列上建立索引,这种索引叫做复合索引(组合索引)。复合索引的创建方法与创建单一索引的方法完全一样。但复合索引在数据库操作期间所需的开销更小,可以代替多个单一索引。当表的行数远远大于索引键的数目时,使用这种方式可以明显加快表的查询速度。

同时有两个概念叫做窄索引和宽索引,窄索引是指索引列为1-2列的索引,如果不特殊说明的话一般是指单一索引。宽索引也就是索引列超过2列的索引。

设计索引的一个重要原则就是能用窄索引不用宽索引,因为窄索引往往比组合索引更有效。拥有更多的窄索引,将给优化程序提供更多的选择余地,这通常有助于提高性能。

二.使用

创建索引 
create index idx1 on table1(col1,col2,col3)  
查询
select * from table1 where col1= A and col2= B and col3 = C

这时候查询优化器,不在扫描表了,而是直接的从索引中拿数据,因为索引中有这些数据,这叫覆盖式查询,这样的查询速度非常快。   

三.注意事项

1.何时是用复合索引
在where条件中字段用索引,如果用多字段就用复合索引。一般在select的字段不要建什么索引(如果是要查询select col1 ,col2, col3 from mytable,就不需要上面的索引了)。根据where条件建索引是极其重要的一个原则。注意不要过多用索引,否则对表更新的效率有很大的影响,因为在操作表的时候要化大量时间花在创建索引中.

2.对于复合索引,在查询使用时,最好将条件顺序按找索引的顺序,这样效率最高。如:  
  IDX1:create   index   idx1   on   table1(col2,col3,col5)  
  select   *   from   table1   where   col2=A   and   col3=B   and   col5=D  

如果是"select   *   from   table1   where   col3=B   and   col2=A   and   col5=D"
或者是"select   *   from   table1   where   col3=B"将不会使用索引,或者效果不明显

3.复合索引会替代单一索引么?
很多人认为只要把任何字段加进聚集索引,就能提高查询速度,也有人感到迷惑:如果把复合的聚集索引字段分开查询,那么查询速度会减慢吗?带着这个问题,我们来看一下以下的查询速度(结果集都是25万条数据):(日期列fariqi首先排在复合聚集索引的起始列,用户名neibuyonghu排在后列)

IDX1:create   index   idx1   on   Tgongwen(fariqi,neibuyonghu)  


(1)select gid,fariqi,neibuyonghu,title from Tgongwen
where fariqi>'2004-5-5'

查询速度:2513毫秒

(2)select gid,fariqi,neibuyonghu,title from Tgongwen
where fariqi>'2004-5-5' and neibuyonghu='办公室'

查询速度:2516毫秒

(3)select gid,fariqi,neibuyonghu,title from Tgongwen
where neibuyonghu='办公室'

查询速度:60280毫秒

从以上试验中,我们可以看到如果仅用聚集索引的起始列作为查询条件和同时用到复合聚集索引的全部列的查询速度是几乎一样的,甚至比用上全部的复合索引列还要略快(在查询结果集数目一样的情况下);而如果仅用复合聚集索引的非起始列作为查询条件的话,这个索引是不起任何作用的。当然,语句1、2的查询速度一样是因为查询的条目数一样,如果复合索引的所有列都用上,而且查询结果少的话,这样就会形成“索引覆盖”,因而性能可以达到最优。同时,请记住:无论您是否经常使用聚合索引的其他列,但其前导列一定要是使用最频繁的列。

[参考: 查询优化及分页算法方案 http://blog.csdn.net/chiefsailor/archive/2007/05/28/1628339.aspx]

4.需要在同一列上同时建单一索引和复合索引么?
试验: sysbase   5.0   表table1   字段:col1,col2,col3  

试验步骤:  
(1)建立索引idx1   on   col1  
  执行select   *   from   table1   where   col1=A     使用idx1  
  执行select   *   from   table1   where   col1=A   and   col2=B   也使用idx1  

(2)删除索引idx1,然后建立idx2   on   (col1,col2)复合索引  
  执行以上两个查询,也都使用idx2  

(3)如果两个索引idx1,idx2都存在  
  并不是   where   col1='A'用idx1;where   col1=A   and   col2=B  用idx2。  
  其查询优化器使用其中一个以前常用索引。要么都用idx1,要么都用idx2.  
   
由此可见,
(1)对一张表来说,如果有一个复合索引 on   (col1,col2),就没有必要同时建立一个单索引 on col1。
(2)如果查询条件需要,可以在已有单索引
 on col1的情况下,添加复合索引on   (col1,col2),对于效率有一定的提高。
(3)
同时建立多字段(包含5、6个字段)的复合索引没有特别多的好处,相对而言,建立多个窄字段(仅包含一个,或顶多2个字段)的索引可以达到更好的效率和灵活性。



5. 一定需要覆盖性查询么?
通常最好不要采用一个强调完全覆盖查询的策略。如果Select子句中的所有列都被一个非群集索引覆盖,优化程序会识别出这一点,并提供很好的性能。不过,这通常会导致索引过宽,并会过度依赖于优化程序使用该策略的可能性。通常,是用数量更多的窄索引,这对于大量查询来说可以提供更好的性能。

分享到:
评论

相关推荐

    SQLServer的复合索引学习.docx

    SQL Server的复合索引,是数据库管理中一种重要的性能优化技术。复合索引,也称为组合索引,是指在一个索引中包含多个列,相比于单一索引,它可以在某些特定查询场景下提供更快的检索速度。 单一索引,顾名思义,是...

    行业分类-设备装置-用于使用源于社交媒体的数据和情绪分析来生成复合索引的方法及系统.zip

    标题中的“行业分类-设备装置-用于使用源于社交媒体的数据和情绪分析来生成复合索引的方法及系统”揭示了这个主题的核心内容,它涉及到信息技术、数据分析、社交媒体和情绪分析等多个领域。这种技术通常应用于市场...

    Oracle复合索引与空值的索引使用问题小结

    Oracle数据库在处理复合索引和空值时的行为是SQL优化中的一个重要知识点,特别是对于大型数据库系统来说,理解这些细节能够显著提升查询效率。本文将详细探讨Oracle如何处理含有空值的复合索引以及非空约束对索引...

    多列复合索引的使用 绕过微软sql server的一个缺陷

    在SQL Server中,多列复合索引是一种优化查询性能的重要工具。这种索引由两个或更多列组成,目的是为了加速对这些列组合的查询。在处理复合索引时,理解其工作原理和潜在的局限性至关重要,特别是对于大型数据表来说...

    SQL Server 索引中include的魅力(具有包含性列的索引)

    * 复合索引:包含两个或者多个字段的索引。 * 非键列:键列就是在索引中所包含的列,当然非键列就是该索引之外的列了。 摘要 1:在 SQL Server 2005 中,可以通过将非键列添加到非聚集索引的叶级别来扩展非聚集索引...

    Mysql limit 优化,百万至千万级快速分页 复合索引的引用并应用于轻量级框架

    例如,如果`vtype`和`id`都经常用于查询条件,创建一个`(vtype, id)`的复合索引可能有所帮助。这样,在执行`WHERE vtype = 1`并按`id`排序的查询时,MySQL能够更快地定位到所需记录。 另外,还可以考虑使用存储过程...

    深入理解MongoDB的复合索引

    MongoDB的复合索引是数据库优化的关键工具,尤其在处理多键查询时,它可以显著提升查询性能。在MongoDB中,索引是一种特殊的数据结构,它按照特定的顺序存储了集合中文档的部分或全部字段,使得数据库系统能够快速...

    简单例子理解主键,索引,聚集索引,复合索引,非聚合索引

    一、 创建主键(主键=主键索引=聚集索引) 主键是什么? 答:拿主键可以唯一确定一条数据,它和物理存储排序一致,不能为空,一个表只能有一个。 原本没有创建的主键的表在磁盘上存储为: Id=0;username=username0;sex...

    Firestore-Composite-Index-Generator:用于在Firestore中生成复合查询所需的复合索引

    一个命令行实用程序,用于为您的Firestore应用程序生成复合索引。 关于该项目 Firestore需要使用复合索引来应用排序和过滤器的组合。 在创建应用程序时,这可能意味着要为可用的排序和过滤器的每种可能组合创建一个...

    IndexedCollection:Java 集合的自动内存中 NoSQL 复合索引-开源

    此包扩展了标准 Java 集合框架以提供 IndexedCollection 类,该类提供标准对象集合的简单、自动、内存中 NoSQL 复合索引。 它为复杂的 ORM 实现提供了替代方案或更简单的补充。 例如,如果应用程序有一个名为 Book ...

    关于数据库索引的理解(实践总结)

    以下是对复合索引、非复合索引以及不同场景下索引使用效果的实践总结。 首先,复合索引(也称为组合索引)是针对多个列创建的索引,如场景1中的IDX_TEST_01,它同时基于SEGMENT_NAME和EXTENT_ID。当查询条件包含这...

    创建索引和调优索引

    复合索引,是建立在两个或更多列上的索引,它可以提高某些特定查询的性能,减少索引数量。然而,复合索引的列必须来自同一张表,且跨表索引是不被支持的。在选择复合索引时,应综合考虑查询模式和数据分布,以避免...

    Mysql数据库索引创建、索引删除、索引失效场景详解

    MySQL支持五种主要类型的索引,分别是普通索引、主键索引、唯一索引、复合索引以及全文索引。 1. 普通索引:这是最基本的索引类型,无特殊要求,用于加速查询。例如,我们可以使用`CREATE INDEX`或`ALTER TABLE`...

    ORACLE索引笔记.pdf

    3. **复合索引的使用**:复合索引的顺序至关重要。在查询时,应尽量使查询条件与索引顺序一致,以充分利用索引。对于复合索引,如果只使用起始列,性能接近使用所有列,而只使用非起始列则无效。如果所有列都被用到...

    Oracle 索引

    Oracle提供了多种类型的索引,包括B树索引、位图索引、函数索引、唯一索引和复合索引等,每种都有其独特的应用场景和优缺点。 1. **B树索引**:这是最常见的索引类型,适用于频繁的查询操作。B树索引通过排序的数据...

Global site tag (gtag.js) - Google Analytics