`

聚簇索引和非聚簇索引

 
阅读更多

转载自:http://rbq10829.iteye.com/blog/260909 

 

一、聚簇索引(clustered indexes)的使用

 聚簇索引是一种对磁盘上实际数据重新组织以按指定的一个或多个列的值排序。由于聚簇索引的索引页面指针指向数据页面,所以使用聚簇索引查找数据几 乎总是比使用非聚簇索引快。每张表只能建一个聚簇索引,并且建聚簇索引需要至少相当该表120%的附加空间,以存放该表的副本和索引中间页。建立聚簇索引 的思想是:

1、大多数表都应该有聚簇索引或使用分区来降低对表尾页的竞争,在一个高事务的环境中,对最后一页的封锁严重影响系统的吞吐量。

2、在聚簇索引下,数据在物理上按顺序排在数据页上,重复值也排在一起,因而在那些包含范围检查(between、<、<=、& gt;、>=)或使用group by或order by的查询时,一旦找到具有范围中第一个键值的行,具有后续索引值的行保证物理上毗连在一起而不必进一步搜索,避免了大范围扫描,可以大大提高查询速度。

3、在一个频繁发生插入操作的表上建立聚簇索引时,不要建在具有单调上升值的列(如IDENTITY)上,否则会经常引起封锁冲突。

4、在聚簇索引中不要包含经常修改的列,因为码值修改后,数据行必须移动到新的位置。

5、选择聚簇索引应基于where子句和连接操作的类型。

聚簇索引的侯选列是:

1、主键列,该列在where子句中使用并且插入是随机的。

2、按范围存取的列,如pri_order > 100 and pri_order < 200。

3、在group by或order by中使用的列。

4、不经常修改的列。

5、在连接操作中使用的列。

二、非聚簇索引(nonclustered indexes)的使用

 SQLServer缺省情况下建立的索引是非聚簇索引,由于非聚簇索引不重新组织表中的数据,而是对每一行存储索引列值并用一个指针指向数据所在 的页面。换句话说非聚簇索引具有在索引结构和数据本身之间的一个额外级。一个表如果没有聚簇索引时,可有250个非聚簇索引。每个非聚簇索引提供访问数据 的不同排序顺序。在建立非聚簇索引时,要权衡索引对查询速度的加快与降低修改速度之间的利弊。另外,还要考虑这些问题:

1、索引需要使用多少空间。

2、合适的列是否稳定。

3、索引键是如何选择的,扫描效果是否更佳。

4、是否有许多重复值。

 对更新频繁的表来说,表上的非聚簇索引比聚簇索引和根本没有索引需要更多的额外开销。对移到新页的每一行而言,指向该数据的每个非聚簇索引的页级 行也必须更新,有时可能还需要索引页的分理。从一个页面删除数据的进程也会有类似的开销,另外,删除进程还必须把数据移到页面上部,以保证数据的连续性。 所以,建立非聚簇索引要非常慎重。非聚簇索引常被用在以下情况:

1、某列常用于集合函数(如Sum,....)。

2、某列常用于join,order by,group by。

3、查寻出的数据不超过表中数据量的20%。

三、覆盖索引(covering indexes)的使用

 覆盖索引是指那些索引项中包含查寻所需要的全部信息的非聚簇索引,这种索引之所以比较快也正是因为索引页中包含了查寻所必须的数据,不需去访问数据页。如果非聚簇索引中包含结果数据,那么它的查询速度将快于聚簇索引。

 但是由于覆盖索引的索引项比较多,要占用比较大的空间。而且update操作会引起索引值改变。所以如果潜在的覆盖查询并不常用或不太关键,则覆盖索引的增加反而会降低性能。

四、索引的选择技术

一般来说建立索引的思路是:

(1)、主键时常作为where子句的条件,应在表的主键列上建立聚簇索引,尤其当经常用它作为连接的时候。

(2)、有大量重复值且经常有范围查询和排序、分组发生的列,或者非常频繁地被访问的列,可考虑建立聚簇索引。

(3)、经常同时存取多列,且每列都含有重复值可考虑建立复合索引来覆盖一个或一组查询,并把查询引用最频繁的列作为前导列,如果可能尽量使关键查询形成覆盖查询。

(4)、如果知道索引键的所有值都是唯一的,那么确保把索引定义成唯一索引。

(5)、在一个经常做插入操作的表上建索引时,使用fillfactor(填充因子)来减少页分裂,同时提高并发度降低死锁的发生。如果在只读表上建索引,则可以把fillfactor置为100。

(6)、在选择索引键时,设法选择那些采用小数据类型的列作为键以使每个索引页能够容纳尽可能多的索引键和指针,通过这种方式,可使一个查询必须遍历的索引页面降到最小。此外,尽可能地使用整数为键值,因为它能够提供比任何数据类型都快的访问速度。

五、索引的维护

 上面讲到,某些不合适的索引影响到SQLServer的性能,随着应用系统的运行,数据不断地发生变化,当数据变化达到某一个程度时将会影响到索引的使用。这时需要用户自己来维护索引。索引的维护包括:

1、重建索引

 随着数据行的插入、删除和数据页的分裂,有些索引页可能只包含几页数据,另外应用在执行大块I/O的时候,重建非聚簇索引可以降低分片,维护大块I/O的效率。重建索引实际上是重新组织B-树空间。在下面情况下需要重建索引:

(1)、数据和使用模式大幅度变化。

(2)、排序的顺序发生改变。

(3)、要进行大量插入操作或已经完成。

(4)、使用大块I/O的查询的磁盘读次数比预料的要多。

(5)、由于大量数据修改,使得数据页和索引页没有充分使用而导致空间的使用超出估算。

(6)、dbcc检查出索引有问题。

当重建聚簇索引时,这张表的所有非聚簇索引将被重建。

2、索引统计信息的更新

 当在一个包含数据的表上创建索引的时候,SQLServer会创建分布数据页来存放有关索引的两种统计信息:分布表和密度表。优化器利用这个页来 判断该索引对某个特定查询是否有用。但这个统计信息并不动态地重新计算。这意味着,当表的数据改变之后,统计信息有可能是过时的,从而影响优化器追求最有 工作的目标。因此,在下面情况下应该运行update statistics命令:

(1)、数据行的插入和删除修改了数据的分布。

(2)、对用truncate table删除数据的表上增加数据行。

(3)、修改索引列的值。

六、结束语

 实践表明,不恰当的索引不但于事无补,反而会降低系统的执行性能。因为大量的索引在插入、修改和删除操作时比没有索引花费更多的系统时间。例如下面情况下建立的索引是不恰当的:

1、在查询中很少或从不引用的列不会受益于索引,因为索引很少或从来不必搜索基于这些列的行。

2、只有两个或三个值的列,如男性和女性(是或否),从不会从索引中得到好处。

 另外,鉴于索引加快了查询速度,但减慢了数据更新速度的特点。可通过在一个段上建表,而在另一个段上建其非聚簇索引,而这两段分别在单独的物理设备上来改善操作性能。

分享到:
评论

相关推荐

    005.聚簇索引与非聚簇索引b+树实现有什么区别?.mp4

    聚簇索引与非聚簇索引b+树实现有什么区别?.mp4 聚簇索引与非聚簇索引b+树实现有什么区别?.mp4 聚簇索引与非聚簇索引b+树实现有什么区别?.mp4 聚簇索引与非聚簇索引b+树实现有什么区别?.mp4 聚簇索引与非聚簇索引...

    MySQL 聚簇索引.rar

    MySQL数据库系统是世界上最受...在设计数据库时,合理地利用聚簇索引和非聚簇索引,能够为业务提供更高效、更稳定的数据服务。通过深入学习和实践,我们可以更好地掌握这些知识,从而成为更专业的MySQL数据库管理员。

    数据库中聚簇索引与非聚簇索引的区别[图文]

    数据库中的索引是提高查询效率的关键工具,主要分为聚簇索引和非聚簇索引。聚簇索引决定了数据的实际存储顺序,它的每个索引条目都直接指向数据行,因此一个表只能有一个聚簇索引。而非聚簇索引的顺序与数据存储顺序...

    SQL Server索引技术.pdf

    本文针对SQL Server的索引技术进行了详细的探讨,并提供了聚簇索引和非聚簇索引的详细信息。 聚簇索引是数据库索引的一种,它决定了表中数据的物理存储顺序。在聚簇索引中,数据行按照索引键的顺序存储在数据页上。...

    详解MySQL 聚簇索引与非聚簇索引

    从物理文件也可以看出 InnoDB(聚集索引)的数据文件只有数据结构文件.frm和数据文件.idb 其中.idb中存放的是数据和索引信息 是存放在一起的。 2、非聚集索引 表数据存储顺序与索引顺序无关。对于非聚集索引,叶结点...

    69 更新数据的时候,自动维护的聚簇索引到底是什么?l.pdf

    聚簇索引结构本质上是一种特殊的B+树数据结构,使得数据记录的物理顺序和键值的逻辑(索引)顺序相同。 在聚簇索引中,数据记录实际上存储在B+树的叶子节点上,因此叶子节点就是数据页本身。当聚簇索引建立之后,表...

    数据库实验索引的创建与使用.pdf

    索引可以分为聚簇索引和非聚簇索引两种,聚簇索引是指将数据行和索引行存储在一起的索引,而非聚簇索引是指将索引行存储在一个单独的数据结构中。 创建索引 在实验中,我们学习了如何使用 CREATE INDEX 语句创建...

    SqlServer索引工作原理

    SqlServer索引工作原理可以分为两大类:聚簇索引和非聚簇索引。 聚簇索引是一种树形结构的索引,它的数据物理存储顺序和索引顺序一致的。聚簇索引的数据页是按照顺序排列的,例如按照LastName的顺序排列的。聚簇...

    mysql索引原理之聚簇索引1

    总结来说,聚簇索引和B+Tree在MySQL中的应用是基于对数据库查询效率的优化。选择合适的数据结构和索引策略,能够显著提升数据库的响应速度,特别是在处理大数据量的场景下。理解这些原理对于数据库设计和优化至关...

    浅析优化处理SQL Server数据库索引.pdf

    总结以上,优化处理SQL Server数据库索引,需根据实际业务需求,结合表的更新频率、查询类型以及数据分布特点,合理配置聚簇索引和非聚簇索引,并注意索引维护的成本。通过这些策略,可以有效地提升数据库的性能,...

    浅析SQL Server中索引的使用.pdf

    索引在SQL Server中主要分为两大类:聚簇索引和非聚簇索引。聚簇索引决定了数据在表中的物理存储顺序,因此对于需要以特定范围或排序顺序访问的列尤为有效。聚簇索引的特点包括每张表只能有一个,其包含了多个列时被...

    MySQL索引原理及慢查询优化(2)1

    本文主要探讨的是MySQL的索引类型,特别是聚簇索引和非聚簇索引,以及它们如何影响查询优化。 首先,聚簇索引在InnoDB中是与数据行存储在一起的,也就是说,数据行的物理顺序与主键的逻辑顺序相同。如果表没有显式...

    SQL SERVER建立索引.pdf

    #### 二、聚簇索引和非聚簇索引 - **聚簇索引**:这种类型的索引决定了表中数据的实际物理存储顺序。在聚簇索引中,索引键值的顺序与数据行的物理顺序一致。每个表只能拥有一个聚簇索引,因为数据只能以一种物理...

    基于SQL Server数据库索引的创建与优化分析.pdf

    本文首先介绍了索引的相关概念和分类,然后以SQL Server的样本数据库(Northwind)为例,创建和使用聚簇索引和非聚簇索引,最后得出了索引创建和使用过程中的若干结论,旨在为SQL Server数据库索引创建和优化工作方面...

    行业-69 更新数据的时候,自动维护的聚簇索引到底是什么?l.rar

    一个表可以有多个非聚簇索引,但每次查询时,非聚簇索引需要通过索引找到对应的行号,然后再根据行号去数据页中获取数据,这个过程通常比聚簇索引慢一些。 当数据更新时,聚簇索引的维护至关重要。如果更新的字段是...

    浅谈SQL Server中索引的使用.pdf

    聚簇索引和非聚簇索引是SQL Server中两种主要的索引类型。聚簇索引决定了数据在物理磁盘上的存储顺序,每张表只能有一个聚簇索引。由于其对数据行的排序,聚簇索引在涉及范围查询时能够显著提高查询效率,因为它能够...

    数据库索引.docx

    在数据库索引的分类中,最为常见的是聚簇索引和非聚簇索引。聚簇索引定义了表中数据的物理排序方式,它使得同一聚簇索引键值的数据行在物理上也彼此靠近。因此,当涉及到多行数据的查询时,聚簇索引能够提供更快的...

    sql server 索引设计与优化

    - **区别**:文章深入分析了聚簇索引和非聚簇索引之间的区别,以及它们各自的适用场景。 - **选择依据**:虽然两者各有优势,但在具体选择时还需要考虑多种因素,包括数据特性、查询模式等。 - **一与二**:通过两篇...

    SQLSEVER索引和索引调整向导

    * 索引有两种类型,即聚簇索引和非聚簇索引。 * 聚簇索引与基表的物理顺序相同,非聚簇索引与基表的物理顺序不相同。 * 索引既可以直接创建,也可以间接创建。 * 可以在优化隐藏中使用索引。 * 使用查询处理器执行 ...

Global site tag (gtag.js) - Google Analytics