`

数据库建立索引的原则

阅读更多


铁律一:天下没有免费的午餐,使用索引是需要付出代价的。

索引的优点有目共睹,但是,却很少有人关心过采用索引所需要付出的成本。若数据库管理员能够对索引所需要付出的代价有一个充分的认识,也就不会那么随意到处建立索引了。

仔细数数,其实建立索引的代价还是蛮大的。如创建索引和维护索引都需要花费时间与精力。特别是在数据库设计的时候,数据库管理员为表中的哪些字段需要建立索引,要调研、要协调。如当建有索引的表中的纪录又增加、删除、修改操作时,数据库要对索引进行重新调整。虽然这个工作数据库自动会完成,但是,需要消耗服务器的资源。当表中的数据越多,这个消耗的资源也就越多。如索引是数据库中实际存在的对象,所以,每个索引都会占用一定的物理空间。若索引多了,不但会占用大量的物理空间,而且,也会影响到整个数据库的运行性能。

可见,数据库管理员若要采用索引来提高系统的性能,自身仍然需要付出不少的代价。数据库管理员现在要考虑的就是如何在这两个之间取得一个均衡。或者说,找到一个回报与投入的临界点。



铁律二:对于查询中很少涉及的列或者重复值比较多的列,不要建立索引。

在查询的时候,如果我们不按某个字段去查询,则在这个字段上建立索引也是浪费。如现在有一张员工信息表,我们可能按员工编号、员工姓名、或者出身地去查询员工信息。但是,我们往往不会按照身份证号码去查询。虽然这个身份证号码是唯一的。此时,即使在这个字段上建立索引,也不能够提高查询的速度。相反,增加了系统维护时间和占用了系统空间。这简直就是搬起石头砸自己的脚呀。

另外,如上面的员工信息表,有些字段重复值比较多。如性别字段主要就是“男”、“女”;职位字段中也是有限的几个内容。此时,在这些字段上添加索引也不会显著的增加查询速度,减少用户响应时间。相反,因为需要占用空间,反而会降低数据库的整体性能。

数据库索引管理中的第二条铁律就是,对于查询中很少涉及的列或者重复值比较多的列,不要建立索引。



铁律三:对于按范围查询的列,最好建立索引。

在信息化管理系统中,很多时候需要按范围来查询某些交易记录。如在ERP系统中,经常需要查询当月的销售订单与销售出货情况,这就需要按日期范围来查询交易记录。如有时候发现库存不对时,也需要某段时期的库存进出情况,如5月1日到12月3日的库存交易情况等等。此时,也是根据日期来进行查询。

对于这些需要在指定范围内快速或者频繁查询的数据列,需要为其建立索引。因为索引已经排序,其保存的时候指定的范围是连续的,查询可以利用索引的排序,加快查询时间,减少用户等待时间。

不过,若虽然可能需要按范围来进行查询,但是,若这个范围查询条件利用的不多的情况下,最好不好采用索引。如在员工信息表中,可能需要查询2008年3月份以前入职的员工明细,要为他们增加福利。但是,由于表中记录不多,而且,也很少进行类似的查询。若维这个字段建立索引,虽然无伤大雅,但是很明显,索引所获得的收益要低于其成本支出。对数据库管理员来说,是得不偿失的。

再者,若采用范围查询的话,最好能利用TOP关键字来限制一次查询的结果。如第一次按顺序只显示前面的500条记录等等。把TOP关键字跟范围一起使用,可以大大的提高查询的效率。



铁律四:表中若有主键或者外键,一定要为其建立索引。

定义有主键的索引列,一定要为其建立索引。因为主键可以加速定位到表中的某一行。结合索引的作用,可以使得查询的速度加倍。如在员工信息表中,我们往往把员工编号设置为主键。因为这不但可以提高查询的速度,而且因为主键要求记录的唯一,还可以保证员工编号的唯一性。此时,若再把这个员工编号字段设置为索引,则通过员工编号来查询员工信息,其效率要比没有建立索引高出许多。

另外,若要使得某个字段的值唯一,可以通过两种索引方式实现。一种就是上面所讲的主键索引。还有一种就是唯一索引,利用UNIQUE关键字指定字段内容的唯一性。这两种方式都会在表中的指定列上自动创建唯一索引。这两种方式的结果没有明显的区别。查询优化器不会区分到底是哪种方式建立的唯一性索引,而且他们进行数据查询的方式也是相同的。

若某张表中的数据列定义有外键,则最好也要为这个字段建立索引。因为外键的主要作用就在于表与表之间的连接查询。若在外键上建立索引,可以加速表与表之间的连接查询。如在员工基本信息表中,有一个字段为员工职位。由于员工职位经常在变化,在这里,存储的其实只是一个员工职位的代码。在另外一张职位信息表中详细记录着该职位的相关信息。此时,这个员工职位字段就是外键。若在这个字段上建立外键,则可以显著提高两张表的连接速度。而且,记录越多,其效果越加明显。

所以,当表中有外键或者主键的时候,就最好为其建立索引。通过索引,可以强化主键与外键的作用,提高数据库的性能。



铁律五:对于一些特殊的数据类型,不要建立索引。

在表中,有些字段比较特殊。如文本字段(TXT)、图像类型字段(IMAGE)等等。如果表中的字段属于这些数据类型,则最好不要为其建立索引。因为这些字段有一些共同的特点。如长度不确定,要么很长,几个字符;要么就是空字符串。如文本数据类型常在应用系统的数据库表中用来做备注的数据类型。有时候备注很长,但有时候又没有数据。若这种类型的字段上建立索引,那根本起不了作用。相反,还增加了系统的负担。

所以,在一些比较特殊的数据类型上,建立索引要谨慎。在通常情况下,没有必要为其建立索引。但是,也有特殊的情况。如有时候,在ERP系统中,有产品信息这个表,其中有个产品规格这个字段。有时候,其长度可能长达5000个字符。此时,只有文本型的数据类型可以容纳这么大的数据量。而且,在查询的时候,用户又喜欢通过规格这个参数来查询产品信息。此时,若不为这个字段建立索引的话,则查询的速度会很慢。遇到这种情况时,数据库管理员只有牺牲一点系统资源,为其建立索引。

从这里也可以看出,虽然以上几条说的时铁律,但是,是否需要遵循,还是需要数据库管理员根据企业的实际情况,做出合理的选择。



铁律六:索引可以跟Where语句的集合融为一体。

用户在查询信息的时候,有时会经常会用到一些限制语句。如在查询销售订单的时候,经常会用到客户以及下单日期的条件集合;如在查询某个产品的库存交易情况时,就会利用产品编号与交易日期起止日期的条件集合。

对于这些经常用在Where子句中的数据列,将索引建立在Where子句的集合过程中,对于需要加速或者频繁检索的数据列,可以让这些经常参与查询的数据列按照索引的排序进行查询,以加快查询的时间。

总之,索引就好像一把双刃剑,即可以提高数据库的性能,也可能对数据库的性能起到反面作用。作为数据库管理员,要有这个能力判断在合适的时间、合适的业务、合适的字段上建立合适的索引。以上六个铁律,只是对建立索引的一些基本要求
[size=medium][/size]


分享到:
评论

相关推荐

    数据库索引设计和优化

    选择性低的列不适合建立索引。 2. 索引维护:索引需要随着数据的增删改进行维护,因此要考虑操作频率和复杂度。 3. 分区索引:对于大数据量的表,可以通过分区将数据逻辑上分块,减少扫描的数据量,提高查询效率。 4...

    MySQL-数据库-索引详解

    ###为经常需要排序、分组、联合操作的字段建立索引 ###为常作为查询条件的字段建立索引 ###限制索引的数目 索引数目不是越多越好,每个索引都占用磁盘空间,索引越多,需要磁盘空间越多。修改表时,对索引的重构...

    经典数据库设计14个原则

    - **具体措施**:针对频繁访问的数据建立索引,优化数据库结构以减少数据冗余,并采用缓存技术提高访问速度。 #### 14. 数据库安全策略 - **安全措施**:包括但不限于用户权限管理、数据加密、审计日志等。 - **...

    数据库索引设计与优化

    1. 针对频繁查询的列创建索引:根据SQL语句的执行计划,找出最常用于查询的列来建立索引。 2. 平衡读写性能:在考虑索引数量时,需要平衡读取速度和写入速度,避免过度索引。 3. 复合索引:对于多条件查询,可以创建...

    mysql数据库设计原则

    - **按需创建索引**:不是所有的字段都需要建立索引。应根据查询需求和表结构来决定哪些字段应该被索引。 - **复合索引策略**:当一个查询涉及多个字段时,可以考虑创建复合索引以减少索引的数量,并提高查询效率。 ...

    数据库设计原则与技巧

    ### 数据库设计原则与技巧详解 #### 一、数据库设计原则概述 数据库设计是构建高效、稳定、可扩展数据存储系统的关键步骤。优秀的数据库设计不仅能提高数据管理的效率,还能确保数据的一致性和完整性,降低后期...

    oracle数据库索引与sql的优化

    - 如果WHERE子句中涉及到的列是经常排序或分组的列,则建立索引有助于加速查询过程。 - 对于SELECT、INSERT、DELETE、UPDATE等操作,合理使用索引可以提高其执行效率。 2. **SQL语句优化示例:** - 使用`NOT ...

    数据库建立索引的一般依据小结

    这是因为主键用于唯一标识每条记录,而外键确保了数据的参照完整性,它们在数据库操作中扮演着至关重要的角色,建立索引能够快速定位到相关记录,提高关联查询的速度。 其次,当数据量超过300条时,通常建议为表...

    面向程序员的数据库访问优化原则

    - **案例**:通过建立合适的索引结构,减少不必要的表扫描操作。 2. **返回更少数据(减少网络传输或磁盘访问)** - **原理**:减少数据传输量有助于减轻网络负载和磁盘压力。 - **方法**:选择性地检索所需列、...

    数据库设计原则优化数据库的设计

    本文将探讨一些核心的设计原则,旨在优化数据库的设计,提高系统的整体性能。 首先,简洁明了的命名规范至关重要。数据库、表和字段的命名应当清晰反映其用途,如使用公司简称加系统名称来命名数据库,如"BxxCRM"。...

    数据库设计原则14法则

    以下是关于“数据库设计原则14法则”的详细解析: 1. 原始单据与实体之间的关系:数据库设计时,需要考虑原始数据源(如业务表格)与实体表之间的映射。通常,一张原始单据对应一个实体,但也有特殊情况,如一对一...

    数据库建表原则-设计思想-查询优化

    ### 数据库建表原则详解 #### 一、原始单据与实体之间的关系 在数据库设计过程中,原始单据与实体之间的关系是理解数据结构的基础。根据业务需求的不同,这种关系可以表现为一对一、一对多或者多对多的形式。最...

    数据库索引设计与优化,数据库必学经典

    本节将深入探讨数据库索引的基础知识,设计原则以及优化技巧。 一、数据库索引的概念 索引是一种特殊的数据结构,用于加速数据表中记录的查找。它们类似于书籍的目录,允许数据库系统快速定位到所需的数据行,而...

    数据库C#,数据库设计,原则,基础

    本文将深入探讨数据库设计的基本原则和步骤,帮助理解如何构建一个有效的数据库。 首先,数据库设计的核心在于理解用户需求。在需求分析阶段,我们需要深入调查和分析用户的具体业务场景,了解他们对数据的使用方式...

    Mysql数据库索引创建、索引删除、索引失效场景详解

    它通过分词技术建立索引,提高搜索效率。然而,全文索引的使用受到MySQL版本、存储引擎和字段类型的限制。例如,MySQL5.6之前,全文索引仅限于MyISAM引擎,而5.6之后的InnoDB引擎也开始支持。 除了创建索引,索引...

    数据库索引创建建议

    ### 数据库索引创建建议 #### 一、深入理解索引结构 索引在数据库管理中扮演着极其重要的角色,特别是在处理大量数据时。合理的索引设计能够显著提高查询性能,减少系统的响应时间。本文主要探讨数据库中的两种...

    数据库设计的原则与技巧.pdf

    在对建有复合索引的字段进行检索时,应注意按照复合索引字段建立的顺序进行。 3. 避免长事务。对单个大表的删除或插入操作会带来大事务,较好的解决方法是,把整个事务分解成几个较小的事务,再由应用程序控制整个...

    数据库的索引

    - 应避免对经常发生变动的数据表建立索引,因为这些操作会导致索引频繁地被更新,从而影响效率。 - 如果数据量很小,例如只包含几条记录,那么可能并不需要创建索引,因为全表扫描的开销可能并不大。 实践部分介绍...

Global site tag (gtag.js) - Google Analytics