http://blog.sina.com.cn/s/blog_4cd628bb010008z8.html
人们在使用SQL时往往会陷入一个误区,即太关注于所得的结果是否正确,而忽略了不同的实现方法之间可能存在的性能差异,这种性能差异在大型的或是复杂的数据库环境中(如联机事务处理OLTP或决策支持系统DSS)中表现得尤为明显。笔者在工作实践中发现,不良的SQL往往来自于不恰当的索引设计、不充份的连接条件和不可优化的where子句。在对它们进行适当的优化后,其运行速度有了明显地提高!下面我将从这三个方面分别进行总结:
为了更直观地说明问题,所有实例中的SQL运行时间均经过测试,不超过1秒的均表示为(< 1秒)。
测试环境--
主机:HP LH II
主频:330MHZ
内存:128兆
操作系统:Operserver5.0.4
数据库:Sybase11.0.3
一、不合理的索引设计
例:表record有620000行,试看在不同的索引下,下面几个 SQL的运行情况:
1.在date上建有一非个群集索引
select count(*) from record where date >
'19991201' and date < '19991214'and amount >
2000 (25秒)
select date,sum(amount) from record group by date
(55秒)
select count(*) from record where date >
'19990901' and place in ('BJ','SH') (27秒)
分析:
date上有大量的重复值,在非群集索引下,数据在物理上随机存放在数据页上,在范围查找时,必须执行一次表扫描才能找到这一范围内的全部行。
2.在date上的一个群集索引
select count(*) from record where date >
'19991201' and date < '19991214' and amount >
2000 (14秒)
select date,sum(amount) from record group by date
(28秒)
select count(*) from record where date >
'19990901' and place in ('BJ','SH')(14秒)
分析:
在群集索引下,数据在物理上按顺序在数据页上,重复值也排列在一起,因而在范围查找时,可以先找到这个范围的起末点,且只在这个范围内扫描数据页,避免了大范围扫描,提高了查询速度。
3.在place,date,amount上的组合索引
select count(*) from record where date >
'19991201' and date < '19991214' and amount >
2000 (26秒)
select date,sum(amount) from record group by date
(27秒)
select count(*) from record where date >
'19990901' and place in ('BJ, 'SH')(< 1秒)
分析:
这是一个不很合理的组合索引,因为它的前导列是place,第一和第二条SQL没有引用place,因此也没有利用上索引;第三个SQL使用了place,且引用的所有列都包含在组合索引中,形成了索引覆盖,所以它的速度是非常快的。
4.在date,place,amount上的组合索引
select count(*) from record where date >
'19991201' and date < '19991214' and amount >
2000(< 1秒)
select date,sum(amount) from record group by date
(11秒)
select count(*) from record where date >
'19990901' and place in ('BJ','SH')(< 1秒)
分析:
这是一个合理的组合索引。它将date作为前导列,使每个SQL都可以利用索引,并且在第一和第三个SQL中形成了索引覆盖,因而性能达到了最优。
5.总结:
缺省情况下建立的索引是非群集索引,但有时它并不是最佳的;合理的索引设计要建立在对各种查询的分析和预测上。一般来说:
①.有大量重复值、且经常有范围查询
(between, >,< ,>=,< =)和order by
、group by发生的列,可考虑建立群集索引;
②.经常同时存取多列,且每列都含有重复值可考虑建立组合索引;
③.组合索引要尽量使关键查询形成索引覆盖,其前导列一定是使用最频繁的列。
分享到:
相关推荐
索引的建立对于MySOL的高效运行是很重要的,索引可以大大提高MvSOL的检索速度。打个比方,如果合理的设计且使用索引的MySQL是一辆兰博基尼的话,那么没有设计和使用索引的MySQL就是一个人力三轮车拿汉语字典的目录页...
《MySQL索引原理及如何建立高效索引.pptx》主要讲述mysql数据库索引底层原理、作用、 索引使用、索引失效等核心技术点。非常实用!!!
4. **定期维护索引**:随着时间的推移,索引可能会变得不再高效。定期重建索引或对其进行优化可以帮助保持其性能。 总之,了解聚集索引和非聚集索引之间的区别对于优化数据库性能至关重要。通过合理设计和维护索引...
这意味着即使非主键索引也能提供足够的信息来查找主键和其他相关信息,从而实现高效的覆盖索引查询。 - **非主键ID的覆盖索引**:INNODB还支持非主键ID的覆盖索引。这意味着即使查询中只涉及到非主键ID,也可以通过...
SqlServer性能优化是数据库管理员和开发人员必须面对的常见任务,而高效索引则是提升SqlServer数据库性能的关键手段之一。索引是数据库表中的一种数据结构,用于加速查询操作,尤其是那些涉及WHERE子句、JOIN操作和...
B树适用于范围查询和排序,哈希索引适用于等值查询,位图索引在处理大量重复值时特别高效。 二、索引设计 1. 主键与唯一索引:主键索引是确保表中每条记录唯一性的关键,通常自动创建。唯一索引则限制列中的值不能...
在选择建立聚集索引或非聚集索引时,需要考虑数据的使用模式和查询类型。例如,如果某列经常被用作查询条件,并且数据范围查询较多,那么建立聚集索引会比较合适。相反,对于经常更新的列,则可能需要考虑使用非聚集...
### 聚焦索引与非聚焦索引的深度解析 ...理解聚焦索引和非聚焦索引的特点及其应用场景,可以帮助我们在实际工作中做出更合理的决策。通过对索引的有效管理和优化,可以大大提高数据库系统的整体性能。
数据库是存储和管理数据的核心工具,它通过高效的数据组织方式来提供...通过深入学习《非聚集索引.docx》、《聚集索引.docx》和《索引模式.docx》等文档,可以更全面地了解这些概念并应用于实际的数据库管理工作中。
通过创建索引,数据库系统能够更高效地查找、排序和过滤数据,从而显著提升应用程序的响应速度和整体性能。接下来,我们将详细介绍索引的优点和缺点,并探讨如何有效地建立索引以及索引的主要特征。 ### 索引的优点...
而多机多进程的方式能够更好地处理硬件故障,通过任务的自动重新分配,保证索引构建过程的连续性。 总之,基于Hadoop的分布式索引构建是一个复杂但高效的解决方案,适用于需要处理海量数据的场景。它涉及到索引种类...
### SQL优化、索引的建立和运用以及多表连接建索引的相关知识点 #### SQL优化概述 在数据库系统中,SQL语句的执行效率对于系统的响应时间和资源利用有着至关重要的影响。合理的SQL优化不仅可以显著提升查询速度,还...
《Lucene全文检索:简单索引与搜索实例详解》 Lucene是Apache软件基金会的开源项目,是一款强大的全文...在实际应用中,我们还需要关注性能优化、查询复杂性和用户体验等方面,以实现更高效、准确和友好的搜索功能。
倒排索引是搜索引擎技术中的核心组件,主要用于支持快速的全文搜索。它不同于常见的正排索引(直接索引),后者以...随着存储和计算能力的提升,未来倒排索引及压缩技术仍会不断演化,以满足更高效、更智能的搜索需求。
这个主题涉及到如何高效、实时地处理和索引大量数据,以便进行快速的查询和分析。以下是对"实时建立索引的架构"的详细解释: 一、实时性的重要性 在大数据时代,数据的生成速度极快,传统的离线索引方式已经无法...
在“建立词索引表”这个主题中,我们将深入探讨如何利用数据结构来构建和操作词索引,以支持快速的信息检索。 词索引表是一种用于存储文本数据(如书籍、文档)中关键词的数据结构,它允许用户快速查找包含特定词汇...
### Lucene对XML文档建立索引的技术解析与实践 #### 一、引言 随着互联网技术的迅猛发展,非结构化数据(如...在未来的发展中,随着数据量的不断增加和技术的进步,Lucene对XML文档的索引建立将会更加高效和智能化。
此外,学生还将了解到信息检索的重要性,以及构建一个高效索引系统对于快速检索信息的重要性。最终,通过词索引表的设计与实现,学生将掌握从系统分析到编码实现的完整流程。 这项课程设计对于学生而言是一次难得的...
一种高效的倒排索引存储结构,很好的文章,有兴趣的可下载看看