`

关于索引

阅读更多
一、        关于索引的知识

要写出运行效率高的sql,需要对索引的机制有一定了解,下面对索引的基本知识做一介绍。

1、        索引的优点和局限
索引可以提高查询的效率,但会降低dml操作的效率。
所以建立索引时需要权衡。对于dml操作比较频繁的表,索引的个数不宜太多。

2、        什么样的列需要建索引?
经常用于查询、排序和分组的列(即经常在where、order或group by子句中出现的列)。

3、        主键索引和复合索引
对于一张表的主键,系统会自动为其建立索引。
如果一张表的几列经常同时作为查询条件,可为其建立复合索引。

4、        建立索引的语句
create  index  i_staff  on  staff  (empno);
create  index  i_agent  on  agent  (empno, start_date);

5、        删除索引的语句
drop  index  I_staff;
drop  index  I_agent;

6、        查询索引的语句
法一:利用数据字典
表一:all_indexes  查看一张表有哪些索引以及索引状态是否有效
主要字段: index_name,  table_name,  status
例如:select   index_name,  status 
from  all_indexes
        where  table_name=’STAFF_INFO’;
      INDEX_NAME        STATUS
      ---------------------       -----------
      I_STAFF             VALID 
            表二:all_ind_columns  查看一张表在哪些字段上建了索引
              主要字段: table_name,  index_name,  column_name,  column_position
例如: select  index_name,  column_name,  column_position
from  all_ind_columns
         where  table_name=’AGENT’
      INDEX_NAME        COLUMN_NAME     COLUMN_POSITON
      ---------------------       -----------------------      --------------------------
     I_AGENT             EMPNO              1
     I_AGENT             START_DATE         2
由此可见,agent表中有一个复合索引(empno, start_date )
     法二:利用toad工具
toad用户界面比sql*plus友好,并且功能强大。你可以在toad编辑器中键入表名,按F4,便可见到这张表的表结构以及所有索引列等基本信息。

7、        索引的一些特点
1): 不同值较多的列上可建立检索,不同值少的列上则不要建。比如在雇员表的“性别”列上只有“男”与“女”两个不同值,因此就没必要建立索引。如果建立索引不但不会提高查询效率,反而会严重降低更新速度。
2): 如果在索引列上加表达式,则索引不能正常使用
   例如:b1,c1分别是表b,c的索引列
select  *  from  b  where  b1/30< 1000 ;
select  *  from  c  where  to_char(c1,’YYYYMMDD HH24:MI:SS’) = ‘200203 14:01:01’;
以上都是不正确的写法
        3): where子句中如果使用in、or、like、!=,均会导致索引不能正常使用
           例如:select  *  from  b  where  b1=30  or  b1=40;
      4): 使用复合索引进行查询时必须使用前置列
         例如表a上有一个复合索引(c1,c2,c3),则c1为其前置列
         如果用c1或c1+c2或c1+c2+c3为条件进行查询,则该复合索引可以发挥作用,反之,用c2或c3或c2+c3进行查询,则该索引不能起作用。


二. 书写sql注意事项:

1、        避免给sql语句中引用的索引列添加表达式:
典型实例:
b1,c1分别是表b,c的索引列:
1)        select  *  from  b  where  b1/30< 1000 ;
2)        select  *  from  c  where to_char(c1,’YYYYMMDD HH24:MI:SS’) = ‘200203 14:01:01’;
替代方案:
1)        select  *  from  b where  b1 < 30000;
2)        select * from c  where c1 = to_date(‘20020301 14:01:01’, ‘YYYYMMDD HH24:MI:SS’);
注:在lbs中有两个重要字段,pol_info中的undwrt_date和prem_info中的payment_date,这两个日期是带时分秒的,所以经常有同事用to_char 来查询某一时间段的数据。
例如:select  count(*)  from  pol_info  where  to_char(undwrt_date,’YYYYMMDD’)=’20020416’;
      select  count(*)  from  prem_info  where  to_char(undwrt_date,’YYYYMM’)=’200203’;
替代方案:
select  count(*)  from  pol_info 
where  undwrt_date>=to_date(’20020416’,’YYYYMMDD’)  and
           undwrt_date<to_date(’20020417’,’YYYYMMDD’);
select  count(*)  from  prem_info 
where  payment_date>=to_date(’20020301’,’YYYYMMDD’)  and
         payment_date<to_date(’20020401’,’YYYYMMDD’);

2、        避免在where子句中使用in、or、like、!=
典型实例:
a1是a表上的索引列:
1) select  *  from  a
   where  ( a1 = ‘0’ and ...)  or  (a1 = ‘1’ and ...);
2) select  count(*)  from  a  where  a1  in  (‘0’,’1’) ;
替代方案:
1)        select  *  from  a  where  a1 = ‘0’  and ...
union
select  *  from  a  where  a1 = ‘1’  and ...
2) select  count(*)  from  a  where  a1 = ‘0’;
  select  count(*)  from  a  where a1 = ‘1’;
   然后做一次加法运算;或者直接用存储过程来实现;
小结:
对字段使用了 ‘in,or,like’ 做条件、对字段使用了不等号 ‘!=’,均会使索引失效;如果不产生大量重复值,可以考虑把子句拆开;拆开的子句中应该包含索引,或者使用union连结符代替。另一种方式是使用存储过程,它使SQL变得更加灵活和高效。

3、        建立适当的索引
曾经接过开发的一个统计sql, select …  from  tablea  where  cola=…  and  …
运行效率非常慢,经查tablea数据量巨大,再查all_ind_columns,发现cola是tablea的一个复合索引中的一列,但不是前置列。象这种情况,就需要与开发商量,是否针对cola建一个索引。

4、        like和substr
对于‘like’和‘substr’,其效率并没有多大分别。但是,当所搜索的值不存在时,使用‘like’的速度明显大于‘substr’。
所以:select  *  from  a  where  substr(a1,1,4) = '5378'  可以用like替代
select  *  from  a  where  a1  like  ‘5378%’;

5、 写where条件时,有索引字段的判断在前,其它字段的判断在后;如果where条件中用到复合索引,按照索引列在复合索引中出现的顺序来依次写where条件;

6、使用多表连接时,在from子句中,将记录数少的表放在后面,可提高执行效率;

7、避免使用not in
not  in 是效率极低的写法,尽量使用minus或外连接加以替代
典型实例:
1) select col1 from tab1 where col1 not in (select col1 from tab2);
2) select sum(col2) from tab1 where col1 not in (select col1 from tab2);
替代方案
select col1 from tab1 minus  select col1 from tab2;
    select  sum(a.col2)  from  tab1 a, tab2  b
where a.col1=b.col2(+) and b.col1 is null;

8、多表查询时,如果其中一个表的记录数量明显大于其他表,则可以先对此表进行查询后,再与其他小表进行表连接。
典型实例:
select  a.plan_code,  b.dno,  c,tno,  sum(a.tot_modal_prem),
from  prem_info a,  dept_ref b,  plan_type c
where  substr(a.deptno,1,7) = substr(b.deptno,1,7)
and a.plan_code = c.plan_code
group by b.dno,  c.tno,  a.plan_code;
替代方案:
select  b.dno,  c.tno,  a.plan_code,  a.tot_amount
from  (select  plan_code,  deptno,  sum(tot_modal_prem)  tot_amount
from  prem_info
group  by  deptno,  plan_code) a
dept_ref  b,
plan_type  c
  where  substr(a.deptno,1,7) = substr(b.deptno,1,7)
       and  a.plan_code = c.plan_code
group  by  b.dno,  c.tno,  a.plan_code;
小结:
由于prem_info表的记录数远远大于dept_ref表和plan_type表中的记录数, 所以首先从prem_info表中查询需要的记录,此时记录数已经被大量缩小,然后再和其他两个表连接,速度会得到很大改善!

9、查询数量较大时,使用表连接代替IN,EXISTS,NOT IN,NOT EXISTS等。
典型实例:
a、使用IN:
select sum(col2) from tab1 where col1 in (select col1 from tab2);
使用EXISTS::
select sum(col2) from tab1 a
where exists ( select * from tab2 where col1=a.col1);
b、使用NOT IN:
select sum(col2) from tab1 where col1 not in (select col1 from tab2);
使用NOT EXISTS:
select sum(col2) from tab1 a
where not exists ( select * from tab2 where col1=a.col1);
          替代方案:
a、使用连接:
select sum(a.col2) from tab1 a,tab2 b where a.col1=b.col2;
b、使用外连接:
select sum(a.col2) from tab1 a,tab2 b
where a.col1=b.col2(+) and b.col1 is null;
分享到:
评论

相关推荐

    关于索引概念\特点\优点\缺点\分类\使用

    ### 关于索引概念、特点、优点、缺点、分类及使用的详细解读 #### 索引的概念 在数据库管理系统(DBMS)中,索引是一种数据结构,它可以帮助快速定位数据库表中的数据记录,从而提高数据检索的速度。索引类似于...

    整理MYSQL中关于索引的相关面试题集

    本篇文章将详细讲解MySQL中关于索引的相关知识点,包括索引的数据结构及其优劣,以及如何查看和分析SQL执行计划。 1. **索引的数据结构** - **哈希索引**:适用于单条记录查询,哈希索引通过哈希函数将键值转化为...

    ElasticSearch RestHighLevelClient 关于索引库、文档的基础操作

    以上就是Elasticsearch RestHighLevelClient关于索引库和文档的基本操作。在实际应用中,还需要考虑错误处理、集群配置、性能优化等因素。了解并熟练掌握这些操作,将有助于我们更好地利用Elasticsearch来管理和检索...

    Oracle培训 关于索引等详细信息的讲解

    在Oracle数据库中,索引分为B树索引、位图索引、函数索引等多种类型,每种都有其特定的应用场景和优缺点。 二、B树索引 B树索引是最常见的索引类型,适用于全值匹配查询。在Oracle中,B树索引由一个或多个索引块...

    mysql关于索引的面试题

    MySQL中的索引是数据库性能优化的关键工具,它能显著提高数据检索的速度。下面将详细讨论索引的类型、存储方式以及可能导致索引失效的场景。 首先,我们来看一下索引的类型: 1. **主键索引(Primary Key Index)*...

    C#关于索引器的详解笔记

    ### C#中的索引器详解 #### 一、索引器概述 索引器是C#语言提供的一个特性,它允许我们像操作数组那样通过索引来访问类或结构体的实例成员。通常情况下,当我们想要根据某个键或者索引来获取或设置对象内部的数据...

    MySQL数据库中关于索引的研究.pdf

    MySQL数据库中的索引是提高查询效率的关键技术,尤其是在处理大量数据时。本文主要探讨了MySQL数据库索引的原理、类型和优化方法。作者通过实例分析,展示了索引在解决数据库性能问题上的重要作用。 首先,作者指出...

    阿里面试中关于索引有关的问题以及知识点.pdf

    在阿里的面试中,索引是一个重要的讨论话题,特别是对于处理大数据量的系统而言。索引是一种特殊的数据结构,它被用来加速数据库中的数据检索。面试官和面试者讨论了几个关键的索引概念和技术,包括: 1. **索引...

    数据结构课后实验关于索引

    这是数据库课后的一个习题,由于本人初学者,做的不是很好,不过还是希望可以帮到你。

    SQLServer索引碎片和解决方法

    通过上述命令,我们可以获取到关于索引的详细信息,包括扫描页数、扫描扩展盘区数、扩展盘区开关数等。这些指标可以帮助我们评估索引的健康状况,进而决定是否需要对索引进行优化。 #### 五、解决索引碎片的方法 ...

    优化SQL Server索引的小技巧

    如果你运行这个向导,你会看到关于数据库中关于索引的统计量,这些统计量作为日志工作并定时更新,这样就减轻了手工重建索引所带来的工作量。如果你不想自动维护索引,那么你可以手工重建索引,并在需要时执行 ...

    数据库SQLSERVER索引

    关于索引的常识影响到数据库性能的最大因素就是索引。由于该问题的复杂性,我只可能简单的谈谈这个问题,不过关于这方面的问题,目前有好几本不错的书籍可供你参阅。我在这里只讨论两种SQLServer索引,即clustered...

    oracle rac环境下索引热块的处理思路

    关于索引使用的一些参考经验: 1. 无法使用索引的场景 索引并不总是有用的,有些情况下,索引可能会降低性能。例如,如果查询语句中的 WHERE 子句中包含多个列,而这些列都有索引,那么索引可能会被忽略。 2. ...

    查看mySQL数据库索引

    - `comment`: 关于索引的注释。 - `index_comment`: 索引的用户定义注释。 #### 四、检查MySQL索引是否生效 为了确保索引能够正常工作并提高查询效率,我们需要验证索引是否被实际使用。这通常通过`EXPLAIN`命令来...

    索引使用规则.txt

    根据“索引使用规则.txt”文件提供的信息,我们可以深入探讨一系列关于索引使用的最佳实践与限制条件,以下是对这些规则的详细解析: ### 1. 索引与逻辑运算符的兼容性 当在WHERE子句中使用`NOT`或`LIKE '%XX%'`这...

    查询索引对应的表和列

    通过解析这个DDL语句,我们可以获得关于索引的所有细节,包括它所基于的表和列。 ### 结论 查询索引对应的表和列对于理解数据库结构、优化查询效率以及进行数据库维护至关重要。通过以上介绍的两种方法——查询...

    数据库性能调优技术1索引调优.pdf

    接下来,文件中提到了几个关于索引使用的常见误区: 1. 索引并非越多越好。虽然索引可以加快查询速度,但过多的索引会降低更新操作的效率,因为每次数据变更操作都需要更新所有相关索引。因此,创建索引时应该进行...

    Explain详解与索引最佳实践.zip

    关于索引的最佳实践,有以下几点值得注意: 1. **选择合适的数据类型**:索引的性能与数据类型密切相关,尽可能使用占用空间小且排序效率高的数据类型。 2. **主键索引**:每个表应有一个唯一的主键,这将自动创建...

    richard.foote关于索引的深入研究

    Richard Foote:1982年从英国移民到澳洲堪培拉,1996年进入ORACLE公司,2002年离开ORACLE,从事ORACLE咨询服务。其专长是对ORACLE索引的深入研究,揭示了我们看不到的地方。

Global site tag (gtag.js) - Google Analytics