- 浏览: 189924 次
- 性别:
- 来自: 上海
文章分类
最新评论
一、 ROWID的概念
存储了row在数据文件中的具体位置:64位 编码的数据,A-Z, a-z, 0-9, +, 和 /,
row在数据块中的存储方式
SELECT ROWID, last_name FROM hr.employees WHERE department_id = 20;
比 如:OOOOOOFFFBBBBBBRRR
OOOOOO:data object number, 对应dba_objects.data_object_id
FFF:file#, 对应v$datafile.file#
BBBBBB:block#
RRR:row#
Dbms_rowid包
SELECT dbms_rowid.rowid_block_number('AAAGFqAABAAAIWEAAA') from dual;
具 体到特定的物理文件
二、 索引的概念
1、 类似书的目录结构
2、 Oracle 的“索引”对象,与表关联的可选对象,提高SQL查询语句的速度
3、 索引直接指向包含所查询值的行的位置,减少磁盘I/O
4、 与所索引的表是相互独立的物理结构
5、 Oracle 自动使用并维护索引,插入、删除、更新表后,自动更新索引
6、 语法:CREATE INDEX index ON table (column[, column]...);
7、 B-tree结构(非bitmap):
[一]了解索引的工作原理:
表:emp
目标:查询Frank的工资salary
建立索 引:create index emp_name_idx on emp(name);
[试验]测试索引的作用:
1. 运行/rdbms/admin/utlxplan 脚本
2. 建立测试表
create table t as select * from dba_objects;
insert into t select * from t;
create table indextable
as select rownum id,owner,object_name,subobject_name,
object_id,data_object_id,object_type,created
from t;
3. set autotrace trace explain
4. set timing on
5. 分析表,可以得到cost
6. 查询 object_name=’DBA_INDEXES’
7. 在object_name列上建立索引
8. 再查询
[思考]索引的代价:
插入,更新
三、 唯一索引
1、 何时创建:当某列任意两行的值都不相同
2、 当建立Primary Key(主键)或者Unique constraint(唯一约束)时,唯一索引将被自动建立
3、 语法:CREATE UNIQUE INDEX index ON table (column);
4、 演示
四、 组合索引
1、 何时创建:当两个或多个列经常一起出现在where条件中时,则在这些列上同时创建组合索引
2、 组合索引中列的顺序是任意的,也无需相邻。但是建议将最频繁访问的列放在列表的最前面
3、 演示(组合列,单独列)
五、 位图索引
1、 何时创建:
列中有非常多的重复的值时候。例如某列保存了 “性别”信息。
Where 条件中包含了很多OR操作符。
较少的update操作,因为要相应的跟新所有的bitmap
2、 结构:位图索引使用位图作为键值,对于表中的每一数据行位图包含了TRUE(1)、FALSE(0)、或NULL值。
3、 优点:位图以一种压缩格式存放,因此占用的磁盘空间比标准索引要小得多
4、 语法:CREATE BITMAP INDEX index ON table (column[, column]...);
5、 掩饰:
create table bitmaptable as select * from indextable where owner in('SYS','PUBLIC');
分析,查找,建立索引,查找
六、 基于函数的索引
1、 何时创建:在WHERE条件语句中包含函数或者表达式时
2、 函数包括:算数表达式、PL/SQL函数、程序包函数、SQL函数、用户自定义函数。
3、 语法:CREATE INDEX index ON table (FUNCTION(column));
4、 演示
必须要分析表,并且 query_rewrite_enabled=TRUE
或者使用提示/*+ INDEX(ic_index)*/
七、 反向键索引
目的:比如索引值是一个自动增长的列:
多个用户对集中在少数块上的索引行进行修改,容易引起资源的争用,比如对数据块的等待。此时建立反向索 引。
性能问题:
语法:
重建为标准索引:反之不行
八、 键压缩索引
比如表landscp的数据如下:
site feature job
Britten Park, Rose Bed 1, Prune
Britten Park, Rose Bed 1, Mulch
Britten Park, Rose Bed 1,Spray
Britten Park, Shrub Bed 1, Mulch
Britten Park, Shrub Bed 1, Weed
Britten Park, Shrub Bed 1, Hoe
……
查询时,以上3列均在where条件中同时出现,所以建立基于以上3列的组合索引。但是发现重复值很多,所以考虑压缩特性。
Create index zip_idx
on landscp(site, feature, job)
compress 2;
将索引项分成前缀(prefix)和后缀(postfix)两部分。前两项被放置到前缀部分。
Prefix 0: Britten Park, Rose Bed 1
Prefix 1: Britten Park, Shrub Bed 1
实际所以的结构为:
0 Prune
0 Mulch
0 Spray
1 Mulch
1 Weed
1 Hoe
特点:组合索引的前缀部分具 有非选择性时,考虑使用压缩。减少I/O,增加性能。
九、 索引组织表(IOT)
将表中的数据按照索 引的结构存储在索引中,提高查询速度。
牺牲插入更新的性能,换取查询 性能。通常用于数据仓库,提供大量的查询,极少的插入修改工作。
必须指定主键。插入数据时,会根据主键列进行B树索引排序,写入磁盘。
十、 分区索引
簇:
A cluster is a group of tables that share the same data blocks because they share common columns and are often used together.
-----------------------------------------------------------------
一. 索引介绍
1.1 索引的创建 语法 :
CREATE UNIUQE | BITMAP INDEX <schema>.<index_name>
ON <schema>.<table_name>
(<column_name> | <expression> ASC | DESC,
<column_name> | <expression> ASC | DESC,...)
TABLESPACE <tablespace_name>
STORAGE <storage_settings>
LOGGING | NOLOGGING
COMPUTE STATISTICS
NOCOMPRESS | COMPRESS<nn>
NOSORT | REVERSE
PARTITION | GLOBAL PARTITION<partition_setting>
相关说明
1) UNIQUE | BITMAP :指定UNIQUE 为唯一值索引, BITMAP 为位图索引, 省略为B-Tree 索引。
2) <column_name> | <expression> ASC | DESC :可以对多列进行联合索引,当为expression 时即 “ 基于函数的索引 ”
3) TABLESPACE :指定存放索引的表空间 (索引和原表不在一个表空间时效率更高 )
4) STORAGE :可进一步设置表空间的存储参数
5) LOGGING | NOLOGGING :是否对索引产生重做日志( 对大表尽量使用 NOLOGGING 来减少占用空间并提高效率 )
6) COMPUTE STATISTICS :创建新索引时收集统计信息
7) NOCOMPRESS | COMPRESS<nn> :是否使用“ 键压缩 ”( 使用键压缩可以删除一个键列中出现的重复值 )
8) NOSORT | REVERSE :NOSORT 表示与表中相同的顺序创建索引, REVERSE 表示相反顺序存储索引值
9) PARTITION | NOPARTITION :可以在 分区表 和未分区表上对创建的索引进行分区
1. 2 索引特点:
第一 ,通过创建唯一性索引,可以保证数据库表中每一行数据的唯一性。
第二 ,可以大大加快数据的检索速度,这也是创建索引的最主要的原因。
第三 ,可以加速表和表之间的连接,特别是在实现数据的参考完整性方面特别有意义。
第四 ,在使用分组和排序子句进行数据检索时,同样可以显著减少查询中分组和排序的时间。
第五 ,通过使用索引,可以在查询的过程中,使用优化隐藏器,提高系统的性能。
1. 3 索引不足:
第一 ,创建索引和维护索引要耗费时间,这种时间随着数据量的增加而增加。
第二 ,索引需要占物理空间,除了数据表占数据空间之外,每一个索引还要占一定的物理空间,如果要建立聚簇索引,那么需要的空间就会更大。
第三 ,当对表中的数据进行增加、删除和修改的时候,索引也要动态的维护,这样就降低了数据的维护速度。
1. 4 应该建索引列的特点:
1) 在经常需要搜索的列上,可以加快搜索的速度;
2) 在作为主键的列上,强制该列的唯一性和组织表中数据的排列结构;
3) 在经常用在连接的列上,这些列主要是一些外键,可以加快连接的速度;
4) 在经常需要根据范围进行搜索的列上创建索引,因为索引已经排序,其指定的范围是连续的;
5) 在经常需要排序的列上创建索引,因为索引已经排序,这样查询可以利用索引的排序,加快排序查询时间;
6) 在经常使用在WHERE 子句中的列上面创建索引,加快条件的判断速度。
1. 5 不应该建索引列的特点:
第一 ,对于那些在查询中很少使用或者参考的列不应该创建索引。这是因为,既然这些列很少使用到,因此有索引或者无索引,并不能提高查询速度。相反,由于增加了索引,反而降低了系统的维护速度和增大了空间需求。
第二 ,对于那些只有很少数据值的列也不应该增加索引。这是因为,由于这些列的取值很少,例如人事表的性别列,在查询的结果中,结果集的数据行占了表中数据行的很大比例,即需要在表中搜索的数据行的比例很大。增加索引,并不能明显加快检索速度。
第三 ,对于那些定义为 blob 数据类型的列不应该增加索引。这是因为,这些列的数据量要么相当大,要么取值很少。
第四 ,当修改性能远远大于检索性能时,不应该创建索引。这是因为,修改性能和检索性能是互相矛盾的。当增加索引时,会提高检索性能,但是会降低修改性能。当减少索引时,会提高修改性能,降低检索性能。因此,当修改性能远远大于检索性能时,不应该创建索引。
1.6 限制索引
限制索引是一些没有经验的开发人员经常犯的错误之一。在SQL 中有很多陷阱会使一些索引无法使用。下面讨论一些常见的问题:
1.6.1 使用不等于操作符(<> 、 != )
下面的查询即使在cust_rating 列有一个索引,查询语句仍然执行一次全表扫描。
select cust_Id,cust_name from customers where cust_rating <> 'aa';
把上面的语句改成如下的查询语句,这样,在采用基于规则的优化器而不是基于代价的优化器(更智能)时,将会使用索引。
select cust_Id,cust_name from customers where cust_rating < 'aa' or cust_rating > 'aa';
特别注意:通过把不等于操作符改成 OR 条件,就可以使用索引,以避免全表扫描。
1.6. 2 使用 IS NULL 或 IS NOT NULL
使用 IS NULL 或 IS NOT NULL 同样会限制索引的使用 。因为 NULL 值并没有被定义。在 SQL 语句中使用 NULL 会有很多的麻烦。因此建议开发人员在建表时,把需要索引的列设成 NOT NULL 。如果被索引的列在某些行中存在 NULL 值,就不会使用这个索引(除非索引是一个位图索引,关于位图索引在稍后在详细讨论)。
1.6 .3 使用函数
如果不使用基于函数的索引,那么在SQL 语句的 WHERE 子句中对存在索引的列使用函数时,会使优化器忽略掉这些索引。
下面的查询不会使用索引(只要它不是基于函数的索引)
select empno,ename,deptno from emp where trunc(hiredate)='01-MAY-81';
把上面的语句改成下面的语句,这样就可以通过索引进行查找。
select empno,ename,deptno from emp where hiredate<(to_date('01-MAY-81')+0.9999);
1.6 .4 比较不匹配的数据类型
也是比较难于发现的性能问题之一。 注意下面查询的例子,account_number 是一个 VARCHAR2 类型 , 在 account_number 字段上有索引。
下面的语句将执行全表扫描 :
select bank_name,address,city,state,zip from banks where account_number = 990354;
Oracle可以自动把 where 子句变成 to_number(account_number)=990354 ,这样就限制了索引 的使用 , 改成下面的查询就可以使用索引:
select bank_name,address,city,state,zip from banks where account_number ='990354';
特别注意: 不匹配的数据类型之间比较会让Oracle 自动限制索引的使用 , 即便对这个查询执行 Explain Plan 也不能让您明白为什么做了一次 “ 全表扫描 ” 。
1. 7 查询 索引
查询DBA_INDEXES 视图可得到表中所有索引的列表,注意只能通过 USER_INDEXES 的方法来检索模式 (schema) 的索引。访问 USER_IND_COLUMNS 视图可得到一个给定表中被索引的特定列。
1. 8 组合索引
当某个索引包含有多个已索引的列时,称这个索引为 组合(concatented )索引 。在 Oracle9i 引入跳跃式扫描的索引访问方法之前,查询只能在有限条件下使用该索引。比如:表 emp 有一个组合索引键,该索引包含了 empno 、 ename 和 deptno 。在 Oracle9i 之前除非在 where 之句中对第一列( empno )指定一个值,否则就不能使用这个索引键进行一次范围扫描。
特别注意:在Oracle9i 之前,只有在使用到索引的前导索引时才可以使用组合索引!
1. 9 ORACLE ROWID
通过每个行的ROWID ,索引 Oracle 提供了访问单行数据的能力。 ROWID 其实就是直接指向单独行的线路图。如果想检查重复值或是其他对 ROWID 本身的引用,可以在任何表中使用和指定 rowid 列。
1.10 选择性
使用USER_INDEXES 视图,该视图中显示了一个 distinct_keys 列。比较一下唯一键的数量和表中的行数,就可以判断索引的选择性。选择性越高,索引返回的数据就越少。
1.11 群集因子(Clustering Factor)
Clustering Factor位于 USER_INDEXES 视图中。该列反映了数据相对于已 建 索引的列是否显得有序。如果Clustering Factor 列的值接近于索引中的树叶块 (leaf block) 的数目,表中的数据就越有序。如果它的值接近于表中的行数,则表中的数据就不是很有序。
1.12 二元高度(Binary height)
索引的二元高度对把ROWID 返回给用户进程时所要求的 I/O 量起到关键作用。在对一个索引进行分析后,可以通过查询 DBA_INDEXES 的 B- level 列查看它的二元高度 。二元高度主要随着表的大小以及被索引的列中值的范围的狭窄程度而变化。索引上如果有大量被删除的行,它的二元高度也会增加。更新索引列也类似于删除操作,因为它增加了已删除键的数目。 重建索引可能会降低二元高度 。
1.13 快速全局扫描
从 Oracle7.3后就可以使用快速全局扫描 (Fast Full Scan) 这个选项。这个选项允许 Oracle 执行一个全局索引扫描操作。快速全局扫描读取 B- 树索引上所有树叶块。初始化文件中的 DB_FILE_MULTIBLOCK_READ_COUNT 参数可以控制同时被读取的块的数目。
1.14 跳跃式扫描
从Oracle9i 开始,索引跳跃式扫描特性可以允许优化器使用组合索引,即便索引的前导列没有出现在 WHERE 子句中。索引跳跃式扫描比全索引扫描 要快的多。
下面的 比较他们的区别 :
SQL> set timing on
SQL> create index TT_index on TT(teamid,areacode);
索引已创建。
已用时间: 00: 02: 03.93
SQL> select count(areacode) from tt;
COUNT(AREACODE)
---------------
7230369
已用时间: 00: 00: 08.31
SQL> select /*+ index(tt TT_index )*/ count(areacode) from tt;
COUNT(AREACODE)
---------------
7230369
已用时间: 00: 00: 07.37
1.15 索引的类型
•B-树索引
•位图索引
•HASH索引
•索引编排表
•反转键索引
•基于函数的索引
•分区索引
•本地和全局索引
二. 索引分类
Oracle提供了大量索引选项。知道在给定条件下使用哪个选项对于一个应用程序的性能来说非常重要。一个错误的选择可能会引发死锁,并导致数据库性能急剧下降或进程终止。而如果做出正确的选择,则可以合理使用资源,使那些已经运行了几个小时甚至几天的进程在几分钟得以完成,这样会使您立刻成为一位英雄。 下面 就将简单的讨论每个索引选项。
下面讨论的索引类型:
B树索引 (默认类型 )
位图索引
HASH索引
索引组织表索引
反转键(reverse key) 索引
基于函数的索引
分区索引( 本地和全局索引 )
位图连接索引
2.1 B树索引 (默认类型 )
B树索引在 Oracle 中是一个通用索引。在创建索引时它就是默认的索引类型 。 B 树索引可以是一个列的 ( 简单 ) 索引,也可以是组合 / 复合 ( 多个列 ) 的索引。 B 树索引最多可以包括 32 列 。
在 下图 的例子中,B 树索引位于雇员表的 last_name 列上。这个索引的二元高度为 3 ;接下来, Oracle 会穿过两个树枝块 (branch block) ,到达包含有 ROWID 的树叶块。在每个树枝块中,树枝行包含链中下一个块的 ID 号。
树叶块包含 了 索引值 、 ROWID ,以及指向前一个和后一个树叶块的 指针 。Oracle 可以从两个方向遍历这个二叉树。 B 树索引保存了在索引列上有值的每个数据行的 ROWID 值。 Oracle不会对索引列上包含 NULL 值的行进行索引 。如果索引是多个列的组合索引,而其中列上包含NULL 值,这一行就会处于包含 NULL 值的索引列中,且将被处理为空 ( 视为 NULL) 。
技巧 : 索引列的值都存储在索引中。因此,可以建立一个组合 ( 复合 ) 索引,这些索引可以直接满足查询,而不用访问表。这就不用从表中检索数据,从而减少了 I/O 量。
B-tree 特点 :
1.适合与大量的增、删、改(OLTP )
2.不能用包含OR 操作符的查询;
3.适合高基数的列(唯一值多)
4.典型的树状结构;
5.每个结点都是数据块;
6.大多都是物理上一层、两层或三层不定,逻辑上三层;
7.叶子块数据是排序的,从左向右递增;
8.在分支块和根块中放的是索引的范围;
2.2 位图索引
位图索引非常适合于决策支持系统(Decision Support System , DSS) 和数据仓库 ,它们不应该用于通过事务处理应用程序访问的表。它们可以使用较少到中等基数( 不同值的数量 ) 的列访问非常大的表。尽管位图索引最多可达 30 个列,但通常它们都只用于少量的列。
例如,您的表可能包含一个称为Sex 的列,它有两个可能值:男和女。这个基数只为 2 ,如果用户频繁地根据 Sex 列的值查询该表,这就是位图索引的基列。当一个表内包含了多个位图索引时,您可以体会到位图索引的真正威力。如果有多个可用的位图索引, Oracle 就可以合并从每个位图索引得到的结果集,快速删除不必要的数据。
Bitmap t 特点 :
1.适合与决策支持系统;
2.做UPDATE 代价非常高;
3.非常适合OR 操作符的查询;
4.基数比较少的时候才能建位图索引;
技巧: 对于有较低基数的列需要使用位图索引。性别列就是这样一个例子,它有两个可能值:男或女( 基数仅为 2) 。 位图对于低基数( 少量的不同值 ) 列来说非常快 ,这是因为索引的尺寸相对于B 树索引来说小了很多。因为这些索引是低基数的 B 树索引,所以非常小,因此您可以经常检索表中超过半数的行,并且仍使用位图索引。
当大多数条目不会向位图添加新的值时,位图索引在批处理( 单用户 ) 操作中加载表 ( 插入操作 ) 方面通常要比 B 树做得好。当多个会话同时向表中插入行时不应该使用位图索引,在大多数事务处理应用程序中都会发生这种情况。
示例
下面来看一个示例表PARTICIPANT ,该表包含了来自个人的调查数据。列 Age_Code 、 Income_Level 、 Education_Level 和 Marital_Status 都包括了各自的位图索引。 下图 显示了每个直方图中的数据平衡情况,以及对访问每个位图索引的查询的执行路径。图中的执行路径显示了有多少个位图索引被合并,可以看出性能得到了显著的提高。
如 上图 图所示,优化器依次使用4 个单独的位图索引,这些索引的列在 WHERE 子句中被引用。每个位图记录指针 ( 例如 0 或 1) ,用于指示表中的哪些行包含位图中的已知值。有了这些信息后, Oracle 就执行 BITMAP AND 操作以查找将从所有 4 个位图中返回哪些行。该值然后被转换为 ROWID 值,并且查询继续完成剩余的处理工作。 注意,所有4 个列都有非常低的基数,使用索引可以非常快速地返回匹配的行。
技巧: 在一个查询中合并多个位图索引后,可以使性能显著提高。位图索引使用固定长度的数据类型要比可变长度的数据类型好。较大尺寸的块也会提高对位图索引的存储和读取性能。
下面的查询可显示索引类型。
SQL> select index_name, index_type from user_indexes;
INDEX_NAME INDEX_TYPE
------------------------------ ----------------------
TT_INDEX NORMAL
IX_CUSTADDR_TP NORMAL
B树索引 作为NORMAL 列出;而 位图索引 的类型值为 BITMAP 。
技巧: 如果要查询位图索引列表,可以在USER _INDEXES 视图中查询 index_type 列。
建议不要在一些联机事务处理(OLTP) 应用程序中使用位图索引 。B 树索引的索引值中包含 ROWID ,这样 Oracle 就可以在行级别上锁定索引。位图索引存储为压缩的索引值,其中包含了一定范围的 ROWID ,因此 Oracle 必须针对一个给定值锁定所有范围内的 ROWID 。这种锁定类型可能在某些 DML 语句中造成死锁。 SELECT 语句不会受到这种锁定问题的影响。
位图索引 的使用 限制 :
1.基于规则的优化器不会考虑位图索引。
2.当执行ALTER TABLE 语句并修改包含有位图索引的列时,会使位图索引失效。
3.位图索引不包含任何列数据,并且不能用于任何类型的完整性检查。
4.位图索引不能被声明为唯一索引。
5.位图索引的最大长度为30 。
技巧: 不要在繁重的OLTP 环境中使用位图索引
2.3 HASH索引
使用HASH 索引必须要使用 HASH 集群 。建立一个集群或HASH 集群的同时,也就定义了一个集群键。这个键告诉 Oracle 如何在集群上存储表。在存储数据时,所有与这个集群键相关的行都被存储在一个数据库块上。如果数据都存储在同一个数据库块上,并且将 HASH 索引作为 WHERE 子句中的确切匹配, Oracle 就可以通过执行一个 HASH 函数和 I/O 来访问数据 —— 而通过使用一个二元高度为 4 的 B 树索引来访问数据,则需要在检索数据时使用 4 个 I/O 。如 下图 所示,其中的查询是一个等价查询,用于匹配HASH 列和确切的值。 Oracle 可以快速使用该值,基于 HASH 函数确定行的物理存储位置。
HASH索引可能是访问数据库中数据的最快方法,但它也有自身的缺点 。集群键上不同值的数目必须在创建HASH 集群之前就要知道。需要在创建 HASH 集群的时候指定这个值。低估了集群键的不同值的数字可能会造成集群的冲突 ( 两个集群的键值拥有相同的 HASH 值 ) 。这种冲突是非常消耗资源的。冲突会造成用来存储额外行的缓冲溢出,然后造成额外的 I/O 。如果不同 HASH 值的数目已经被低估,您就必须在重建这个集群之后改变这个值。
ALTER CLUSTER命令不能改变 HASH 键的数目。 HASH 集群还可能浪费空间 。如果无法确定需要多少空间来维护某个集群键上的所有行,就可能造成空间的浪费。如果 不能为集群的未来增长分配好附加的空间 ,HASH 集群可能就 不是最好的选择 。 如果应用程序经常在集群表上进行全表扫描 ,HASH 集群可能也 不是最好的选择 。由于需要为未来的增长分配好集群的剩余空间量,全表扫描可能非常消耗资源。
在实现HASH 集群之前一定要小心。您需要全面地观察应用程序,保证在实现这个选项之前已经了解关于表和数据的大量信息。 通常,HASH 对于一些包含有序值的静态数据非常有效。
技巧: HASH索引在有限制条件 ( 需要指定一个确定的值而不是一个值范围 ) 的情况下非常有用。
2.4 索引组织表
索引组织表会把表的存储结构改成B 树结构,以表的主键进行排序。这种特殊的表和其他类型的表一样,可以在表上执行所有的 DML 和 DDL 语句。 由于表的特殊结构,ROWID 并没有被关联到表的行上。
对于一些涉及精确匹配和范围搜索的语句,索引组织表提供了一种基于键的快速数据访问机制。 基于主键值的UPDATE 和 DELETE 语句的性能也同样得以提高, 这是因为行在物理上有序。由于键列的值在表和索引中都没有重复, 存储所需要的空间也随之减少。
如果不会频繁地根据主键列查询数据,则需要在索引组织表中的其他列上创建二级索引。不会频繁根据主键查询表的应用程序不会了解到使用索引组织表的全部优点。 对于总是通过对主键的精确匹配或范围扫描进行访问的表,就需要考虑使用索引组织表。
技巧: 可以在索引组织表上建立二级索引。
2.5 反转键索引
当载入一些有序数据时,索引肯定会碰到与I/O 相关的一些瓶颈。在数据载入期间,某部分索引和磁盘肯定会比其他部分使用频繁得多。为了解决这个问题,可以把索引表空间存放在能够把 文件物理分割在多个磁盘上的磁盘体系结构上 。
为了解决这个问题,Oracle 还提供了一种反转键索引的方法。如果数据以反转键索引存储,这些数据的值就会与原先存储的数值相反。这样,数据 1234 、 1235 和 1236 就被存储成 4321 、 5321 和 6321 。 结果就是索引会为每次新插入的行更新不同的索引块。
技巧: 如果您的磁盘容量有限,同时还要执行大量的有序载入,就可以使用反转键索引。
不可以将反转键索引与位图索引或索引组织表结合使用。 因为 不能对位图索引和索引组织表进行反转键处理。
2.6 基于函数的索引
可以在表中创建基于函数的索引。如果没有基于函数的索引,任何在列上执行了函数的查询都不能使用这个列的索引。例如,下面的查询就不能使用JOB 列上的索引,除非它是基于函数的索引:
select * from emp where UPPER(job) = 'MGR';
下面的查询使用JOB 列上的索引,但是它将不会返回 JOB 列具有 Mgr 或 mgr 值的行:
select * from emp where job = 'MGR';
可以创建这样的索引,允许索引访问支持基于函数的列或数据。可以对列表达式UPPER(job) 创建索引,而不是直接在 JOB 列上建立索引 ,如 :
create index EMP$UPPER_JOB on emp(UPPER(job));
尽管基于函数的索引非常有用,但在建立它们之前必须先考虑下面一些问题:
能限制在这个列上使用的函数吗?如果能,能限制所有在这个列上执行的所有函数吗
是否有足够应付额外索引的存储空间?
在每列上增加的索引数量会对针对该表执行的DML 语句的性能带来何种影响?
基于函数的索引非常有用,但在实现时必须小心。在表上创建的索引越多,INSERT 、 UPDATE 和 DELETE 语句的执行就会花费越多的时间。
注意: 对于优化器所使用的基于函数的索引来说, 必须把初始参数QUERY _REWRITE _ ENABLED 设定为 TRUE 。
示例:
select count(*) from sample where ratio(balance,limit) >.5;
Elapsed time: 20.1 minutes
create index ratio_idx1 on sample (ratio(balance, limit));
select count(*) from sample where ratio(balance,limit) >.5;
Elapsed time: 7 seconds!!!
2.7 分区索引
分区索引就是简单地把一个索引分成多个片断。通过把一个索引分成多个片断,可以访问更小的片断( 也更快 ) ,并且可以把这些片断分别存放在不同的磁盘驱动器上 ( 避免 I/O 问题 ) 。 B树和位图索引都可以被分区,而 HASH 索引不可以被分区 。可以有好几种分区方法: 表被分区而索引未被分区 ; 表未被分区而索引被分区 ; 表和索引都被分区 。不管采用哪种方法, 都必须使用基于成本的优化器 。分区能够提供更多可以提高性能和可维护性的可能性
有两种类型的分区索引: 本地分区索引 和 全局分区索引 。每个类型都有两个子类型,有前缀索引和无前缀索引。表各列上的索引可以有各种类型索引的组合。 如果使用了位图索引,就必须是本地索引 。把索引分区最主要的原因是可以减少所需读取的索引的大小,另外把分区放在不同的表空间中可以提高分区的可用性和可靠性。
在使用分区后的表和索引时,Oracle 还支持并行查询和并行 DML 。这样就可以同时执行多个进程,从而加快处理这条语句。
2.7. 1.本地分区索引 ( 通常使用的索引 )
可以使用与表相同的分区键和范围界限来对本地索引分区。每个本地索引的分区只包含了它所关联的表分区的键和ROWID 。本地索引可以是 B 树或位图索引。如果是 B 树索引,它可以是唯一或不唯一的索引。
这种类型的索引支持分区独立性,这就意味着对于单独的分区,可以进行增加、截取、删除、分割、脱机等处理,而不用同时删除或重建索引。 Oracle自动维护这些本地索引。 本地索引分区还可以被单独重建,而其他分区不会受到影响。
2.7.1.1 有前缀的索引
有前缀的索引包含了来自分区键的键,并把它们作为索引的前导。例如,让我们再次回顾participant 表。在创建该表后,使用 survey_id 和 survey_date 这两个列进行范围分区,然后在 survey_id 列上建立一个有前缀的本地索引,如 下图 所示。这个索引的所有分区都被等价划分,就是说索引的分区都使用表的相同范围界限来创建。
技巧: 本地的有前缀索引可以让Oracle 快速剔除一些不必要的分区。也就是说没有包含 WHERE 条件子句中任何值的分区将不会被访问,这样也提高了语句的性能。
2.7.1.2 无前缀的索引
无前缀的索引并没有把分区键的前导列作为索引的前导列。若使用有同样分区键(survey_id 和 survey_date) 的相同分区表,建立在 survey_date 列上的索引就是一个本地的无前缀索引,如 下图 所示。可以在表的任一列上创建本地无前缀索引,但索引的每个分区只包含表的相应分区的键值。
如果要把无前缀的索引设为唯一索引,这个索引就必须包含分区键的子集。在这个例子中,我们必须把包含survey 和 ( 或 )survey_id 的列进行组合 ( 只要 survey_id 不是索引的第一列,它就是一个有前缀的索引 ) 。
技巧: 对于一个唯一的无前缀索引,它必须包含分区键的子集。
2.7. 2. 全局分区索引
全局分区索引在一个索引分区中包含来自多个表分区的键。一个全局分区索引的分区键是分区表中不同的或指定一个范围的值。在创建全局分区索引时,必须定义分区键的范围和值。 全局索引只能是B 树索引 。 Oracle在默认情况下不会维护全局分区索引。如果一个分区被截取、增加、分割、删除等,就必须重建全局分区索引 ,除非在修改表时指定ALTER TABLE 命令的 UPDATE GLOBAL INDEXES 子句。
2.7.2.1 有前缀的索引
通常,全局有前缀索引在底层表中没有经过对等分区。没有什么因素能限制索引的对等分区,但Oracle 在生成查询计划或执行分区维护操作时,并不会充分利用对等分区。如果索引被对等分区,就必须把它创建为一个本地索引,这样 Oracle 可以维护这个索引,并使用它来删除不必要的分区,如 下图 所示。在该图的3 个索引分区中,每个分区都包含指向多个表分区中行的索引条目。
分区的、全局有前缀索引
技巧 : 如果一个全局索引将被对等分区,就必须把它创建为一个本地索引,这样Oracle 可以维护这个索引,并使用它来删除不必要的分区。
2.7.2.2 无前缀的索引
Oracle不支持无前缀的全局索引。
2.8 位图连接索引
位图连接索引是基于两个表的连接的位图索引,在数据仓库环境中使用这种索引改进连接维度表和事实表的查询的性能。创建位图连接索引时,标准方法是连接索引中常用的维度表和事实表。当用户在一次查询中结合查询事实表和维度表时,就不需要执行连接,因为在位图连接索引中已经有可用的连接结果。通过压缩位图连接索引中的ROWID 进一步改进性能,并且减少访问数据所需的 I/O 数量。
创建位图连接索引时,指定涉及的两个表。相应的语法应该遵循如下模式:
create bitmap index FACT_DIM_COL_IDX on FACT(DIM.Descr_Col) from FACT, DIM
where FACT.JoinCol = DIM.JoinCol;
位图连接的语法比较特别,其中包含FROM 子句和 WHERE 子句,并且引用两个单独的表。索引列通常是维度表中的描述列 —— 就是说,如果维度是 CUSTOMER ,并且它的主键是 CUSTOMER_ID ,则通常索引 Customer_Name 这样的列。如果事实表名为 SALES ,可以使用如下的命令创建索引:
create bitmap index SALES_CUST_NAME_IDX
on SALES(CUSTOMER.Customer_Name) from SALES, CUSTOMER
where SALES.Customer_ID=CUSTOMER.Customer_ID;
如果用户接下来使用指定Customer_Name 列值的 WHERE 子句查询 SALES 和 CUSTOMER 表,优化器就可以使用位图连接索引快速返回匹配连接条件和 Customer_Name 条件的行。
位图连接索引的使用一般会受到限制 :
1) 只可以索引维度表中的列。
2) 用于连接的列必须是维度表中的主键或唯一约束;如果是复合主键,则必须使用连接中的每一列。
3) 不可以对索引组织表创建位图连接索引,并且适用于常规位图索引的限制也适用于位图连接索引。
存储了row在数据文件中的具体位置:64位 编码的数据,A-Z, a-z, 0-9, +, 和 /,
row在数据块中的存储方式
SELECT ROWID, last_name FROM hr.employees WHERE department_id = 20;
比 如:OOOOOOFFFBBBBBBRRR
OOOOOO:data object number, 对应dba_objects.data_object_id
FFF:file#, 对应v$datafile.file#
BBBBBB:block#
RRR:row#
Dbms_rowid包
SELECT dbms_rowid.rowid_block_number('AAAGFqAABAAAIWEAAA') from dual;
具 体到特定的物理文件
二、 索引的概念
1、 类似书的目录结构
2、 Oracle 的“索引”对象,与表关联的可选对象,提高SQL查询语句的速度
3、 索引直接指向包含所查询值的行的位置,减少磁盘I/O
4、 与所索引的表是相互独立的物理结构
5、 Oracle 自动使用并维护索引,插入、删除、更新表后,自动更新索引
6、 语法:CREATE INDEX index ON table (column[, column]...);
7、 B-tree结构(非bitmap):
[一]了解索引的工作原理:
表:emp
目标:查询Frank的工资salary
建立索 引:create index emp_name_idx on emp(name);
[试验]测试索引的作用:
1. 运行/rdbms/admin/utlxplan 脚本
2. 建立测试表
create table t as select * from dba_objects;
insert into t select * from t;
create table indextable
as select rownum id,owner,object_name,subobject_name,
object_id,data_object_id,object_type,created
from t;
3. set autotrace trace explain
4. set timing on
5. 分析表,可以得到cost
6. 查询 object_name=’DBA_INDEXES’
7. 在object_name列上建立索引
8. 再查询
[思考]索引的代价:
插入,更新
三、 唯一索引
1、 何时创建:当某列任意两行的值都不相同
2、 当建立Primary Key(主键)或者Unique constraint(唯一约束)时,唯一索引将被自动建立
3、 语法:CREATE UNIQUE INDEX index ON table (column);
4、 演示
四、 组合索引
1、 何时创建:当两个或多个列经常一起出现在where条件中时,则在这些列上同时创建组合索引
2、 组合索引中列的顺序是任意的,也无需相邻。但是建议将最频繁访问的列放在列表的最前面
3、 演示(组合列,单独列)
五、 位图索引
1、 何时创建:
列中有非常多的重复的值时候。例如某列保存了 “性别”信息。
Where 条件中包含了很多OR操作符。
较少的update操作,因为要相应的跟新所有的bitmap
2、 结构:位图索引使用位图作为键值,对于表中的每一数据行位图包含了TRUE(1)、FALSE(0)、或NULL值。
3、 优点:位图以一种压缩格式存放,因此占用的磁盘空间比标准索引要小得多
4、 语法:CREATE BITMAP INDEX index ON table (column[, column]...);
5、 掩饰:
create table bitmaptable as select * from indextable where owner in('SYS','PUBLIC');
分析,查找,建立索引,查找
六、 基于函数的索引
1、 何时创建:在WHERE条件语句中包含函数或者表达式时
2、 函数包括:算数表达式、PL/SQL函数、程序包函数、SQL函数、用户自定义函数。
3、 语法:CREATE INDEX index ON table (FUNCTION(column));
4、 演示
必须要分析表,并且 query_rewrite_enabled=TRUE
或者使用提示/*+ INDEX(ic_index)*/
七、 反向键索引
目的:比如索引值是一个自动增长的列:
多个用户对集中在少数块上的索引行进行修改,容易引起资源的争用,比如对数据块的等待。此时建立反向索 引。
性能问题:
语法:
重建为标准索引:反之不行
八、 键压缩索引
比如表landscp的数据如下:
site feature job
Britten Park, Rose Bed 1, Prune
Britten Park, Rose Bed 1, Mulch
Britten Park, Rose Bed 1,Spray
Britten Park, Shrub Bed 1, Mulch
Britten Park, Shrub Bed 1, Weed
Britten Park, Shrub Bed 1, Hoe
……
查询时,以上3列均在where条件中同时出现,所以建立基于以上3列的组合索引。但是发现重复值很多,所以考虑压缩特性。
Create index zip_idx
on landscp(site, feature, job)
compress 2;
将索引项分成前缀(prefix)和后缀(postfix)两部分。前两项被放置到前缀部分。
Prefix 0: Britten Park, Rose Bed 1
Prefix 1: Britten Park, Shrub Bed 1
实际所以的结构为:
0 Prune
0 Mulch
0 Spray
1 Mulch
1 Weed
1 Hoe
特点:组合索引的前缀部分具 有非选择性时,考虑使用压缩。减少I/O,增加性能。
九、 索引组织表(IOT)
将表中的数据按照索 引的结构存储在索引中,提高查询速度。
牺牲插入更新的性能,换取查询 性能。通常用于数据仓库,提供大量的查询,极少的插入修改工作。
必须指定主键。插入数据时,会根据主键列进行B树索引排序,写入磁盘。
十、 分区索引
簇:
A cluster is a group of tables that share the same data blocks because they share common columns and are often used together.
-----------------------------------------------------------------
一. 索引介绍
1.1 索引的创建 语法 :
CREATE UNIUQE | BITMAP INDEX <schema>.<index_name>
ON <schema>.<table_name>
(<column_name> | <expression> ASC | DESC,
<column_name> | <expression> ASC | DESC,...)
TABLESPACE <tablespace_name>
STORAGE <storage_settings>
LOGGING | NOLOGGING
COMPUTE STATISTICS
NOCOMPRESS | COMPRESS<nn>
NOSORT | REVERSE
PARTITION | GLOBAL PARTITION<partition_setting>
相关说明
1) UNIQUE | BITMAP :指定UNIQUE 为唯一值索引, BITMAP 为位图索引, 省略为B-Tree 索引。
2) <column_name> | <expression> ASC | DESC :可以对多列进行联合索引,当为expression 时即 “ 基于函数的索引 ”
3) TABLESPACE :指定存放索引的表空间 (索引和原表不在一个表空间时效率更高 )
4) STORAGE :可进一步设置表空间的存储参数
5) LOGGING | NOLOGGING :是否对索引产生重做日志( 对大表尽量使用 NOLOGGING 来减少占用空间并提高效率 )
6) COMPUTE STATISTICS :创建新索引时收集统计信息
7) NOCOMPRESS | COMPRESS<nn> :是否使用“ 键压缩 ”( 使用键压缩可以删除一个键列中出现的重复值 )
8) NOSORT | REVERSE :NOSORT 表示与表中相同的顺序创建索引, REVERSE 表示相反顺序存储索引值
9) PARTITION | NOPARTITION :可以在 分区表 和未分区表上对创建的索引进行分区
1. 2 索引特点:
第一 ,通过创建唯一性索引,可以保证数据库表中每一行数据的唯一性。
第二 ,可以大大加快数据的检索速度,这也是创建索引的最主要的原因。
第三 ,可以加速表和表之间的连接,特别是在实现数据的参考完整性方面特别有意义。
第四 ,在使用分组和排序子句进行数据检索时,同样可以显著减少查询中分组和排序的时间。
第五 ,通过使用索引,可以在查询的过程中,使用优化隐藏器,提高系统的性能。
1. 3 索引不足:
第一 ,创建索引和维护索引要耗费时间,这种时间随着数据量的增加而增加。
第二 ,索引需要占物理空间,除了数据表占数据空间之外,每一个索引还要占一定的物理空间,如果要建立聚簇索引,那么需要的空间就会更大。
第三 ,当对表中的数据进行增加、删除和修改的时候,索引也要动态的维护,这样就降低了数据的维护速度。
1. 4 应该建索引列的特点:
1) 在经常需要搜索的列上,可以加快搜索的速度;
2) 在作为主键的列上,强制该列的唯一性和组织表中数据的排列结构;
3) 在经常用在连接的列上,这些列主要是一些外键,可以加快连接的速度;
4) 在经常需要根据范围进行搜索的列上创建索引,因为索引已经排序,其指定的范围是连续的;
5) 在经常需要排序的列上创建索引,因为索引已经排序,这样查询可以利用索引的排序,加快排序查询时间;
6) 在经常使用在WHERE 子句中的列上面创建索引,加快条件的判断速度。
1. 5 不应该建索引列的特点:
第一 ,对于那些在查询中很少使用或者参考的列不应该创建索引。这是因为,既然这些列很少使用到,因此有索引或者无索引,并不能提高查询速度。相反,由于增加了索引,反而降低了系统的维护速度和增大了空间需求。
第二 ,对于那些只有很少数据值的列也不应该增加索引。这是因为,由于这些列的取值很少,例如人事表的性别列,在查询的结果中,结果集的数据行占了表中数据行的很大比例,即需要在表中搜索的数据行的比例很大。增加索引,并不能明显加快检索速度。
第三 ,对于那些定义为 blob 数据类型的列不应该增加索引。这是因为,这些列的数据量要么相当大,要么取值很少。
第四 ,当修改性能远远大于检索性能时,不应该创建索引。这是因为,修改性能和检索性能是互相矛盾的。当增加索引时,会提高检索性能,但是会降低修改性能。当减少索引时,会提高修改性能,降低检索性能。因此,当修改性能远远大于检索性能时,不应该创建索引。
1.6 限制索引
限制索引是一些没有经验的开发人员经常犯的错误之一。在SQL 中有很多陷阱会使一些索引无法使用。下面讨论一些常见的问题:
1.6.1 使用不等于操作符(<> 、 != )
下面的查询即使在cust_rating 列有一个索引,查询语句仍然执行一次全表扫描。
select cust_Id,cust_name from customers where cust_rating <> 'aa';
把上面的语句改成如下的查询语句,这样,在采用基于规则的优化器而不是基于代价的优化器(更智能)时,将会使用索引。
select cust_Id,cust_name from customers where cust_rating < 'aa' or cust_rating > 'aa';
特别注意:通过把不等于操作符改成 OR 条件,就可以使用索引,以避免全表扫描。
1.6. 2 使用 IS NULL 或 IS NOT NULL
使用 IS NULL 或 IS NOT NULL 同样会限制索引的使用 。因为 NULL 值并没有被定义。在 SQL 语句中使用 NULL 会有很多的麻烦。因此建议开发人员在建表时,把需要索引的列设成 NOT NULL 。如果被索引的列在某些行中存在 NULL 值,就不会使用这个索引(除非索引是一个位图索引,关于位图索引在稍后在详细讨论)。
1.6 .3 使用函数
如果不使用基于函数的索引,那么在SQL 语句的 WHERE 子句中对存在索引的列使用函数时,会使优化器忽略掉这些索引。
下面的查询不会使用索引(只要它不是基于函数的索引)
select empno,ename,deptno from emp where trunc(hiredate)='01-MAY-81';
把上面的语句改成下面的语句,这样就可以通过索引进行查找。
select empno,ename,deptno from emp where hiredate<(to_date('01-MAY-81')+0.9999);
1.6 .4 比较不匹配的数据类型
也是比较难于发现的性能问题之一。 注意下面查询的例子,account_number 是一个 VARCHAR2 类型 , 在 account_number 字段上有索引。
下面的语句将执行全表扫描 :
select bank_name,address,city,state,zip from banks where account_number = 990354;
Oracle可以自动把 where 子句变成 to_number(account_number)=990354 ,这样就限制了索引 的使用 , 改成下面的查询就可以使用索引:
select bank_name,address,city,state,zip from banks where account_number ='990354';
特别注意: 不匹配的数据类型之间比较会让Oracle 自动限制索引的使用 , 即便对这个查询执行 Explain Plan 也不能让您明白为什么做了一次 “ 全表扫描 ” 。
1. 7 查询 索引
查询DBA_INDEXES 视图可得到表中所有索引的列表,注意只能通过 USER_INDEXES 的方法来检索模式 (schema) 的索引。访问 USER_IND_COLUMNS 视图可得到一个给定表中被索引的特定列。
1. 8 组合索引
当某个索引包含有多个已索引的列时,称这个索引为 组合(concatented )索引 。在 Oracle9i 引入跳跃式扫描的索引访问方法之前,查询只能在有限条件下使用该索引。比如:表 emp 有一个组合索引键,该索引包含了 empno 、 ename 和 deptno 。在 Oracle9i 之前除非在 where 之句中对第一列( empno )指定一个值,否则就不能使用这个索引键进行一次范围扫描。
特别注意:在Oracle9i 之前,只有在使用到索引的前导索引时才可以使用组合索引!
1. 9 ORACLE ROWID
通过每个行的ROWID ,索引 Oracle 提供了访问单行数据的能力。 ROWID 其实就是直接指向单独行的线路图。如果想检查重复值或是其他对 ROWID 本身的引用,可以在任何表中使用和指定 rowid 列。
1.10 选择性
使用USER_INDEXES 视图,该视图中显示了一个 distinct_keys 列。比较一下唯一键的数量和表中的行数,就可以判断索引的选择性。选择性越高,索引返回的数据就越少。
1.11 群集因子(Clustering Factor)
Clustering Factor位于 USER_INDEXES 视图中。该列反映了数据相对于已 建 索引的列是否显得有序。如果Clustering Factor 列的值接近于索引中的树叶块 (leaf block) 的数目,表中的数据就越有序。如果它的值接近于表中的行数,则表中的数据就不是很有序。
1.12 二元高度(Binary height)
索引的二元高度对把ROWID 返回给用户进程时所要求的 I/O 量起到关键作用。在对一个索引进行分析后,可以通过查询 DBA_INDEXES 的 B- level 列查看它的二元高度 。二元高度主要随着表的大小以及被索引的列中值的范围的狭窄程度而变化。索引上如果有大量被删除的行,它的二元高度也会增加。更新索引列也类似于删除操作,因为它增加了已删除键的数目。 重建索引可能会降低二元高度 。
1.13 快速全局扫描
从 Oracle7.3后就可以使用快速全局扫描 (Fast Full Scan) 这个选项。这个选项允许 Oracle 执行一个全局索引扫描操作。快速全局扫描读取 B- 树索引上所有树叶块。初始化文件中的 DB_FILE_MULTIBLOCK_READ_COUNT 参数可以控制同时被读取的块的数目。
1.14 跳跃式扫描
从Oracle9i 开始,索引跳跃式扫描特性可以允许优化器使用组合索引,即便索引的前导列没有出现在 WHERE 子句中。索引跳跃式扫描比全索引扫描 要快的多。
下面的 比较他们的区别 :
SQL> set timing on
SQL> create index TT_index on TT(teamid,areacode);
索引已创建。
已用时间: 00: 02: 03.93
SQL> select count(areacode) from tt;
COUNT(AREACODE)
---------------
7230369
已用时间: 00: 00: 08.31
SQL> select /*+ index(tt TT_index )*/ count(areacode) from tt;
COUNT(AREACODE)
---------------
7230369
已用时间: 00: 00: 07.37
1.15 索引的类型
•B-树索引
•位图索引
•HASH索引
•索引编排表
•反转键索引
•基于函数的索引
•分区索引
•本地和全局索引
二. 索引分类
Oracle提供了大量索引选项。知道在给定条件下使用哪个选项对于一个应用程序的性能来说非常重要。一个错误的选择可能会引发死锁,并导致数据库性能急剧下降或进程终止。而如果做出正确的选择,则可以合理使用资源,使那些已经运行了几个小时甚至几天的进程在几分钟得以完成,这样会使您立刻成为一位英雄。 下面 就将简单的讨论每个索引选项。
下面讨论的索引类型:
B树索引 (默认类型 )
位图索引
HASH索引
索引组织表索引
反转键(reverse key) 索引
基于函数的索引
分区索引( 本地和全局索引 )
位图连接索引
2.1 B树索引 (默认类型 )
B树索引在 Oracle 中是一个通用索引。在创建索引时它就是默认的索引类型 。 B 树索引可以是一个列的 ( 简单 ) 索引,也可以是组合 / 复合 ( 多个列 ) 的索引。 B 树索引最多可以包括 32 列 。
在 下图 的例子中,B 树索引位于雇员表的 last_name 列上。这个索引的二元高度为 3 ;接下来, Oracle 会穿过两个树枝块 (branch block) ,到达包含有 ROWID 的树叶块。在每个树枝块中,树枝行包含链中下一个块的 ID 号。
树叶块包含 了 索引值 、 ROWID ,以及指向前一个和后一个树叶块的 指针 。Oracle 可以从两个方向遍历这个二叉树。 B 树索引保存了在索引列上有值的每个数据行的 ROWID 值。 Oracle不会对索引列上包含 NULL 值的行进行索引 。如果索引是多个列的组合索引,而其中列上包含NULL 值,这一行就会处于包含 NULL 值的索引列中,且将被处理为空 ( 视为 NULL) 。
技巧 : 索引列的值都存储在索引中。因此,可以建立一个组合 ( 复合 ) 索引,这些索引可以直接满足查询,而不用访问表。这就不用从表中检索数据,从而减少了 I/O 量。
B-tree 特点 :
1.适合与大量的增、删、改(OLTP )
2.不能用包含OR 操作符的查询;
3.适合高基数的列(唯一值多)
4.典型的树状结构;
5.每个结点都是数据块;
6.大多都是物理上一层、两层或三层不定,逻辑上三层;
7.叶子块数据是排序的,从左向右递增;
8.在分支块和根块中放的是索引的范围;
2.2 位图索引
位图索引非常适合于决策支持系统(Decision Support System , DSS) 和数据仓库 ,它们不应该用于通过事务处理应用程序访问的表。它们可以使用较少到中等基数( 不同值的数量 ) 的列访问非常大的表。尽管位图索引最多可达 30 个列,但通常它们都只用于少量的列。
例如,您的表可能包含一个称为Sex 的列,它有两个可能值:男和女。这个基数只为 2 ,如果用户频繁地根据 Sex 列的值查询该表,这就是位图索引的基列。当一个表内包含了多个位图索引时,您可以体会到位图索引的真正威力。如果有多个可用的位图索引, Oracle 就可以合并从每个位图索引得到的结果集,快速删除不必要的数据。
Bitmap t 特点 :
1.适合与决策支持系统;
2.做UPDATE 代价非常高;
3.非常适合OR 操作符的查询;
4.基数比较少的时候才能建位图索引;
技巧: 对于有较低基数的列需要使用位图索引。性别列就是这样一个例子,它有两个可能值:男或女( 基数仅为 2) 。 位图对于低基数( 少量的不同值 ) 列来说非常快 ,这是因为索引的尺寸相对于B 树索引来说小了很多。因为这些索引是低基数的 B 树索引,所以非常小,因此您可以经常检索表中超过半数的行,并且仍使用位图索引。
当大多数条目不会向位图添加新的值时,位图索引在批处理( 单用户 ) 操作中加载表 ( 插入操作 ) 方面通常要比 B 树做得好。当多个会话同时向表中插入行时不应该使用位图索引,在大多数事务处理应用程序中都会发生这种情况。
示例
下面来看一个示例表PARTICIPANT ,该表包含了来自个人的调查数据。列 Age_Code 、 Income_Level 、 Education_Level 和 Marital_Status 都包括了各自的位图索引。 下图 显示了每个直方图中的数据平衡情况,以及对访问每个位图索引的查询的执行路径。图中的执行路径显示了有多少个位图索引被合并,可以看出性能得到了显著的提高。
如 上图 图所示,优化器依次使用4 个单独的位图索引,这些索引的列在 WHERE 子句中被引用。每个位图记录指针 ( 例如 0 或 1) ,用于指示表中的哪些行包含位图中的已知值。有了这些信息后, Oracle 就执行 BITMAP AND 操作以查找将从所有 4 个位图中返回哪些行。该值然后被转换为 ROWID 值,并且查询继续完成剩余的处理工作。 注意,所有4 个列都有非常低的基数,使用索引可以非常快速地返回匹配的行。
技巧: 在一个查询中合并多个位图索引后,可以使性能显著提高。位图索引使用固定长度的数据类型要比可变长度的数据类型好。较大尺寸的块也会提高对位图索引的存储和读取性能。
下面的查询可显示索引类型。
SQL> select index_name, index_type from user_indexes;
INDEX_NAME INDEX_TYPE
------------------------------ ----------------------
TT_INDEX NORMAL
IX_CUSTADDR_TP NORMAL
B树索引 作为NORMAL 列出;而 位图索引 的类型值为 BITMAP 。
技巧: 如果要查询位图索引列表,可以在USER _INDEXES 视图中查询 index_type 列。
建议不要在一些联机事务处理(OLTP) 应用程序中使用位图索引 。B 树索引的索引值中包含 ROWID ,这样 Oracle 就可以在行级别上锁定索引。位图索引存储为压缩的索引值,其中包含了一定范围的 ROWID ,因此 Oracle 必须针对一个给定值锁定所有范围内的 ROWID 。这种锁定类型可能在某些 DML 语句中造成死锁。 SELECT 语句不会受到这种锁定问题的影响。
位图索引 的使用 限制 :
1.基于规则的优化器不会考虑位图索引。
2.当执行ALTER TABLE 语句并修改包含有位图索引的列时,会使位图索引失效。
3.位图索引不包含任何列数据,并且不能用于任何类型的完整性检查。
4.位图索引不能被声明为唯一索引。
5.位图索引的最大长度为30 。
技巧: 不要在繁重的OLTP 环境中使用位图索引
2.3 HASH索引
使用HASH 索引必须要使用 HASH 集群 。建立一个集群或HASH 集群的同时,也就定义了一个集群键。这个键告诉 Oracle 如何在集群上存储表。在存储数据时,所有与这个集群键相关的行都被存储在一个数据库块上。如果数据都存储在同一个数据库块上,并且将 HASH 索引作为 WHERE 子句中的确切匹配, Oracle 就可以通过执行一个 HASH 函数和 I/O 来访问数据 —— 而通过使用一个二元高度为 4 的 B 树索引来访问数据,则需要在检索数据时使用 4 个 I/O 。如 下图 所示,其中的查询是一个等价查询,用于匹配HASH 列和确切的值。 Oracle 可以快速使用该值,基于 HASH 函数确定行的物理存储位置。
HASH索引可能是访问数据库中数据的最快方法,但它也有自身的缺点 。集群键上不同值的数目必须在创建HASH 集群之前就要知道。需要在创建 HASH 集群的时候指定这个值。低估了集群键的不同值的数字可能会造成集群的冲突 ( 两个集群的键值拥有相同的 HASH 值 ) 。这种冲突是非常消耗资源的。冲突会造成用来存储额外行的缓冲溢出,然后造成额外的 I/O 。如果不同 HASH 值的数目已经被低估,您就必须在重建这个集群之后改变这个值。
ALTER CLUSTER命令不能改变 HASH 键的数目。 HASH 集群还可能浪费空间 。如果无法确定需要多少空间来维护某个集群键上的所有行,就可能造成空间的浪费。如果 不能为集群的未来增长分配好附加的空间 ,HASH 集群可能就 不是最好的选择 。 如果应用程序经常在集群表上进行全表扫描 ,HASH 集群可能也 不是最好的选择 。由于需要为未来的增长分配好集群的剩余空间量,全表扫描可能非常消耗资源。
在实现HASH 集群之前一定要小心。您需要全面地观察应用程序,保证在实现这个选项之前已经了解关于表和数据的大量信息。 通常,HASH 对于一些包含有序值的静态数据非常有效。
技巧: HASH索引在有限制条件 ( 需要指定一个确定的值而不是一个值范围 ) 的情况下非常有用。
2.4 索引组织表
索引组织表会把表的存储结构改成B 树结构,以表的主键进行排序。这种特殊的表和其他类型的表一样,可以在表上执行所有的 DML 和 DDL 语句。 由于表的特殊结构,ROWID 并没有被关联到表的行上。
对于一些涉及精确匹配和范围搜索的语句,索引组织表提供了一种基于键的快速数据访问机制。 基于主键值的UPDATE 和 DELETE 语句的性能也同样得以提高, 这是因为行在物理上有序。由于键列的值在表和索引中都没有重复, 存储所需要的空间也随之减少。
如果不会频繁地根据主键列查询数据,则需要在索引组织表中的其他列上创建二级索引。不会频繁根据主键查询表的应用程序不会了解到使用索引组织表的全部优点。 对于总是通过对主键的精确匹配或范围扫描进行访问的表,就需要考虑使用索引组织表。
技巧: 可以在索引组织表上建立二级索引。
2.5 反转键索引
当载入一些有序数据时,索引肯定会碰到与I/O 相关的一些瓶颈。在数据载入期间,某部分索引和磁盘肯定会比其他部分使用频繁得多。为了解决这个问题,可以把索引表空间存放在能够把 文件物理分割在多个磁盘上的磁盘体系结构上 。
为了解决这个问题,Oracle 还提供了一种反转键索引的方法。如果数据以反转键索引存储,这些数据的值就会与原先存储的数值相反。这样,数据 1234 、 1235 和 1236 就被存储成 4321 、 5321 和 6321 。 结果就是索引会为每次新插入的行更新不同的索引块。
技巧: 如果您的磁盘容量有限,同时还要执行大量的有序载入,就可以使用反转键索引。
不可以将反转键索引与位图索引或索引组织表结合使用。 因为 不能对位图索引和索引组织表进行反转键处理。
2.6 基于函数的索引
可以在表中创建基于函数的索引。如果没有基于函数的索引,任何在列上执行了函数的查询都不能使用这个列的索引。例如,下面的查询就不能使用JOB 列上的索引,除非它是基于函数的索引:
select * from emp where UPPER(job) = 'MGR';
下面的查询使用JOB 列上的索引,但是它将不会返回 JOB 列具有 Mgr 或 mgr 值的行:
select * from emp where job = 'MGR';
可以创建这样的索引,允许索引访问支持基于函数的列或数据。可以对列表达式UPPER(job) 创建索引,而不是直接在 JOB 列上建立索引 ,如 :
create index EMP$UPPER_JOB on emp(UPPER(job));
尽管基于函数的索引非常有用,但在建立它们之前必须先考虑下面一些问题:
能限制在这个列上使用的函数吗?如果能,能限制所有在这个列上执行的所有函数吗
是否有足够应付额外索引的存储空间?
在每列上增加的索引数量会对针对该表执行的DML 语句的性能带来何种影响?
基于函数的索引非常有用,但在实现时必须小心。在表上创建的索引越多,INSERT 、 UPDATE 和 DELETE 语句的执行就会花费越多的时间。
注意: 对于优化器所使用的基于函数的索引来说, 必须把初始参数QUERY _REWRITE _ ENABLED 设定为 TRUE 。
示例:
select count(*) from sample where ratio(balance,limit) >.5;
Elapsed time: 20.1 minutes
create index ratio_idx1 on sample (ratio(balance, limit));
select count(*) from sample where ratio(balance,limit) >.5;
Elapsed time: 7 seconds!!!
2.7 分区索引
分区索引就是简单地把一个索引分成多个片断。通过把一个索引分成多个片断,可以访问更小的片断( 也更快 ) ,并且可以把这些片断分别存放在不同的磁盘驱动器上 ( 避免 I/O 问题 ) 。 B树和位图索引都可以被分区,而 HASH 索引不可以被分区 。可以有好几种分区方法: 表被分区而索引未被分区 ; 表未被分区而索引被分区 ; 表和索引都被分区 。不管采用哪种方法, 都必须使用基于成本的优化器 。分区能够提供更多可以提高性能和可维护性的可能性
有两种类型的分区索引: 本地分区索引 和 全局分区索引 。每个类型都有两个子类型,有前缀索引和无前缀索引。表各列上的索引可以有各种类型索引的组合。 如果使用了位图索引,就必须是本地索引 。把索引分区最主要的原因是可以减少所需读取的索引的大小,另外把分区放在不同的表空间中可以提高分区的可用性和可靠性。
在使用分区后的表和索引时,Oracle 还支持并行查询和并行 DML 。这样就可以同时执行多个进程,从而加快处理这条语句。
2.7. 1.本地分区索引 ( 通常使用的索引 )
可以使用与表相同的分区键和范围界限来对本地索引分区。每个本地索引的分区只包含了它所关联的表分区的键和ROWID 。本地索引可以是 B 树或位图索引。如果是 B 树索引,它可以是唯一或不唯一的索引。
这种类型的索引支持分区独立性,这就意味着对于单独的分区,可以进行增加、截取、删除、分割、脱机等处理,而不用同时删除或重建索引。 Oracle自动维护这些本地索引。 本地索引分区还可以被单独重建,而其他分区不会受到影响。
2.7.1.1 有前缀的索引
有前缀的索引包含了来自分区键的键,并把它们作为索引的前导。例如,让我们再次回顾participant 表。在创建该表后,使用 survey_id 和 survey_date 这两个列进行范围分区,然后在 survey_id 列上建立一个有前缀的本地索引,如 下图 所示。这个索引的所有分区都被等价划分,就是说索引的分区都使用表的相同范围界限来创建。
技巧: 本地的有前缀索引可以让Oracle 快速剔除一些不必要的分区。也就是说没有包含 WHERE 条件子句中任何值的分区将不会被访问,这样也提高了语句的性能。
2.7.1.2 无前缀的索引
无前缀的索引并没有把分区键的前导列作为索引的前导列。若使用有同样分区键(survey_id 和 survey_date) 的相同分区表,建立在 survey_date 列上的索引就是一个本地的无前缀索引,如 下图 所示。可以在表的任一列上创建本地无前缀索引,但索引的每个分区只包含表的相应分区的键值。
如果要把无前缀的索引设为唯一索引,这个索引就必须包含分区键的子集。在这个例子中,我们必须把包含survey 和 ( 或 )survey_id 的列进行组合 ( 只要 survey_id 不是索引的第一列,它就是一个有前缀的索引 ) 。
技巧: 对于一个唯一的无前缀索引,它必须包含分区键的子集。
2.7. 2. 全局分区索引
全局分区索引在一个索引分区中包含来自多个表分区的键。一个全局分区索引的分区键是分区表中不同的或指定一个范围的值。在创建全局分区索引时,必须定义分区键的范围和值。 全局索引只能是B 树索引 。 Oracle在默认情况下不会维护全局分区索引。如果一个分区被截取、增加、分割、删除等,就必须重建全局分区索引 ,除非在修改表时指定ALTER TABLE 命令的 UPDATE GLOBAL INDEXES 子句。
2.7.2.1 有前缀的索引
通常,全局有前缀索引在底层表中没有经过对等分区。没有什么因素能限制索引的对等分区,但Oracle 在生成查询计划或执行分区维护操作时,并不会充分利用对等分区。如果索引被对等分区,就必须把它创建为一个本地索引,这样 Oracle 可以维护这个索引,并使用它来删除不必要的分区,如 下图 所示。在该图的3 个索引分区中,每个分区都包含指向多个表分区中行的索引条目。
分区的、全局有前缀索引
技巧 : 如果一个全局索引将被对等分区,就必须把它创建为一个本地索引,这样Oracle 可以维护这个索引,并使用它来删除不必要的分区。
2.7.2.2 无前缀的索引
Oracle不支持无前缀的全局索引。
2.8 位图连接索引
位图连接索引是基于两个表的连接的位图索引,在数据仓库环境中使用这种索引改进连接维度表和事实表的查询的性能。创建位图连接索引时,标准方法是连接索引中常用的维度表和事实表。当用户在一次查询中结合查询事实表和维度表时,就不需要执行连接,因为在位图连接索引中已经有可用的连接结果。通过压缩位图连接索引中的ROWID 进一步改进性能,并且减少访问数据所需的 I/O 数量。
创建位图连接索引时,指定涉及的两个表。相应的语法应该遵循如下模式:
create bitmap index FACT_DIM_COL_IDX on FACT(DIM.Descr_Col) from FACT, DIM
where FACT.JoinCol = DIM.JoinCol;
位图连接的语法比较特别,其中包含FROM 子句和 WHERE 子句,并且引用两个单独的表。索引列通常是维度表中的描述列 —— 就是说,如果维度是 CUSTOMER ,并且它的主键是 CUSTOMER_ID ,则通常索引 Customer_Name 这样的列。如果事实表名为 SALES ,可以使用如下的命令创建索引:
create bitmap index SALES_CUST_NAME_IDX
on SALES(CUSTOMER.Customer_Name) from SALES, CUSTOMER
where SALES.Customer_ID=CUSTOMER.Customer_ID;
如果用户接下来使用指定Customer_Name 列值的 WHERE 子句查询 SALES 和 CUSTOMER 表,优化器就可以使用位图连接索引快速返回匹配连接条件和 Customer_Name 条件的行。
位图连接索引的使用一般会受到限制 :
1) 只可以索引维度表中的列。
2) 用于连接的列必须是维度表中的主键或唯一约束;如果是复合主键,则必须使用连接中的每一列。
3) 不可以对索引组织表创建位图连接索引,并且适用于常规位图索引的限制也适用于位图连接索引。
发表评论
-
oracle 查看执行计划的方式
2016-12-20 18:16 387一、通过PL/SQL Dev工具 1、直接File- ... -
pl/sql 乱码解决
2016-08-25 16:25 331select userenv('language') from ... -
使用MySQL Proxy解决MySQL主从同步延迟
2016-08-15 16:26 538使用MySQL Proxy解决MySQL主从同步延迟 ... -
分库分表
2016-07-03 12:30 537第1章 引言 随着互联网 ... -
select for update
2016-03-30 17:45 630xjr80C7HA3olbVr3y6H3t5--AcosrkB ... -
数据库超时
2016-03-07 10:37 478 -
oracle merge into
2016-03-04 16:16 424/*Merge into 详细介绍 MERGE语句是Oracl ... -
oracle 分区表
2016-03-02 14:59 430(1) 表空间及分区表的 ... -
一些注意的sql写法
2016-01-20 14:07 763Dashboard > 流程空间 > home ... -
oracle 组合索引使用
2016-01-14 20:33 893在Oracle中可以创建组合索引,即同时包含两个或两个以上列的 ... -
oracle 查看sql执行计划
2016-01-14 14:06 392如果要分析某条SQL的性能问题,通常我们要先看SQL的执行计划 ... -
oracle sql调优 执行计划固化 排序等 SQL Plan Baseline
2015-11-14 16:13 14251.对查询进行优化,应 ... -
oracle 字段类型 收录
2015-11-02 19:52 773字段类型 中文说明 限制条件 其它说明 CHAR 固定长度字符 ... -
oracle trunc 函数
2015-08-25 17:57 570Oracle trunc()函数的用法 --Oracle t ... -
oracle 分析函数
2015-08-03 12:49 611oracle分析函数--SQL*PLUS环 ... -
跨数据库事务研究
2015-05-12 11:16 871两种方案: 1、分布式 ... -
Oracle的悲观锁和乐观锁
2015-04-22 13:27 456为了得到最大的性能, ... -
MySQL数据库MyISAM和InnoDB存储引擎的比较
2015-04-21 13:49 492MySQL有多种存储引擎,MyISAM和InnoDB是其中常用 ... -
nosql学习
2015-04-20 09:56 5601、NoSQL数据库概念 NoSQL ... -
sql distinctt group by 分析
2015-04-14 15:28 567在表中,可能会包含重复值。这并不成问题,不过,有时您也许希望仅 ...
相关推荐
本文将深入探讨Oracle索引的原理、创建方法,并结合SQL优化策略,帮助你提升数据库查询速度,降低资源消耗。 首先,我们要理解索引的基本概念。在数据库中,索引类似于书籍的目录,它为数据提供快速访问的途径。...
Oracle 索引是数据库管理系统中提升数据查询速度的关键组件,尤其在大型企业级应用中,选择合适的索引类型对于数据库性能至关重要。本篇文章将深入探讨Oracle中的B*Tree索引、反向索引、降序索引、位图索引和函数...
总的来说,Oracle索引机制的深入理解对于数据库性能调优、查询优化和系统设计都具有重要意义。正确使用索引可以显著提高查询速度,降低响应时间,提升用户体验,但同时也需要平衡索引对写操作的影响,以确保系统的...
### Oracle索引类型详解 #### 一、B\*Tree索引:数据检索的基石 在Oracle数据库中,B\*Tree索引是最常见的索引结构,也是默认创建的索引类型。它基于二叉树原理,由分支块(branch block)和叶块(leaf block)构成,...
Oracle索引被限制的一些情况 Oracle索引是关系数据库管理系统中用于提高查询效率的一种机制,但是索引的使用也存在一些限制。本文将详细介绍一些常见的限制情况,帮助开发人员更好地使用索引,提高查询效率。 限制...
### Oracle索引优化相关知识点详解 #### 一、基本索引概念 在Oracle数据库中,索引是提高数据检索速度的重要工具。通过查询`DBA_INDEXES`视图,可以获取到当前数据库中所有表的所有索引信息。需要注意的是,如果...
Oracle 索引是数据库管理系统中提升数据查询速度的关键技术。本文主要介绍Oracle数据库中不同类型的索引及其内部结构,以及各种索引的工作原理和适用场景。 首先,Oracle使用平衡树(B-Tree)作为其索引的基础结构...
Oracle索引是数据库管理系统中用于加速数据检索的关键结构。它们的工作原理类似于书籍的目录,允许数据库系统快速定位和访问特定的数据行,而无需扫描整个表。Oracle提供了多种类型的索引,包括B树索引、位图索引、...
Oracle 索引 使用方法,索引 使用原理, 索引 使用顺序过程
总的来说,理解Oracle索引的工作原理并适当使用,是实现数据库高效运行的关键。正确选择和设计索引,避免使用限制索引的因素,能显著提高查询性能,减少数据库响应时间,从而提升整个系统的性能。在实践中,需要结合...
oracle 索引的原理原理深入理解!
Oracle索引优化是数据库性能调优的关键环节,它关乎到数据检索速度和整体系统的效率。在Oracle数据库中,索引的种类繁多,包括B*Tree索引、反向索引、降序索引、位图索引和函数索引等。理解并正确使用这些索引类型...
Oracle 索引与分区索引介绍 Oracle 索引与分区索引是 Oracle 数据库中两个重要的概念,它们都是为了提高查询性能和数据存储效率而设计的。在本文中,我们将详细介绍 Oracle 索引与分区索引的概念、特点、分类、创建...
oracle的索引,非常适合初学者,介绍索引的分类,如何创建,修改等
Oracle数据库中的索引是优化查询性能的关键工具,它允许快速定位和访问数据。常见的索引类型包括B*树索引和位图索引,每种都有其特定的应用场景和优势。 1. **B*树索引**:这是最常见的索引类型,类似于二叉树结构...
### Oracle索引的基本概念 #### 1. 创建索引 索引是数据库中一种用于提高数据检索速度的数据结构。通过创建索引,可以显著提升查询性能。例如,在`student`表上创建一个基于`sno`列的索引: ```sql CREATE INDEX ...