下午看了下分区表和分区索引的用法,并测试了一把,一个已经优化过的的sql未建分区表执行时间为78秒,分区,索引后只用10秒:
以下内容转载于
http://blog.csdn.net/xieyuooo/article/details/5437126
ORACLE对于分区表方式其实就是将表分段存储,一般普通表格是一个段存储,而分区表会分成多个段,所以查找数据过程都是先定位根据查询条件定位分区范围,即数据在那个分区或那几个内部,然后在分区内部去查找数据,一个分区一般保证四十多万条数据就比较正常了,但是分区表并非乱建立,而其维护性也相对较为复杂一点,而索引的创建也是有点讲究的,这些以下尽量阐述详细即可。
1、类型说明:
range分区方式,也算是最常用的分区方式,其通过某字段或几个字段的组合的值,从小到大,按照指定的范围说明进行分区,我们在INSERT数据的时候就会存储到指定的分区中。
List分区方式,一般是在range基础上做的二级分区较多,是一种列举方式进行分区,一般讲某些地区、状态或指定规则的编码等进行划分。
Hash分区方式,它没有固定的规则,由ORACLE管理,只需要将值INSERT进去,ORACLE会自动去根据一套HASH算法去划分分区,只需要告诉ORACLE要分几个区即可。
分区可以进行两两组合,ORACLE 11G以前两两组合都必须以range作为一级分区的开头,ORACLE目前最多支持2级别分区,但这个级别已经够我们使用了。
我这只以最简单的分区方式创建分区来说明问题,就拿range分区来说明问题吧(基本创建语句如下):
CREATE TABLE TABLE_PARTITION(
COL1 NUMBER,
COL2 VARCHAR2(10)
)
partition by range(COL1)(
partition TAB_PARTOTION_01 values less than (450000),
partition TAB_PARTOTION_02 values less than (900000),
partition TAB_PARTOTION_03 values less than (1350000),
partition TAB_PARTOTION_04 values less than (1800000),
partition TAB_PARTOTION_OTHER values less THAN (MAXVALUE)
);
这个分区表创建了四个定长分区,理想情况下,存储450000条数据,扩展分区是超过这个数额的分区,当发现扩展分区有数据的时候,可以进行将扩展分区做SPLIT操作,这个后面说明,这里先说一下一些常用的分区表查询功能,我们先插入一些数据进去。
INSERT INTO TABLE_PARTITION(COL1,COL2)
VALUES(1,'数据测试');
INSERT INTO TABLE_PARTITION(COL1,COL2)
VALUES(23,'数据测试');
INSERT INTO TABLE_PARTITION(COL1,COL2)
VALUES(449000,'数据测试');
INSERT INTO TABLE_PARTITION(COL1,COL2)
VALUES(450000,'数据测试');
INSERT INTO TABLE_PARTITION(COL1,COL2)
VALUES(1350000,'数据测试');
INSERT INTO TABLE_PARTITION(COL1,COL2)
VALUES(900000,'数据测试');
INSERT INTO TABLE_PARTITION(COL1,COL2)
VALUES(1800000-1,'数据测试');
COMMIT;
为了检测哪些分区中有哪些数据分别按照分区去查询数据(应用开发中基本不会用到,因为不会把分区写死)
SQL> SELECT * FROM TABLE_PARTITION partition(TAB_PARTOTION_01);
COL1 COL2
---------- ---------------
1 数据测试
23 数据测试
449000 数据测试
说明第一个分区有:1、23、44900这些数据,也就是插入时,ORACLE是自己去找分区的,其实分区这种子表管理自己也可以通过程序去完成,ORACLE给你提供了一套,就可以自己去完成了。其余的数据就自己查了,都是一个道理。
2、分区应用:
一般一张表超过2G的大小,ORACLE是推荐使用分区表的,分区一般都需要创建索引,说到分区索引,就可以分为:全局索引、分区索引,即:global索引和local索引,前者为默认情况下在分区表上创建索引时的索引方式,并不对索引进行分区(索引也是表结构,索引大了也需要分区,关于索引以后专门写点)而全局索引可修饰为分区索引,但是和local索引有所区别,前者的分区方式完全按照自定义方式去创建,和表结构完全无关,所以对于分区表的全局索引有以下两幅网上常用的图解:
2.1、对于分区表的不分区索引(这个有点绕,不过就是表分区,但其索引不分区):
创建语法(直接创建即可):
CREATE INDEX <index_name> ON <partition_table_name>(<column_name>);
2.2、对于分区表的分区索引:
创建语法为:
CREATE INDEX INX_TAB_PARTITION_COL1 ON TABLE_PARTITION(COL1)
GLOBAL PARTITION BY RANGE(COL1)(
PARTITION IDX_P1 values less than (1000000),
PARTITION IDX_P2 values less than (2000000),
PARTITION IDX_P3 values less than (MAXVALUE)
);
2.3、LOCAL索引结构:
创建语法为:
CREATE INDEX INX_TAB_PARTITION_COL1 ON TABLE_PARTITION(COL1) LOCAL;
也可按照分区表的的分区结构给与一一定义,索引的分区将得到重命名。
分区上的位图索引只能为LOCAL索引,不能为GLOBAL全局索引。
2.4、对比索引方式:
一般使用LOCAL索引较为方便,而且维护代价较低,并且LOCAL索引是在分区的基础上去创建索引,类似于在一个子表内部去创建索引,这样开销主要是区分分区上,很规范的管理起来,在OLAP系统中应用很广泛;而相对的GLOBAL索引是全局类型的索引,根据实际情况可以调整分区的类别,而并非按照分区结构一一定义,相对维护代价较高一些,在OLTP环境用得相对较多,这里所谓OLTP和OLAP也是相对的,不是特殊的项目,没有绝对的划分概念,在应用过程中依据实际情况而定,来提高整体的运行性能。
3、常用视图:
1、查询当前用户下有哪些是分区表:
SELECT * FROM USER_PART_TABLES;
2、查询当前用户下有哪些分区索引:
SELECT * FROM USER_PART_INDEXES;
3、查询当前用户下分区索引的分区信息:
SELECT * FROM USER_IND_PARTITIONS T
WHERE T.INDEX_NAME=?
4、查询当前用户下分区表的分区信息:
SELECT * FROM USER_TAB_PARTITIONS T
WHERE T.TABLE_NAME=?;
5、查询某分区下的数据量:
SELECT COUNT(*) FROM TABLE_PARTITION PARTITION(TAB_PARTOTION_01);
6、查询索引、表上在那些列上创建了分区:
SELECT * FROM USER_PART_KEY_COLUMNS;
7、查询某用户下二级分区的信息(只有创建了二级分区才有数据):
SELECT * FROM USER_TAB_SUBPARTITIONS;
4、维护操作:
4.1、删除分区
ALTER TABLE TABLE_PARTITION DROP PARTITION TAB_PARTOTION_03;
如果是全局索引,因为全局索引的分区结构和表可以不一致,若不一致的情况下,会导致整个全局索引失效,在删除分区的时候,语句修改为:
ALTER TABLE TABLE_PARTITION DROP PARTITION TAB_PARTOTION_03 UPDATE GLOBAL INDEXES;
4.2、分区合并(从中间删除掉一个分区,或者两个分区需要合并后减少分区数量)
合并分区和删除中间的RANGE有点像,但是合并分区是不会删除数据的,对于LIST、HASH分区也是和RANGE分区不一样的,其语法为:
ALTER TABLE TABLE_PARTITION MERGE PARTITIONS TAB_PARTOTION_01,TAB_PARTOTION_02 INTO PARTITION MERGED_PARTITION;
4.3、分隔分区(一般分区从扩展分区从分隔)
ALTER TABLE TABLE_PARTITION SPLIT PARTITION TAB_PARTOTION_OTHERE AT(2500000)
INTO (PARTITION TAB_PARTOTION_05,PARTITION TAB_PARTOTION_OTHERE);
4.4、创建新的分区(分区数据若不能提供范围,则插入时会报错,需要增加分区来扩大范围)
一般有扩展分区的是都是用分隔的方式,若上述创建表时没有创建TAB_PARTOTION_OTHER分区时,在插入数据较大时(按照上述建立规则,超过1800000就应该创建新的分区来存储),就可以创建新的分区,如:
为了试验,我们将扩展分区先删除掉再创建新的分区(因为ORACLE要求,分区的数据不允许重叠,即按照分区字段同样的数据不能同时存储在不同的分区中):
ALTER TABLE TABLE_PARTITION DROP PARTITION TAB_PARTOTION_OTHER;
ALTER TABLE TABLE_PARTITION ADD PARTITION TAB_PARTOTION_06 VALUES LESS THAN(2500000);
在分区下创建新的子分区大致如下(RANGE分区,若为LIST或HASH分区,将创建方式修改为对应的方式即可):
ALTER TABLE <table_name> MODIFY PARTITION <partition_name> ADD SUBPARTITION <user_define_subpartition_name> VALUES LESS THAN(....);
4.5、修改分区名称(修改相关的属性信息)
ALTER TABLE TABLE_PARTITION RENAME PARTITION MERGED_PARTITION TO MERGED_PARTITION02;
4.6、交换分区(快速交换数据,其实是交换段名称指针)
首先创建一个交换表,和原表结构相同,如果有数据,必须符合所交换对应分区的条件:
CREATE TABLE TABLE_PARTITION_2
AS SELECT * FROM TABLE_PARTITION WHERE 1=2;
然后将第一个分区的数据交换出去:
ALTER TABLE TABLE_PARTITION EXCHANGE PARTITION TAB_PARTOTION_01
WITH TABLE TABLE_PARTITION_2 INCLUDING INDEXES;
此时会发现第一个分区的数据和表TABLE_PARTITION_2做了瞬间交换,比TRUNCATE还要快,因为这个过程没有进行数据转存,只是段名称的修改过程,和实际的数据量没有关系。
如果是子分区也可以与外部的表进行交换,只需要将关键字修改为:SUBPARTITION 即可。
4.7、清空分区数据
ALTER TABLE <table_name> TRUNCATE PARTITION <partition_name>;
ALTER TABLE <table_name> TRUNCATE subpartition <subpartition_name>;
9、磁盘碎片压缩
对分区表的某分区进行磁盘压缩,当对分区内部数据进行了大量的UPDATE、DELETE操作后,一定时间需要进行磁盘压缩,否则在查询时,若通过FULL SCAN扫描数据,将会把空块也会扫描到,对表进行磁盘压缩需要进行行迁移操作,所以首先需要操作:
ALTER TABLE <table_name> ENABLE ROW MOVEMENT ;
对分区表的某分区压缩语法为:
ALTER TABLE <table_name>
modify partition <partition_name> shrink space;
对普通表压缩:
ALTER TABLE <table_name> shrink space;
对于索引也需要进行压缩,索引也是表:
ALTER INDEX <index_name> shrink space;
10、分区表重新分析以及索引重新分析
对表进行压缩后,需要对表和索引进行重新分析,对表进行重新分析,一般有两种方式:
在ORACLE 10G以前,使用:
BEGIN
dbms_stats.gather_table_stats(USER,UPPER('<table_name>'));
END;
ORACLE 10G后,可以使用:
ANALYZE TABLE <table_name> COMPUTE STATISTICS;
索引重新分析,将上述两种方式分别修改一下,如第一种可以使用:gather_index_stats,而第二种修改为:ANALYZE INDEX即可,不过一般比较常用的是重新编译:
对于分区表并进行了索引分区的情况,需要对每个分区的索引进行重新编译,这里以LOCAL索引为例子(其每个索引的分区和表分区结构相同,默认分区名称和表分区名称相同):
ALTER INDEX <index_name> REBUILD PARTITION <partition_name>;
对于全局索引,根据全局索引锁定义的分区名称修改即可,若没有分区,和普通单表索引重新编译方式相同:
ALTER INDEX <index_name> REBUILD;
11、关联对象重新编译
上述对表、索引进行重新编译,尤其对表进行了压缩后会产生行迁移,这个过程可能会导致一些视图、过程对象的失效,此时要将其重新编译一次。
12、扩展:HASH分区中,如果创建了新的分区,可以将其进行重新HASH分布:
ALTER TABLE <table_name> COALESCA PARTITION
5、回归总结:何时建分区,分区类别,索引,如何对应SQL
1、创建时机
上述已经说明,2G以上的表,ORACLE推荐创建分区。
分区的方式根据实际情况而定,才能提高整体性能。
分区的字段一定要是经常用以提取数据的字段,否则会在提取过程中导致遍历多个分区,这样比没有分区还要慢。
分区字段要选择合适,数据较为均匀分布到各个分区,不要太多也不要太少,而且根据分区字段可以很快定位到分区范围。
一般情况下,尽量然业务操作在同一个分区内部完成。
2、分区类别
分区主要有RANGE、LIST、HASH;
RANGE通过值的范围分区,也是最常用的分区,这种分区注意在一种变长数字字符串中,很多人会导致认为是数字类型,而按照数字区分区,这样会分布十分不均匀的现象发生。
LIST是列举方式进行分区,一般作为二级分区而存在(当然也可以自己分区,ORACLE 11G后在分区上也可以作为主分区而存在),在RANGE基础上,若数据需要继续分区,并且在RANGE基础上数据量较为固定,只是较大,可以按照一定规则进一步分区。
HASH只指定分区个数,分区细节由ORACLE完成,增加HASH分区可以重新分布数据。
注意:分区字段不能使用函数转换后在分区,如,将某数字字符串字段,先TO_NUMER(COL_NAME)后分区。
3、索引类别
大致分:GLOBAL索引和LOCAL索引,钱和可以分:GLOBAL不分区索引,和GLOBAL分区索引。
GLOBAL不分区索引一般不太推荐,因为是用一颗大的索引树来映射一个表,这个过程,这样速度不见得比不分区快。
GLOBAL分区索引,查找数据若通过要通过索引,是先定位了索引内部的分区,然后在这个分区索引中找到ROWID,然后回表提取数据。
LOCAL索引是和分区的个数逐个对应的,可以说先定位分区表的分区也可以说先定位索引的分区,因为他们是一一对应的,找到对应分区后,分区内部索引数据集合。
4、对应应用
分区表、索引、分区索引,要利用其性能优势,最基本就是要提取数据时,要通过它首先将数据的范围缩小到一个即使做全盘扫描也不会太慢的情况。
所以SQL一定要有分区上的这个字段的一个WHERE条件,将数据迅速定位到分区内部,而且尽量定位到一个分区里面(这个和创建分区的规则有关系)。
建立分区本身不提要性能,要用好才可提高性能,在必要的RAC集群中,若存在多分区提取数据,适当采用并行提取可以提高提取的速度。
对于索引部分,这里也只提到分区索引的创建方式以及常见索引的维护方式,对于索引原理理解后会更容易认识到提取数据时的技巧。
分享到:
相关推荐
### Oracle 分区表详解 #### 一、Oracle 分区简介 ...以上是 Oracle 分区表的基础概念及其操作的详细介绍。通过合理应用分区技术,不仅可以提高数据的可管理性,还能有效提升查询性能和系统可用性。
Oracle数据库系统中,锁和表分区是两...了解并熟练掌握锁和表分区的概念及其应用,对于优化Oracle数据库的性能和确保数据一致性至关重要。在实际操作中,根据业务需求合理使用这些机制,能够显著提升数据库的运行效率。
根据提供的文件信息,本文将详细解析Oracle数据库中的三个核心概念:表空间(Tablespaces)、分区表(Table Partitioning)以及索引(Indexes)。 ### 一、表空间(Tablespaces) 表空间是Oracle数据库中用于组织存储空间...
### Oracle表分区详解 ...以上是关于Oracle表分区的基本概念、作用、优缺点以及具体的实现方法。通过对表进行适当的分区,不仅可以显著提高查询性能,还可以大大简化日常的数据库管理和维护工作。
通过上述内容,我们可以了解到Oracle数据库中分区技术的基础概念和常见操作,包括如何创建分区表及其索引、如何增加或截断分区等。这些技术在处理大量数据时尤其有用,能够极大地提高数据访问速度和简化数据管理过程...
这些知识点不仅包括了基本的索引创建与查询,还涉及到了分区表及其索引的管理。 ### Oracle索引的基本概念 #### 1. 创建索引 索引是数据库中一种用于提高数据检索速度的数据结构。通过创建索引,可以显著提升查询...
### Oracle 重构索引知识点详解 #### 一、Oracle索引重构概述 在日常的数据库维护工作中,我们可能会遇到数据库中的索引变得杂乱无章的情况。...希望本文能够帮助大家更好地理解和掌握Oracle索引重构的相关知识。
本篇将详细讲解Oracle数据库中的索引及其重要性。 一、索引的概念与类型 1. 索引是一种特殊的数据结构,它为数据库表中的列提供快速访问路径。就像书的目录一样,通过索引,数据库系统可以迅速定位到所需的数据行,...
Oracle数据库是世界上最流行的数据库管理系统之一,它提供了丰富的数据存储和管理功能。在Oracle中,表和视图是最基本的数据...在学习Oracle的过程中,深入理解表和视图的概念及其操作,是成为专业数据库管理员的基础。
2. **调整分区策略**:对于分区表,合理调整分区策略有助于提升查询效率。 3. **使用压缩技术**:启用行级或表级压缩,减少数据占用空间,提高I/O效率。 ### 四、最佳实践 1. **备份数据**:在进行任何表空间变动...
- 分区索引(Partitioned Index):与分区表配合,索引也按照相同方式分区。 3. 索引选择与优化: - 索引选择:根据查询模式、数据分布和业务需求选择合适的索引类型。 - 索引维护:定期分析索引的使用情况,...
该文档主要介绍了Oracle的基础知识、索引详解、分区表总结以及Oracle中的锁机制等关键知识点。 首先,文档提到了OLTP(On-Line Transaction Processing,联机事务处理)和OLAP(On-Line Analytical Processing,...
在Oracle数据库系统中,表空间(Tablespace)是存储数据对象如表、索引、视图等的基础单元。管理表空间对于确保数据库高效运行至关重要。本文将深入探讨Oracle表空间的回收过程,并提供一个可能的回收脚本示例。 1....
这不仅涵盖了索引的基础概念,还涉及了具体的实现方法及其对性能的影响,并且详细介绍了分区策略在大型数据库系统中的应用。 ### 数据库索引 #### 索引的特点 索引是在数据库表上的一个数据结构,它能够加速对...
在深入讨论转换过程之前,我们先了解一些关于Oracle表分区的基础概念: - **分区(Partitioning)**:是将一个大的表或索引物理上分割成较小部分的过程。这样做的好处包括提高查询性能、简化数据管理和备份、以及...
- 表的组织方式,如堆表、索引组织表(IOT)及其优缺点。 3. **第4章 分区,视图和其它模式对象**: - 数据库分区技术,如范围分区、列表分区、哈希分区等,用于提高查询性能和管理大量数据。 - 视图的概念,以及...
#### 一、Oracle临时表的基本概念及应用场景 Oracle临时表是一种特殊类型的表,它们主要用于存储临时数据,这些数据通常在一次会话(session)中创建并在该会话结束时自动删除。与常规表不同的是,临时表中的数据对于...
2. 分区与表空间:Oracle支持分区表以提高大数据处理能力,表空间管理则是分配和组织数据库存储的关键。 3. 数据库设计:如何进行规范化设计,避免数据冗余和异常,以及ER模型和逻辑设计的概念。 4. 实施与迁移:...