`

oracle分区表的建立方法(包含已经存在的表要分区)

阅读更多
  

Oracle提供了分区技术以支持VLDB(Very Large DataBase)。分区表通过对分区列的判断,把分区列不同的记录,放到不同的分区中。分区完全对应用透明。

 

Oracle的分区表可以包括多个分区,每个分区都是一个独立的段(SEGMENT),可以存放到不同的表空间中。查询时可以通过查询表来访问各个分区中的数据,也可以通过在查询时直接指定分区的方法来进行查询。

 

分区提供以下优点: 

 

由于将数据分散到各个分区中,减少了数据损坏的可能性; 

 

可以对单独的分区进行备份和恢复; 

 

可以将分区映射到不同的物理磁盘上,来分散IO;

 

提高可管理性、可用性和性能。 

 

Oracle提供了以下几种分区类型:

 

范围分区(range);

 

哈希分区(hash);

 

列表分区(list);

 

范围-哈希复合分区(range-hash);

 

范围-列表复合分区(range-list)。

 

Oracle的普通表没有办法通过修改属性的方式直接转化为分区表,必须通过重建的方式进行转变,下面介绍三种效率比较高的方法,并说明它们各自的特点。

 

 

 

 

方法一:利用原表重建分区表。 

 

步骤: 

 

SQL> CREATE TABLE T (ID NUMBER PRIMARY KEY, TIME DATE);

 

表已创建。 

 

SQL> INSERT INTO T SELECT ROWNUM, CREATED FROM DBA_OBJECTS;

 

已创建6264行。

 

SQL> COMMIT;

 

提交完成。

SQL> CREATE TABLE T_NEW (ID, TIME) PARTITION BY RANGE (TIME)
  2  (PARTITION P1 VALUES LESS THAN (TO_DATE('2004-7-1', 'YYYY-MM-DD')),
  3  PARTITION P2 VALUES LESS THAN (TO_DATE('2005-1-1', 'YYYY-MM-DD')),
  4  PARTITION P3 VALUES LESS THAN (TO_DATE('2005-7-1', 'YYYY-MM-DD')),
  5  PARTITION P4 VALUES LESS THAN (MAXVALUE))
  6  AS SELECT ID, TIME FROM T;

 

表已创建。 

 

SQL> RENAME T TO T_OLD;

 

表已重命名。 

 

SQL> RENAME T_NEW TO T;

 

表已重命名。 

 

SQL> SELECT COUNT(*) FROM T;

 

  COUNT(*)
----------
      6264

 

SQL> SELECT COUNT(*) FROM T PARTITION (P1);

 

  COUNT(*)
----------
         0

 

SQL> SELECT COUNT(*) FROM T PARTITION (P2);

 

  COUNT(*)
----------
      6246

 

SQL> SELECT COUNT(*) FROM T PARTITION (P3);

 

  COUNT(*)
----------
        18

 

优点:方法简单易用,由于采用DDL语句,不会产生UNDO,且只产生少量REDO,效率相对较高,而且建表完成后数据已经在分布到各个分区中了。

 

不足:对于数据的一致性方面还需要额外的考虑。由于几乎没有办法通过手工锁定T表的方式保证一致性,在执行CREATE TABLE语句和RENAME T_NEW TO T语句直接的修改可能会丢失,如果要保证一致性,需要在执行完语句后对数据进行检查,而这个代价是比较大的。另外在执行两个RENAME语句之间执行的对T的访问会失败。

 

适用于修改不频繁的表,在闲时进行操作,表的数据量不宜太大。 

 

 

方法二:使用交换分区的方法。 

 

步骤: 

 

SQL> CREATE TABLE T (ID NUMBER PRIMARY KEY, TIME DATE);

 

表已创建。 

 

SQL> INSERT INTO T SELECT ROWNUM, CREATED FROM DBA_OBJECTS;

 

已创建6264行。

 

SQL> COMMIT;

 

提交完成。 

 

SQL> CREATE TABLE T_NEW (ID NUMBER PRIMARY KEY, TIME DATE) PARTITION BY RANGE (TIME)
  2  (PARTITION P1 VALUES LESS THAN (TO_DATE('2005-7-1', 'YYYY-MM-DD')),
  3  PARTITION P2 VALUES LESS THAN (MAXVALUE));

 

表已创建。 

 

SQL> ALTER TABLE T_NEW EXCHANGE PARTITION P1 WITH TABLE T;

 

表已更改。 

 

SQL> RENAME T TO T_OLD;

 

表已重命名。 

 

SQL> RENAME T_NEW TO T;

 

表已重命名。 

 

SQL> SELECT COUNT(*) FROM T;

 

  COUNT(*)
----------
      6264

 

优点:只是对数据字典中分区和表的定义进行了修改,没有数据的修改或复制,效率最高。如果对数据在分区中的分布没有进一步要求的话,实现比较简单。在执行完RENAME操作后,可以检查T_OLD中是否存在数据,如果存在的话,直接将这些数据插入到T中,可以保证对T插入的操作不会丢失。

 

不足:仍然存在一致性问题,交换分区之后RENAME T_NEW TO T之前,查询、更新和删除会出现错误或访问不到数据。如果要求数据分布到多个分区中,则需要进行分区的SPLIT操作,会增加操作的复杂度,效率也会降低。

 

适用于包含大数据量的表转到分区表中的一个分区的操作。应尽量在闲时进行操作。 

 

 

方法三:Oracle9i以上版本,利用在线重定义功能

 

步骤: 

 

SQL> CREATE TABLE T (ID NUMBER PRIMARY KEY, TIME DATE);

 

表已创建。 

 

SQL> INSERT INTO T SELECT ROWNUM, CREATED FROM DBA_OBJECTS;

 

已创建6264行。

 

SQL> COMMIT;

 

提交完成。 

 

SQL> EXEC DBMS_REDEFINITION.CAN_REDEF_TABLE(USER, 'T', DBMS_REDEFINITION.CONS_USE_PK);

 

PL/SQL 过程已成功完成。

 

SQL> CREATE TABLE T_NEW (ID NUMBER PRIMARY KEY, TIME DATE) PARTITION BY RANGE (TIME)
  2  (PARTITION P1 VALUES LESS THAN (TO_DATE('2004-7-1', 'YYYY-MM-DD')),
  3  PARTITION P2 VALUES LESS THAN (TO_DATE('2005-1-1', 'YYYY-MM-DD')),
  4  PARTITION P3 VALUES LESS THAN (TO_DATE('2005-7-1', 'YYYY-MM-DD')),
  5  PARTITION P4 VALUES LESS THAN (MAXVALUE));

 

表已创建。 

 

SQL> EXEC DBMS_REDEFINITION.START_REDEF_TABLE(USER, 'T', 'T_NEW', -
> 'ID ID, TIME TIME', DBMS_REDEFINITION.CONS_USE_PK);

 

PL/SQL 过程已成功完成。

 

SQL> EXEC DBMS_REDEFINITION.FINISH_REDEF_TABLE('YANGTK', 'T', 'T_NEW');

 

PL/SQL 过程已成功完成。

 

SQL> SELECT COUNT(*) FROM T;

 

  COUNT(*)
----------
      6264

 

SQL> SELECT COUNT(*) FROM T PARTITION (P2);

 

  COUNT(*)
----------
      6246

 

SQL> SELECT COUNT(*) FROM T PARTITION (P3);

 

  COUNT(*)
----------
        18

 

优点:保证数据的一致性,在大部分时间内,表T都可以正常进行DML操作。只在切换的瞬间锁表,具有很高的可用性。这种方法具有很强的灵活性,对各种不同的需要都能满足。而且,可以在切换前进行相应的授权并建立各种约束,可以做到切换完成后不再需要任何额外的管理操作。

 

不足:实现上比上面两种略显复杂。 

 

适用于各种情况。 

 

这里只给出了在线重定义表的一个最简单的例子,详细的描述和例子可以参考下面两篇文章。 

 

Oracle的在线重定义表功能:http://blog.itpub.net/post/468/12855

 

Oracle的在线重定义表功能(二):http://blog.itpub.net/post/468/12962

 

索引也可以进行分区,分区索引有两种类型:global和local。对于local索引,每一个表分区对应一个索引分区,当表的分区发生变化时,索引的维护由Oracle自动进行。对于global索引,可以选择是否分区,而且索引的分区可以不与表分区相对应。当对分区进行维护操作时,通常会导致全局索引的INVALDED,必须在执行完操作后REBUILD。Oracle9i提供了UPDATE GLOBAL INDEXES语句,可以使在进行分区维护的同时重建全局索引。

全局索引可以包含多个分区的值 局部索引比全局索引容易管理,而全局索引比较快
注意:不能为散列分区 或者 子分区创建全局索引

 

Oracle的分区功能十分强大。不过用起来发现有两点不大方便:

 

第一是已经存在的表没有方法可以直接转化为分区表。不过Oracle提供了在线重定义表的功能,可以通过这种方式来完成普通表到分区表的转化。可以参考这个例子:http://blog.itpub.net/post/468/13091

 

第二点是如果采用了local分区索引,那么在增加表分区的时候,索引分区的表空间是不可控制的。如果希望将表和索引的分区分开到不同的表空间且不同索引分区也分散到不同的表空间中,那么只能在增加分区后,对新增的分区索引单独rebuild。

Oracle最大允许存在多少个分区呢?

我们可以从Oracle的Concepts手册上找到这个信息,对于Oracle9iR2:

Tables can be partitioned into up to 64,000 separate partitions.

对于Oracle10gR2,Oracle增强了分区特性:

Tables can be partitioned into up to 1024K-1 separate partitions.

关于何时应该进行分区,Oracle有如下建议:

■ Tables greater than 2GB should always be considered for partitioning.
■ Tables containing historical data, in which new data is added into the newest partition. A typical example is a historical table where only the current month's data is updatable and the other 11 months are read only.

分享到:
评论

相关推荐

    oracle分区表之hash分区表的使用及扩展

    Oracle分区表中的Hash分区是一种基于哈希算法的分区策略,适用于处理无法清晰定义分区范围的大型数据表。这种分区方式通过计算分区键的哈希值来决定数据存储在哪个分区,以此达到数据分散和负载均衡的目的。Hash分区...

    oracle普通表转化为分区表的方法

    Oracle数据库中的分区表是一种高级的表组织形式,它将大表分成多个较小的部分,每个部分称为一个分区,以提高查询性能和管理效率。当表的大小超过2GB时,官方推荐使用分区表,因为它们在处理大量数据时具有显著优势...

    Oracle分区表详解

    ### Oracle 分区表详解 #### 一、Oracle 分区简介 Oracle 的分区技术是一种用于管理和优化超大型表和索引的有效手段。通过将一个大型的表或者索引分割成多个较小且可管理的部分,分区技术能够显著提升数据库的性能...

    Oracle分区表用法

    【Oracle分区表用法】 Oracle分区表是一种高级的数据库管理技术,它将大型表的数据分散存储在不同的物理区域,以提升查询效率和系统的整体性能。本文将详细介绍分区表的概念、作用、优缺点,以及各种类型的分区表...

    Oracle分区表培训

    Oracle分区表是数据库管理系统Oracle中的一个高级特性,用于将大表分成较小、更易管理的部分,从而提高查询性能,优化存储管理和数据维护。在大型企业级应用中,尤其是在处理大量数据时,分区表是不可或缺的技术手段...

    Oracle数据库分区表操作方法

    Oracle数据库分区表操作方法 Oracle数据库中的分区表是将大型数据表分割成多个小表,以提高应用系统的性能和方便数据管理。在本文中,我们将详细介绍分区表的使用方法和优点。 分区表的优点 使用分区表可以带来...

    oracle 分区表管理

    要查看Oracle分区表的相关信息,可以使用以下视图: 1. `DBA_PART_TABLES`:显示数据库中所有分区表的信息,包括表名、分区类型、分区键等。 2. `ALL_PART_TABLES`:显示当前用户可以访问的所有分区表信息,权限...

    导入导出 Oracle 分区表数据

    ### 导入导出Oracle分区表数据 #### 一、概述 在Oracle数据库管理中,对分区表进行数据的导入与导出是一项常见的任务。分区技术可以显著提高大型表的性能,尤其是在处理大规模数据集时。为了有效地管理和迁移这些...

    ORACLE表自动按月分区步骤

    Oracle数据库提供了丰富的表分区功能,其中按月分区是一种常见的应用场景。本文将以具体的实例——报单表`USER_ORDER`为例,详细介绍如何实现Oracle表的自动按月分区,并创建相应的本地索引。 #### 二、准备工作 在...

    Oracle分区表及分区索引

    Oracle 分区表及分区索引 Oracle 分区表是指将一个大表分割成多个小表,每个小表称为一个分区,分区表的优点是可以提高查询性能、改善管理型、增强容错性等。 分区表的分类: 1. 范围分区(Range Partitioning) ...

    清除oracle分区表数据

    通过上述方法,我们可以有效地清除Oracle分区表中的数据。选择合适的方法取决于具体的应用场景以及对性能和安全性的要求。例如,如果只需要临时性地清理数据而无需保留日志,则可以优先考虑使用TRUNCATE命令;如果...

    Oracle 分区表自动维护脚本

    标签“oracle分区表 自动维护”概括了脚本的核心功能和使用场景,说明脚本主要用于Oracle数据库的分区表自动维护。 从提供的部分内容中,我们可以看到脚本的具体实现细节: 1. 创建基础表`PART_T_MAINTENANCE`,...

    Oracle表分区详解(优缺点)

    本文将详细介绍Oracle表分区的概念、作用、优缺点,以及各种类型的分区和操作方法。 首先,理解表空间和分区表的概念至关重要。表空间是Oracle数据库中存储数据的基本单位,它由一个或多个数据文件组成,容纳了...

    oracle分区表总结

    #### 一、Oracle分区表概述 在Oracle数据库中,分区是一种对大型表进行物理分割的方法,它可以显著提高查询性能并简化数据管理任务。通过将一个大表分成多个较小的部分(即分区),可以更快地执行查询操作,尤其是...

    ORACLE分区表的创建

    本文将详细介绍在Oracle中如何创建分区表,包括各种分区类型及其应用场景,并通过具体示例进行说明。 #### 二、分区类型及定义 在Oracle中,主要有以下四种类型的分区方法: 1. **范围分区 (Range Partitioning)*...

    oracle 普通表转分区表方式

    本文详细介绍了将 Oracle 普通表转换为分区表的方法,包括备份创建表脚本、查看数据类型、创建分区表、迁移数据和更新索引和约束等步骤。通过将普通表转换为分区表,可以提高查询效率、减少存储空间和提高数据管理...

    Oracle 分区表全揭秘

    Oracle 分区表全揭秘 ,非常详细,oracle dba可以看看

    ORACLE分区表的概念及操作

    总结来说,Oracle分区表是一种有效管理大规模数据的手段,通过合理分区,可以显著提升查询效率,简化维护工作,并提供更高的数据可用性。然而,使用分区也需要权衡其带来的复杂性和额外的存储需求。正确理解和应用...

    Oracle 分区表 分区索引

    ### Oracle 分区表与分区索引详解 #### 一、Oracle分区概述 在Oracle数据库中,分区技术是一种非常有效的管理大型表和索引的方法。通过将一个大的表或索引分成多个较小的部分(分区),可以显著提高查询性能,并...

Global site tag (gtag.js) - Google Analytics