`
gaoyuntao2005
  • 浏览: 312830 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

表分区

 
阅读更多

之前听说过表分区,但是一直没有用过,自己也看过,但都没有实验过, 
现在公司采用表分区,终于体会到它的强大能力了。下面是写的一篇非常好的文章, 
表示感谢! 
转载下: 

原文出处:http://tianzt.blog.51cto.com/459544/171759 

此文从以下几个方面来整理关于分区表的概念及操作: 
        1.表空间及分区表的概念 
        2.表分区的具体作用 
        3.表分区的优缺点 
        4.表分区的几种类型及操作方法 
        5.对表分区的维护性操作. 
(1.) 表空间及分区表的概念 
表空间: 
  是一个或多个数据文件的集合,所有的数据对象都存放在指定的表空间中,但主要存放的是表, 所以称作表空间。 

分区表: 
当表中的数据量不断增大,查询数据的速度就会变慢,应用程序的性能就会下降,这时就应该考虑对表进行分区。表进行分区后,逻辑上表仍然是一张完整的表,只是将表中的数据在物理上存放到多个表空间(物理文件上),这样查询数据时,不至于每次都扫描整张表。 

( 2).表分区的具体作用 
Oracle的表分区功能通过改善可管理性、性能和可用性,从而为各式应用程序带来了极大的好处。通常,分区可以使某些查询以及维护操作的性能大大提高。此外,分区还可以极大简化常见的管理任务,分区是构建千兆字节数据系统或超高可用性系统的关键工具。 

分区功能能够将表、索引或索引组织表进一步细分为段,这些数据库对象的段叫做分区。每个分区有自己的名称,还可以选择自己的存储特性。从数据库管理员的角度来看,一个分区后的对象具有多个段,这些段既可进行集体管理,也可单独管理,这就使数据库管理员在管理分区后的对象时有相当大的灵活性。但是,从应用程序的角度来看,分区后的表与非分区表完全相同,使用 SQL DML 命令访问分区后的表时,无需任何修改。 

什么时候使用分区表: 
1、表的大小超过2GB。 
2、表中包含历史数据,新的数据被增加都新的分区中。 

(3).表分区的优缺点 
表分区有以下优点: 
1、改善查询性能:对分区对象的查询可以仅搜索自己关心的分区,提高检索速度。 
2、增强可用性:如果表的某个分区出现故障,表在其他分区的数据仍然可用; 
3、维护方便:如果表的某个分区出现故障,需要修复数据,只修复该分区即可; 
4、均衡I/O:可以把不同的分区映射到磁盘以平衡I/O,改善整个系统性能。 

缺点: 
分区表相关:已经存在的表没有方法可以直接转化为分区表。不过 Oracle 提供了在线重定义表的功能。 

(4).表分区的几种类型及操作方法 
一.范围分区: 
范围分区将数据基于范围映射到每一个分区,这个范围是你在创建分区时指定的分区键决定的。这种分区方式是最为常用的,并且分区键经常采用日期。举个例子:你可能会将销售数据按照月份进行分区。 
当使用范围分区时,请考虑以下几个规则: 
1、每一个分区都必须有一个VALUES LESS THEN子句,它指定了一个不包括在该分区中的上限值。分区键的任何值等于或者大于这个上限值的记录都会被加入到下一个高一些的分区中。 
2、所有分区,除了第一个,都会有一个隐式的下限值,这个值就是此分区的前一个分区的上限值。 
3、在最高的分区中,MAXVALUE被定义。MAXVALUE代表了一个不确定的值。这个值高于其它分区中的任何分区键的值,也可以理解为高于任何分区中指定的VALUE LESS THEN的值,同时包括空值。 
例一: 
假设有一个CUSTOMER表,表中有数据200000行,我们将此表通过CUSTOMER_ID进行分区,每个分区存储100000行,我们将每个分区保存到单独的表空间中,这样数据文件就可以跨越多个物理磁盘。下面是创建表和分区的代码,如下: 
CREATE TABLE CUSTOMER 

    CUSTOMER_ID NUMBER NOT NULL PRIMARY KEY, 
    FIRST_NAME  VARCHAR2(30) NOT NULL, 
    LAST_NAME   VARCHAR2(30) NOT NULL, 
    PHONE        VARCHAR2(15) NOT NULL, 
    EMAIL        VARCHAR2(80), 
    STATUS       CHAR(1) 

PARTITION BY RANGE (CUSTOMER_ID) 

    PARTITION CUS_PART1 VALUES LESS THAN (100000) TABLESPACE CUS_TS01, 
    PARTITION CUS_PART2 VALUES LESS THAN (200000) TABLESPACE CUS_TS02 

例二:按时间划分 
CREATE TABLE ORDER_ACTIVITIES 

    ORDER_ID      NUMBER(7) NOT NULL, 
    ORDER_DATE    DATE, 
    TOTAL_AMOUNT NUMBER, 
    CUSTOTMER_ID NUMBER(7), 
    PAID           CHAR(1) 

PARTITION BY RANGE (ORDER_DATE) 

  PARTITION ORD_ACT_PART01 VALUES LESS THAN (TO_DATE('01- MAY -2003','DD-MON-YYYY')) TABLESPACEORD_TS01, 
  PARTITION ORD_ACT_PART02 VALUES LESS THAN (TO_DATE('01-JUN-2003','DD-MON-YYYY')) TABLESPACE ORD_TS02, 
  PARTITION ORD_ACT_PART02 VALUES LESS THAN (TO_DATE('01-JUL-2003','DD-MON-YYYY')) TABLESPACE ORD_TS03 

例三:MAXVALUE 
CREATE TABLE RangeTable 

  idd   INT PRIMARY KEY , 
  iNAME VARCHAR(10), 
  grade INT  

PARTITION  BY  RANGE (grade) 

      PARTITION  part1 VALUES  LESS  THEN (1000) TABLESPACE  Part1_tb, 
      PARTITION  part2 VALUES  LESS  THEN (MAXVALUE) TABLESPACE  Part2_tb 
); 

二.列表分区: 
该分区的特点是某列的值只有几个,基于这样的特点我们可以采用列表分区。 
例一 
CREATE TABLE PROBLEM_TICKETS 

    PROBLEM_ID   NUMBER(7) NOT NULL PRIMARY KEY, 
    DESCRIPTION  VARCHAR2(2000), 
    CUSTOMER_ID  NUMBER(7) NOT NULL, 
    DATE_ENTERED DATE NOT NULL, 
    STATUS       VARCHAR2(20) 

PARTITION BY LIST (STATUS) 

      PARTITION PROB_ACTIVE   VALUES ('ACTIVE') TABLESPACE PROB_TS01, 
      PARTITION PROB_INACTIVE VALUES ('INACTIVE') TABLESPACE PROB_TS02 
例二 
CREATE  TABLE  ListTable 

    id    INT  PRIMARY  KEY , 
    name  VARCHAR (20), 
    area  VARCHAR (10) 

PARTITION  BY  LIST (area) 

    PARTITION  part1 VALUES ('guangdong','beijing') TABLESPACE  Part1_tb, 
    PARTITION  part2 VALUES ('shanghai','nanjing')  TABLESPACE  Part2_tb 
); 


三.散列分区: 
这类分区是在列值上使用散列算法,以确定将行放入哪个分区中。当列的值没有合适的条件时,建议使用散列分区。 
散列分区为通过指定分区编号来均匀分布数据的一种分区类型,因为通过在I/O设备上进行散列分区,使得这些分区大小一致。 
例一: 
CREATE TABLE HASH_TABLE 

  COL NUMBER(8), 
  INF VARCHAR2(100) 

PARTITION BY HASH (COL) 

  PARTITION PART01 TABLESPACE HASH_TS01, 
  PARTITION PART02 TABLESPACE HASH_TS02, 
  PARTITION PART03 TABLESPACE HASH_TS03 

简写: 
CREATE TABLE emp 

    empno NUMBER (4), 
    ename VARCHAR2 (30), 
    sal   NUMBER 

PARTITION BY  HASH (empno) PARTITIONS 8 
STORE IN (emp1,emp2,emp3,emp4,emp5,emp6,emp7,emp8); 

hash分区最主要的机制是根据hash算法来计算具体某条纪录应该插入到哪个分区中,hash算法中最重要的是hash函数,Oracle中如果你要使用hash分区,只需指定分区的数量即可。建议分区的数量采用2的n次方,这样可以使得各个分区间数据分布更加均匀。 

四.组合范围散列分区 
这种分区是基于范围分区和列表分区,表首先按某列进行范围分区,然后再按某列进行列表分区,分区之中的分区被称为子分区。 
CREATE TABLE SALES 

PRODUCT_ID VARCHAR2(5), 
SALES_DATE DATE, 
SALES_COST NUMBER(10), 
STATUS VARCHAR2(20) 

PARTITION BY RANGE(SALES_DATE) SUBPARTITION BY LIST (STATUS) 

   PARTITION P1 VALUES LESS THAN(TO_DATE('2003-01-01','YYYY-MM-DD'))TABLESPACE rptfact2009 
          ( 
              SUBPARTITION P1SUB1 VALUES ('ACTIVE') TABLESPACE rptfact2009, 
              SUBPARTITION P1SUB2 VALUES ('INACTIVE') TABLESPACE rptfact2009 
          ), 
   PARTITION P2 VALUES LESS THAN (TO_DATE('2003-03-01','YYYY-MM-DD')) TABLESPACE rptfact2009 
          ( 
              SUBPARTITION P2SUB1 VALUES ('ACTIVE') TABLESPACE rptfact2009, 
              SUBPARTITION P2SUB2 VALUES ('INACTIVE') TABLESPACE rptfact2009 
          ) 


五.复合范围散列分区: 
这种分区是基于范围分区和散列分区,表首先按某列进行范围分区,然后再按某列进行散列分区。 
create table dinya_test 

transaction_id number primary key, 
item_id number(8) not null, 
item_description varchar2(300), 
transaction_date date 

partition by range(transaction_date)subpartition by hash(transaction_id)  subpartitions 3 store in (dinya_space01,dinya_space02,dinya_space03) 

     partition part_01 values less than(to_date(‘2006-01-01’,’yyyy-mm-dd’)), 
     partition part_02 values less than(to_date(‘2010-01-01’,’yyyy-mm-dd’)), 
     partition part_03 values less than(maxvalue) 
); 

(5).有关表分区的一些维护性操作: 
一、添加分区 
以下代码给SALES表添加了一个P3分区 
ALTER TABLE SALES ADD PARTITION P3 VALUES LESS THAN(TO_DATE('2003-06-01','YYYY-MM-DD')); 
注意:以上添加的分区界限应该高于最后一个分区界限。 
以下代码给SALES表的P3分区添加了一个P3SUB1子分区 
ALTER TABLE SALES MODIFY PARTITION P3 ADD SUBPARTITION P3SUB1 VALUES('COMPLETE'); 
二、删除分区 
以下代码删除了P3表分区: 
ALTER TABLE SALES DROP PARTITION P3; 
在以下代码删除了P4SUB1子分区: 
ALTER TABLE SALES DROP SUBPARTITION P4SUB1; 
注意:如果删除的分区是表中唯一的分区,那么此分区将不能被删除,要想删除此分区,必须删除表。 
三、截断分区 
截断某个分区是指删除某个分区中的数据,并不会删除分区,也不会删除其它分区中的数据。当表中即使只有一个分区时,也可以截断该分区。通过以下代码截断分区: 
ALTER TABLE SALES TRUNCATE PARTITION P2; 
通过以下代码截断子分区: 
ALTER TABLE SALES TRUNCATE SUBPARTITION P2SUB2; 
四、合并分区 
合并分区是将相邻的分区合并成一个分区,结果分区将采用较高分区的界限,值得注意的是,不能将分区合并到界限较低的分区。以下代码实现了P1 P2分区的合并: 
ALTER TABLE SALES MERGE PARTITIONS P1,P2 INTO PARTITION P2; 
五、拆分分区 
拆分分区将一个分区拆分两个新分区,拆分后原来分区不再存在。注意不能对HASH类型的分区进行拆分。 
ALTER TABLE SALES SBLIT PARTITION P2 AT(TO_DATE('2003-02-01','YYYY-MM-DD')) INTO (PARTITION P21,PARTITION P22); 
六、接合分区(coalesca) 
结合分区是将散列分区中的数据接合到其它分区中,当散列分区中的数据比较大时,可以增加散列分区,然后进行接合,值得注意的是,接合分区只能用于散列分区中。通过以下代码进行接合分区: 
ALTER TABLE SALES COALESCA PARTITION; 
七、重命名表分区 
以下代码将P21更改为P2 
ALTER TABLE SALES RENAME PARTITION P21 TO P2; 
八、相关查询 
跨分区查询 
select sum( *) from 
(select count(*) cn from t_table_SS PARTITION (P200709_1) 
union all 
select count(*) cn from t_table_SS PARTITION (P200709_2) 
); 
查询表上有多少分区 
SELECT * FROM useR_TAB_PARTITIONS WHERE TABLE_NAME='tableName' 
查询索引信息 
select object_name,object_type,tablespace_name,sum(value) 
from v$segment_statistics 
where statistic_name IN ('physical reads','physical write','logical reads')and object_type='INDEX' 
group by object_name,object_type,tablespace_name 
order by 4 desc 

--显示数据库所有分区表的信息: 
select * from DBA_PART_TABLES 

--显示当前用户可访问的所有分区表信息: 
select * from ALL_PART_TABLES 

--显示当前用户所有分区表的信息: 
select * from USER_PART_TABLES 

--显示表分区信息 显示数据库所有分区表的详细分区信息: 
select * from DBA_TAB_PARTITIONS 

--显示当前用户可访问的所有分区表的详细分区信息: 
select * from ALL_TAB_PARTITIONS 

--显示当前用户所有分区表的详细分区信息: 
select * from USER_TAB_PARTITIONS 

--显示子分区信息 显示数据库所有组合分区表的子分区信息: 
select * from DBA_TAB_SUBPARTITIONS 

--显示当前用户可访问的所有组合分区表的子分区信息: 
select * from ALL_TAB_SUBPARTITIONS 

--显示当前用户所有组合分区表的子分区信息: 
select * from USER_TAB_SUBPARTITIONS 

--显示分区列 显示数据库所有分区表的分区列信息: 
select * from DBA_PART_KEY_COLUMNS 

--显示当前用户可访问的所有分区表的分区列信息: 
select * from ALL_PART_KEY_COLUMNS 

--显示当前用户所有分区表的分区列信息: 
select * from USER_PART_KEY_COLUMNS 

--显示子分区列 显示数据库所有分区表的子分区列信息: 
select * from DBA_SUBPART_KEY_COLUMNS 

--显示当前用户可访问的所有分区表的子分区列信息: 
select * from ALL_SUBPART_KEY_COLUMNS 

--显示当前用户所有分区表的子分区列信息: 
select * from USER_SUBPART_KEY_COLUMNS 

--怎样查询出oracle数据库中所有的的分区表 
select * from user_tables a where a.partitioned='YES' 

--删除一个表的数据是 
truncate table table_name; 

--删除分区表一个分区的数据是 
alter table table_name truncate partition p5;

分享到:
评论

相关推荐

    Oracle表分区详解(优缺点)

    Oracle 表分区是一种高效的数据管理策略,用于处理大数据量的表,以提升查询性能和数据库的可维护性。本文将详细介绍Oracle表分区的概念、作用、优缺点,以及各种类型的分区和操作方法。 首先,理解表空间和分区表...

    sqlServer数据库大表分区方案

    ### SQL Server 大表分区方案详解 #### 一、大表分区条件 在数据库管理过程中,随着业务数据的不断增长,单个表的数据量可能会变得非常庞大,这不仅会导致数据库性能下降,还会影响数据处理效率。为了有效解决这些...

    利用kettle自动创建oracle表分区

    "利用Kettle自动创建Oracle表分区" 在本篇文章中,将会介绍如何使用Kettle自动创建Oracle表分区。Oracle表分区是一种非常重要的数据库优化技术,它可以将大型表分割成多个小的独立表,从而提高查询效率和数据管理...

    oracle表分区详解

    ### Oracle表分区详解 #### 一、概述 Oracle数据库中的表分区是一种高级组织技术,它通过将表的大数据集划分为较小的、更易于管理的部分(即分区),从而提高查询性能和可管理性。表分区可以按照不同的策略进行...

    查看sqlserver表分区数据分布

    ### 查看SQL Server表分区数据分布 在SQL Server中,为了提高大型数据库的管理效率与查询性能,常常会采用表分区技术。通过合理地将一个表的数据分散到多个物理文件或文件组上,可以显著提升数据处理的速度。本文将...

    Oracle表分区 建表空间 创建用户

    ### Oracle表分区、建表空间与用户管理 #### 一、表空间的创建与管理 在Oracle数据库中,**表空间**(Tablespace)是物理存储的逻辑容器,它由一个或多个数据文件组成。创建一个新的表空间对于数据库的管理非常重要...

    oracle表分区详细讲解

    ### Oracle表分区详解 #### 一、表空间与分区表概念 **表空间**:在Oracle数据库中,表空间是一个或多个数据文件的集合。所有数据对象(如表、索引等)都存放在特定的表空间中。由于主要存放的是表,因此被称为...

    ORACLE大表分区

    支持自动ORACLE大表分区: 版本进度: 31. 20110420 V2.2 支持任意表任意时间字段分区 以下为安装部署部分: 1.分区相关脚本部署执行顺序,安装前请确保该用户拥有管理员权限, 同时请执行GRANT CREATE ANY TABLE ...

    表分区及物化视图

    orace表分区及物化视图 进一步了解oracle表分区技术及物化视图技术应用

    SQL Server 表分区操作详解

    SQL Server 表分区操作详解 SQL Server 表分区操作是数据库性能优化的重要一步骤。通过将表格分区到独立的文件组中,可以提高数据库的并行处理性能,从而优化查询性能。建立分区表需要创建文件组,而创建多个文件组...

    数据库表分区工具1.2

    数据库表分区是数据库管理系统中一种优化查询性能和管理大量数据的技术。它将一个大表分成多个逻辑上相连的部分,每个部分存储在不同的物理位置。这样做可以提高查询速度,特别是对于那些涉及大量数据的操作,比如全...

    5、ClickHouse查看数据库容量、表的指标、表分区、数据大小等

    本篇文章主要介绍了如何在ClickHouse中查看数据库容量、表的指标、表分区以及数据大小等关键信息。 一、查看数据库容量 要查看ClickHouse数据库的总容量,可以查询`system.parts`系统表。以下查询返回每个表的总行...

    oracle数据表分区知识

    ### Oracle 数据表分区详解 #### 一、分区表理论知识 Oracle 提供了表分区功能以支持非常大型的数据库(VLDB)。通过分区技术,可以根据指定的分区键将数据分散到不同的物理位置,从而实现更高效的数据管理和查询...

    PostgreSQL表分区和子表及删除所有的数据库表.zip

    PostgreSQL表分区和子表及删除所有的数据库表 最近需求要求统计DNS近7天每天的解析情况。数据量相对大,所以我这边对表进行分区。 对每天的数据进行分区存储。主表只存储近7天的数据,7天之前的数据删掉。所以我...

    oralce数据库表分区介绍

    Oracle数据库中的表分区是一种优化大型数据表查询性能的技术,它将一个大表划分为多个较小、更易管理的部分,每个部分称为一个分区。通过分区,可以显著提高数据的存储、检索和维护效率。以下是关于Oracle数据库表...

    Oracle大表分区的技术

    Oracle大表分区是一种高效的数据管理策略,用于处理大型数据集,提高查询性能并简化数据库维护。在Oracle数据库系统中,分区技术允许将一个大表分解为较小、更易管理的部分,每个部分称为一个分区。这样做有多种好处...

    Oracle表分区详解

    Oracle数据库中的表分区是数据库管理的一种高级技术,它允许我们将大型表分解成更小、更易管理和查询的部分,从而提高数据存储和检索的效率。在本文中,我们将深入探讨Oracle表分区的各个方面,包括其重要性、类型、...

    PostgreSQL表分区的所有表结构和表分区及触发器.zip

    从这里可以看出PostgreSQL表分区很复杂,程序员要多写点代码才能实现表分区。比如要创建子表,继承父表。给子表增加约束。通过作用于主表的触发器,把主表的修改重定向到适当的分区表等工作,分区的创建和管理都需要...

Global site tag (gtag.js) - Google Analytics