`
yupengcc
  • 浏览: 138565 次
  • 性别: Icon_minigender_1
  • 来自: 重庆
社区版块
存档分类
最新评论

数据库分区

阅读更多

来自

http://www.iteye.com/problems/67953

 

此文从以下几个方面来整理关于分区表的概念及操作: 
        1.表空间及分区表的概念 
        2.表分区的具体作用 
        3.表分区的优缺点 
        4.表分区的几种类型及操作方法 
        5.对表分区的维护性操作. 
(1.) 表空间及分区表的概念 
表空间: 
  是一个或多个数据文件的集合,所有的数据对象都存放在指定的表空间中,但主要存放的是表, 所以称作表空间。 

分区表: 
当表中的数据量不断增大,查询数据的速度就会变慢,应用程序的性能就会下降,这时就应该考虑对表进行分区。表进行分区后,逻辑上表仍然是一张完整的表,只是将表中的数据在物理上存放到多个表空间(物理文件上),这样查询数据时,不至于每次都扫描整张表。 

( 2).表分区的具体作用 
Oracle的表分区功能通过改善可管理性、性能和可用性,从而为各式应用程序带来了极大的好处。通常,分区可以使某些查询以及维护操作的性能大大提高。此外,分区还可以极大简化常见的管理任务,分区是构建千兆字节数据系统或超高可用性系统的关键工具。 

分区功能能够将表、索引或索引组织表进一步细分为段,这些数据库对象的段叫做分区。每个分区有自己的名称,还可以选择自己的存储特性。从数据库管理员的角度来看,一个分区后的对象具有多个段,这些段既可进行集体管理,也可单独管理,这就使数据库管理员在管理分区后的对象时有相当大的灵活性。但是,从应用程序的角度来看,分区后的表与非分区表完全相同,使用 SQL DML 命令访问分区后的表时,无需任何修改。 

什么时候使用分区表: 
1、表的大小超过2GB。 
2、表中包含历史数据,新的数据被增加都新的分区中。 

(3).表分区的优缺点 
表分区有以下优点: 
1、改善查询性能:对分区对象的查询可以仅搜索自己关心的分区,提高检索速度。 
2、增强可用性:如果表的某个分区出现故障,表在其他分区的数据仍然可用; 
3、维护方便:如果表的某个分区出现故障,需要修复数据,只修复该分区即可; 
4、均衡I/O:可以把不同的分区映射到磁盘以平衡I/O,改善整个系统性能。 

缺点: 
分区表相关:已经存在的表没有方法可以直接转化为分区表。不过 Oracle 提供了在线重定义表的功能。 

(4).表分区的几种类型及操作方法 
一.范围分区: 
范围分区将数据基于范围映射到每一个分区,这个范围是你在创建分区时指定的分区键决定的。这种分区方式是最为常用的,并且分区键经常采用日期。举个例子:你可能会将销售数据按照月份进行分区。 
当使用范围分区时,请考虑以下几个规则: 
1、每一个分区都必须有一个VALUES LESS THEN子句,它指定了一个不包括在该分区中的上限值。分区键的任何值等于或者大于这个上限值的记录都会被加入到下一个高一些的分区中。 
2、所有分区,除了第一个,都会有一个隐式的下限值,这个值就是此分区的前一个分区的上限值。 
3、在最高的分区中,MAXVALUE被定义。MAXVALUE代表了一个不确定的值。这个值高于其它分区中的任何分区键的值,也可以理解为高于任何分区中指定的VALUE LESS THEN的值,同时包括空值。 
例一: 
假设有一个CUSTOMER表,表中有数据200000行,我们将此表通过CUSTOMER_ID进行分区,每个分区存储100000行,我们将每个分区保存到单独的表空间中,这样数据文件就可以跨越多个物理磁盘。下面是创建表和分区的代码,如下: 
CREATE TABLE CUSTOMER 

    CUSTOMER_ID NUMBER NOT NULL PRIMARY KEY, 
    FIRST_NAME  VARCHAR2(30) NOT NULL, 
    LAST_NAME   VARCHAR2(30) NOT NULL, 
    PHONE        VARCHAR2(15) NOT NULL, 
    EMAIL        VARCHAR2(80), 
    STATUS       CHAR(1) 

PARTITION BY RANGE (CUSTOMER_ID) 

    PARTITION CUS_PART1 VALUES LESS THAN (100000) TABLESPACE CUS_TS01, 
    PARTITION CUS_PART2 VALUES LESS THAN (200000) TABLESPACE CUS_TS02 

例二:按时间划分 
CREATE TABLE ORDER_ACTIVITIES 

    ORDER_ID      NUMBER(7) NOT NULL, 
    ORDER_DATE    DATE, 
    TOTAL_AMOUNT NUMBER, 
    CUSTOTMER_ID NUMBER(7), 
    PAID           CHAR(1) 

PARTITION BY RANGE (ORDER_DATE) 

  PARTITION ORD_ACT_PART01 VALUES LESS THAN (TO_DATE('01- MAY -2003','DD-MON-YYYY')) TABLESPACEORD_TS01, 
  PARTITION ORD_ACT_PART02 VALUES LESS THAN (TO_DATE('01-JUN-2003','DD-MON-YYYY')) TABLESPACE ORD_TS02, 
  PARTITION ORD_ACT_PART02 VALUES LESS THAN (TO_DATE('01-JUL-2003','DD-MON-YYYY')) TABLESPACE ORD_TS03 

例三:MAXVALUE 
CREATE TABLE RangeTable 

  idd   INT PRIMARY KEY , 
  iNAME VARCHAR(10), 
  grade INT  

PARTITION  BY  RANGE (grade) 

      PARTITION  part1 VALUES  LESS  THEN (1000) TABLESPACE  Part1_tb, 
      PARTITION  part2 VALUES  LESS  THEN (MAXVALUE) TABLESPACE  Part2_tb 
); 

二.列表分区: 
该分区的特点是某列的值只有几个,基于这样的特点我们可以采用列表分区。 
例一 
CREATE TABLE PROBLEM_TICKETS 

    PROBLEM_ID   NUMBER(7) NOT NULL PRIMARY KEY, 
    DESCRIPTION  VARCHAR2(2000), 
    CUSTOMER_ID  NUMBER(7) NOT NULL, 
    DATE_ENTERED DATE NOT NULL, 
    STATUS       VARCHAR2(20) 

PARTITION BY LIST (STATUS) 

      PARTITION PROB_ACTIVE   VALUES ('ACTIVE') TABLESPACE PROB_TS01, 
      PARTITION PROB_INACTIVE VALUES ('INACTIVE') TABLESPACE PROB_TS02 
例二 
CREATE  TABLE  ListTable 

    id    INT  PRIMARY  KEY , 
    name  VARCHAR (20), 
    area  VARCHAR (10) 

PARTITION  BY  LIST (area) 

    PARTITION  part1 VALUES ('guangdong','beijing') TABLESPACE  Part1_tb, 
    PARTITION  part2 VALUES ('shanghai','nanjing')  TABLESPACE  Part2_tb 
); 


三.散列分区: 
这类分区是在列值上使用散列算法,以确定将行放入哪个分区中。当列的值没有合适的条件时,建议使用散列分区。 
散列分区为通过指定分区编号来均匀分布数据的一种分区类型,因为通过在I/O设备上进行散列分区,使得这些分区大小一致。 
例一: 
CREATE TABLE HASH_TABLE 

  COL NUMBER(8), 
  INF VARCHAR2(100) 

PARTITION BY HASH (COL) 

  PARTITION PART01 TABLESPACE HASH_TS01, 
  PARTITION PART02 TABLESPACE HASH_TS02, 
  PARTITION PART03 TABLESPACE HASH_TS03 

简写: 
CREATE TABLE emp 

    empno NUMBER (4), 
    ename VARCHAR2 (30), 
    sal   NUMBER 

PARTITION BY  HASH (empno) PARTITIONS 8 
STORE IN (emp1,emp2,emp3,emp4,emp5,emp6,emp7,emp8); 

hash分区最主要的机制是根据hash算法来计算具体某条纪录应该插入到哪个分区中,hash算法中最重要的是hash函数,Oracle中如果你要使用hash分区,只需指定分区的数量即可。建议分区的数量采用2的n次方,这样可以使得各个分区间数据分布更加均匀。 

四.组合范围散列分区 
这种分区是基于范围分区和列表分区,表首先按某列进行范围分区,然后再按某列进行列表分区,分区之中的分区被称为子分区。 
CREATE TABLE SALES 

PRODUCT_ID VARCHAR2(5), 
SALES_DATE DATE, 
SALES_COST NUMBER(10), 
STATUS VARCHAR2(20) 

PARTITION BY RANGE(SALES_DATE) SUBPARTITION BY LIST (STATUS) 

   PARTITION P1 VALUES LESS THAN(TO_DATE('2003-01-01','YYYY-MM-DD'))TABLESPACE rptfact2009 
          ( 
              SUBPARTITION P1SUB1 VALUES ('ACTIVE') TABLESPACE rptfact2009, 
              SUBPARTITION P1SUB2 VALUES ('INACTIVE') TABLESPACE rptfact2009 
          ), 
   PARTITION P2 VALUES LESS THAN (TO_DATE('2003-03-01','YYYY-MM-DD')) TABLESPACE rptfact2009 
          ( 
              SUBPARTITION P2SUB1 VALUES ('ACTIVE') TABLESPACE rptfact2009, 
              SUBPARTITION P2SUB2 VALUES ('INACTIVE') TABLESPACE rptfact2009 
          ) 


五.复合范围散列分区: 
这种分区是基于范围分区和散列分区,表首先按某列进行范围分区,然后再按某列进行散列分区。 
create table dinya_test 

transaction_id number primary key, 
item_id number(8) not null, 
item_description varchar2(300), 
transaction_date date 

partition by range(transaction_date)subpartition by hash(transaction_id)  subpartitions 3 store in (dinya_space01,dinya_space02,dinya_space03) 

     partition part_01 values less than(to_date(‘2006-01-01’,’yyyy-mm-dd’)), 
     partition part_02 values less than(to_date(‘2010-01-01’,’yyyy-mm-dd’)), 
     partition part_03 values less than(maxvalue) 
); 

分享到:
评论

相关推荐

    Oracle数据库分区管理.docx

    Oracle数据库分区管理是Oracle数据库系统中的一项高级特性,旨在优化大规模数据存储和处理的性能、可管理和可用性。自Oracle 8.0引入以来,这一技术不断演进,特别是在Oracle Database 11g 第2版中,它变得更加用户...

    MySQL数据库分区技术

    MySQL数据库分区技术,解决多并发问题,详细描述分区流程及操作步骤

    Oracle_数据库分区技术经验分享

    Oracle_数据库分区技术经验分享 很不错 讲的比较深入 很高端的

    深入解析Oracle与MySQL在数据库分区方面的显著差异

    数据库分区是管理大型数据库和提高查询性能的有效手段。Oracle和MySQL作为两款主流的数据库管理系统,在数据库分区方面各有特点和优势。本文将详细探讨Oracle与MySQL在数据库分区方面的不同之处,包括分区类型、创建...

    添加数据库分区.zip

    在SQL Server中,数据库分区是优化大型数据表性能的有效手段,尤其当表中存储的数据量达到百万甚至亿级时。数据库分区将一个大表逻辑上划分为多个更小、更易管理的部分,每个部分称为一个分区。这允许数据库管理系统...

    数据库分区与分片技术详解

    为了解决这一挑战,数据库分区(Partitioning)和分片(Sharding)技术应运而生。这两种技术都旨在通过分散数据来提高性能和可扩展性,但它们的实现方式和应用场景有所不同。 数据库分区和分片都是解决大数据和高...

    DB2 数据库分区的介绍

    ### DB2 数据库分区特性 (DPF) 的详细介绍 #### 一、DB2 数据库分区的概念与需求背景 **DB2 数据库分区**(Database Partitioning Feature, DPF)是IBM为满足大型数据库处理需求而设计的一项关键技术。随着企业数据...

    SQL数据库分区与镜像:技术对比与应用

    数据库分区和镜像是数据库管理中的两个关键领域,它们对于优化性能和保护数据安全起着至关重要的作用。通过合理地使用分区技术,可以显著提升数据库的可维护性和性能。同时,通过实施有效的镜像策略,可以确保数据的...

    深入解析:SQL数据库分区与性能监控的艺术

    本文将深入探讨SQL数据库分区的概念、策略、操作以及性能监控的方法和工具,并通过实际代码示例,展示如何通过分区和监控提升数据库的性能和可维护性 。 通过合理地设计分区策略和实施有效的性能监控,可以显著提升...

    SQL数据库分区与镜像:技术对比与应用策略

    数据库分区和镜像是数据库管理中的两个关键领域,它们对于优化性能和保护数据安全起着至关重要的作用。通过合理地使用分区技术,可以显著提升数据库的可维护性和性能。同时,通过实施有效的镜像策略,可以确保数据的...

    SQL数据库分区与性能调优:技术与应用深度解析

    数据库分区和性能调优是提高数据库性能的两种重要手段。分区通过分割数据来优化特定查询的性能,而性能调优则关注整个数据库系统的性能表现。在实际应用中,应根据具体的业务需求、数据访问模式和系统资源来选择合适...

    SQL数据库分区与审计:技术对比与应用策略

    数据库分区和审计是数据库管理中的两个关键领域,它们对于优化性能和保护数据安全起着至关重要的作用。通过合理地使用分区技术,可以显著提升数据库的可维护性和性能。同时,通过实施有效的审计策略,可以确保数据的...

    SQL中的数据库分区与存储过程:技术解析与应用实践

    本文将详细探讨SQL中的数据库分区与存储过程的区别、应用场景及代码示例。 数据库分区和存储过程是两种强大的技术,它们可以帮助数据库管理员和开发者优化数据库性能和数据处理效率。分区通过逻辑上分割数据来提升...

    SQL中的数据库分区与批处理技术:深入解析与应用

    本文将详细探讨SQL中的数据库分区与批处理的区别、应用场景及代码示例。 数据库分区和批处理是两种强大的技术,它们可以帮助数据库管理员和开发者优化数据库性能和数据处理效率。分区通过逻辑上分割数据来提升查询和...

    Oracle数据库分区优化技术研究与应用.pdf

    "Oracle数据库分区优化技术研究与应用.pdf" Oracle数据库分区优化技术是指通过将大型数据库对象分解为多个小的、易于管理的实体,以提高数据库性能、可用性和维护性的一种技术。该技术可以解决大型数据库对象管理...

    SQL数据库分区与注入攻击:技术对比与应用策略

    数据库分区和SQL注入攻击是数据库管理中的两个关键领域,它们对于优化性能和保护数据安全起着至关重要的作用。通过合理地使用分区技术,可以显著提升数据库的可维护性和性能。同时,通过实施有效的安全措施,可以...

    DB2 数据库分区特性(DPF)

    DB2数据库分区特性(DPF)是DB2数据库中一种重要的技术,通过该技术可以将数据分散存储在不同的物理分区上,同时保证数据的一致性和完整性,从而提升数据库的性能和可伸缩性。下面是关于DB2数据库分区特性(DPF)的...

    SQL数据库分区与安全性:技术对比与应用策略

    数据库分区和安全性是数据库管理中的两个关键领域,它们对于优化性能和保护数据安全起着至关重要的作用。通过合理地使用分区技术,可以显著提升数据库的可维护性和性能。同时,通过实施有效的安全措施,可以确保数据...

    深入理解SQL数据库分区与用户权限管理

    数据库分区和用户权限管理是两种强大的工具,它们可以帮助数据库管理员提高性能、简化数据管理和优化存储使用。理解它们之间的区别和适用场景对于有效地使用这些工具至关重要。通过合理地使用分区和用户权限管理,...

    SQL数据库分区与角色管理:深入理解与应用

    本文将详细探讨数据库分区与角色的区别、应用场景以及如何在实际环境中有效利用这两种技术。 数据库分区和角色是两种强大的工具,它们可以帮助数据库管理员提高性能、简化数据管理和优化存储使用。理解它们之间的...

Global site tag (gtag.js) - Google Analytics