数据库表分区

80197675

浏览: 304727 次
性别:
来自: 北京

最近访客更多访客>>

一枕残梦千里殇灬

oppoc

xwzj

erpaoshouling

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

数据库

在业务系统中，随着业务量的增长及业务数据的增加带来的数据量的急剧增长，影响到查询及数据更新的速度，因此影响到用户的感知。为提高响应速度，提高用户的感知，我们一般会将数据库按照一定的规则进行分区，甚至可以按照特定的规则进行分表。分区时物理上将数据存储在多个文件中【文件可以在不同的磁盘中】，逻辑上是一个表【分区对用户透明，最终用户感觉不到分区的存在。】，而分表，不言而喻的就是将同类数据存于不同的表中，实际我们使用最多的是分区。
分区的优点
（1）与单个磁盘或文件系统分区相比，可以存储更多的数据【某些操作系统对于单个文件有大小限制】。
（2）很容易就能删除不用或者过时的数据【直接删除分区】。
（3）一些查询可以得到极大的优化【对分区对象的查询可以仅搜索自己关心的分区，提高检索速度。】。
（4）涉及到 SUM()/COUNT() 等聚合函数时，可以并行进行【各分区统计各分区的，最后合并】。
（5）均衡I/O 、IO吞吐量更大：可以把表的不同分区分配到不同的磁盘来平衡I/O改善性能，提高IO吞吐；。
（6）增强可用性：如果表的一个分区由于系统故障而不能使用，表的其余好的分区仍可以使用；
分区的创建及分区的分类
常用分区的类型
RANGE 分区：基于属于一个给定连续区间的列值，把多行分配给分区。

CREATE TABLE TF_USER( 
	CID INT UNSIGNED  NOT NULL AUTO_INCREMENT PRIMARY KEY
	NAME VARCHAR(30) NOT NULL DEFAULT ''
	PHONE VARCHAR(30) NOT NULL DEFAULT '')PARTITION BY 
	RANGE (CID) ( 
		PARTITION p0 VALUES LESS THAN (1000000) DATA DIRECTORY = '/data0/data' 
		INDEX DIRECTORY = '/data0/idx'
		PARTITION p1 VALUES LESS THAN (2000000) DATA DIRECTORY = '/data1/data' 
		INDEX DIRECTORY = '/data1/idx'
		PARTITION p2 VALUES LESS THAN (3000000) DATA DIRECTORY = '/data2/data' 
		INDEX DIRECTORY = '/data2/idx'
		PARTITION p3 VALUES LESS THAN MAXVALUE DATA DIRECTORY = '/data3/data' 
		INDEX DIRECTORY = '/data3/idx');

LIST 分区：类似于按RANGE分区，区别在于LIST分区是基于列值匹配一个离散值集合中的某个值来进行选择。

CREATE TABLE TF_USER( 
	CID INT UNSIGNED  NOT NULL AUTO_INCREMENT PRIMARY KEY
	NAME VARCHAR(30) NOT NULL DEFAULT ''
	PHONE VARCHAR(30) NOT NULL DEFAULT '')PARTITION BY 
	LIST (CID) ( 
		PARTITION p0 VALUES IN (0,1,2,3) DATA DIRECTORY = '/data0/data' 
		INDEX DIRECTORY = '/data0/idx'
		PARTITION p1 VALUES IN (4,5,6,7) DATA DIRECTORY = '/data1/data' 
		INDEX DIRECTORY = '/data1/idx'
		PARTITION p2 VALUES IN (8,9,10) DATA DIRECTORY = '/data2/data' 
		INDEX DIRECTORY = '/data2/idx');

HASH分区：基于用户定义的表达式的返回值来进行选择的分区，该表达式使用将要插入到表中的这些行的列值进行计算。

CREATE TABLE TF_USER( 
	CID INT UNSIGNED  NOT NULL AUTO_INCREMENT PRIMARY KEY
	NAME VARCHAR(30) NOT NULL DEFAULT ''
	PHONE VARCHAR(30) NOT NULL DEFAULT '')PARTITION BY 
	HASH  (CID) ( 
		PARTITION p1  DATA DIRECTORY = '/data0/data' 
		INDEX DIRECTORY = '/data0/idx'
		PARTITION p2  DATA DIRECTORY = '/data1/data' 
		INDEX DIRECTORY = '/data1/idx'
		PARTITION p3  DATA DIRECTORY = '/data2/data' 
		INDEX DIRECTORY = '/data2/idx');

组合分区：由以上两种组合

分区管理

（1）删除分区：

ALERT TABLE TF_USER DROP PARTITION p0;

（2）重建合并分区：

将原来的 p0,p1 分区合并起来，放到新的 p0 分区中

RANGE 分区重建

  ALTER TABLE TF_USER REORGANIZE PARTITION p0,p1 INTO (PARTITION p0 VALUES LESS THAN (4000000));

LIST 分区重

ALTER TABLE TF_USER REORGANIZE PARTITION p0,p1 INTO (PARTITION p0 VALUES IN(0,1,2,3,4,5,6,7));

（3）：新增分区

RANGE 分区新增

ALTER TABLE TF_USER ADD PARTITION (PARTITION p4 VALUES IN (11,12,13,14)DATA DIRECTORY = '/data3/data'INDEX DIRECTORY = '/data3/idx');

什么时候使用分区表

1、表的大小超过2GB。
2、表中包含历史数据，新的数据被增加都新的分区中。

分享到：

Oracle存储结构 | blog更新。。。

2013-03-20 15:33
浏览 1005
评论(0)
分类:数据库
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论