概述
我们无论使用哪种数据库,无论怎样设计数据库,我想都会遵从一个原则:数据安全性和性能高效这两个主要方面,但是关于这两个方面的话题太多,在这里就不一 一陈述,我只是从数据库物理分布设计方面和大家一起简单的探讨一下。因为数据库良好的物理分布设计也是对数据安全性和性能高效影响比较大, 就象我们在建大楼之前一定要先打好地基一样。
現实中我们在应用各种不同数据库的时候,往往会忽略数据库的物理布局,只有在数据库性能遇到问题的时候才去考虑,但这是得不偿失的,这样一来不仅会导致与 设计相关的问题出现,而且会影响性能的调整效果,所以我们在创建数据库之前先进行规划数据库的物理布局也是很必要的,这也符合人们常说的”磨刀不误砍柴 工”的道理。下面我就以Oracle为例从优化操作系统、磁盘布局优化和配置、数据库初始化参数的选择、设置和管理内存、设置和管理CPU、设置和管理表空间、设置和管理回滚段、设置和管理联机重做日志、设置和管理归档重做日志、设置和管理控制文件等几个方面作以陈述。
一. 优化操作系统
为了获得最佳的服务器性能, 对操作系统的优化也是很必要的, 因为操作系统性能问题通常会涉及到进程管理、内存管理、调度等,所以用户需要确保有足够的I/O带宽、CPU的处理能力、交换空间来尽可能的降低系统时 间。如果应用程序在缓冲区出现过多的”忙”等待, 那么系统调用的进程将会增加, 虽然可以通过优化SQL语句等方法来降低调用的数目,但是这也是治病不治根的。用户可以启动Oracle的初始化参数timed_statistics来 增加系统调用的数目, 反之如果关闭此参数,那么系统调用的数目也会减少。操作系统的缓存和Oracle自己的缓存管理是不相冲突的, 虽然它能消耗一定的资源, 但是它对性能还是有一定好处的, 因为一般所有数据库的I/O需要通过系统文件缓存来访问文件存储器。
Oracle的操作可能会用到许多的进程(有的系统叫线程), 所以用户应该确保所有Oracle的进程、后台进程、用户进程具有相同的优先级, 否则就会产生恶化的现象, 导致高优先级的进程等待低优先级的进程处理完毕释放出CPU资源后再处理, 更不能将Oracle的后台进程绑定到CPU中, 这样一来也会导致被绑定的进程被CPU资源饿死。
比较好的是有些操作系统提供有操作系统资源管理器(Operating System Resource Manager), 通过它可以对系统资源访问划分优先级来降低峰值负载模式的影响,来实现多种管理策略和方法,控制用户资源的访问,限制用户资源的可消耗量。
二.磁盘布局优化和配置
在大多数产品数据库应用中,数据库文件一般都放在磁盘上,因此磁盘的良好使用和布局也是很重要的。磁盘布局的目标是:磁盘性能是不能阻碍实现数据库性能, 数据库磁盘必须专用于数据库文件,否则非数据库将会影响到该数据库,且这种影响是不可预测的; 系统硬件和镜像必须满足恢复和性能的要求,数据文件大小和I/O不能超过磁盘的大小和I/O,数据库一定是可以恢复的,必须使后台进程之间的竞争最小化。 在规划硬盘配置时也要注意:首先所用的磁盘容量,有时用多个容量小的磁盘比用一个大的磁盘效果更好,因为可以进行更高级的并行I/O操作; 其次磁盘的速度,如反应时间和寻道时间都将影响I/O的性能, 可以考虑使用合适的文件系统作为数据文件; 再者使用合适的RAID。
RAID(Redundant Arrays of Inexpensive Disks)廉价冗余阵列可以改善数据的可靠性,而I/O的性能又取决于RAID配置的方式:RAID1可以提供比较好的可靠性和较快的读取速度,但写的 代价比较大,所以不适合频繁写的应用;RAID0+1在原RAID1的基础上读取的速度更快,所以这也是大家常会选择的方式;RAID5可以提供比较好的 可靠性,有顺序的读操作比较适合这种方式,但性能会受到影响,对于写操作频繁的应用也不适合这种。对于该选择那种方式不能一概而论,要根据具体的情况而 定。
有些应用软件先天性受到磁盘的I/O限制, 所以在设计的时候应尽量使Oracle的性能不受I/O的限制, 所以在设计一个I/O系统时要考虑以下的数据库需要: 存储磁盘的最小字节; 可用性, 如24X7, 9X5; 性能如I/O的输出和响应时间。决定Oracle文件的I/O统计信息可以来查询下列: 物理读数量(V$filestat.phyrds)、物理写数量(V$filestat.phywrites)、平均时间, I/O=物理读+物理写。而I/O的平均数量=(物理读+物理写)/共用秒数), 估计这个数据对于新系统是有用的, 可以查询出新应用程序的I/O需求与系统的I/O能力是否匹配以便及时调整。
三.创建数据库初始化参数的选择
管理数据库的第一阶段就是初始化数据库的创建,尽管可以在数据库创建好以后再来调整性能,但是有些参数是不能修改的或很难修改,比 如:Db_block_size、Db_name、Db_domain、Compatible、Nls_language、 Nls_characterset、Nls_nchar_characterset。
Db_block_size参数决定Oracle数据库块的大小,一般可以选择的范围是2K、4K、8K、16K、32K,使用下一个较大值数据库块大小 的效果一般可以集中查询中性能提高50%。但是按常规来说对于一般服务器不提倡把这个值设的很大,小型机除外,因为这样一来数据库块中将会有更多的行,在 数据库维护期间发生块级竞争的可能性比较大,避免这种竞争的办法是在表级和索引级增大Freelists、maxtrans和initrans的设置值, 通常Freelists设置为大于4会带来更多的好处。
Db_name该参数指定一个数据库标识符,一般在Create Database中指定的名称,改参数是可选的(在Oracle9i实时应用集群时是必选的,多个实例有相同的参数值),但是建议在Create Database之前设置它,如果不指定则要出现在Startup或Alter Database mount命令中。
Db_domain该参数指定全局数据库名的扩展部分,在Oracle9i实时应用集群时是必选的,多个实例有相同的参数值。
Compatible该参数指定Oracle服务器维护版本的兼容性,保证与早期的版本向下兼容的时候允许用户使用新的版本,在Oracle9i实时应用集群时是必选的,多个实例有相同的参数值。
Nls_language和Nls_characterset及Nls_nchar_characterset三个参数是数据库的字符集参数,在数据库创建完成后一般也不能改变或很难改变,所以在创建数据库的时候要先设置好。
四.设置和管理内存
Oracle使用共享内存来管理其内存和文件结构,Oracle常使用的内存结构如下:
系统全局区(System Global Area,SGA),SGA随着不同的环境而不同,没有一种普通的最佳方案,我们在设置它直前要先考虑以下的几个方面:物理内存多大;操作系统是那种及占 多大的内存,数据库系统是文件系统还是裸设备;数据库运行的模式。SGA包括:Fixed size、Variable size、Database Buffers、Redo Buffers。SGA占有物理内存的比例没有严格的规定,只能遵从一般的规则:SGA占据物理内存的40%--60%左右。如果通过直观的公式化来表达 则为:OS使用内存+SGA+并发进程数*(Sort_area_size+Hash_area_size+2M)<0.7RAM,这个公式也只是 参考,不必拘于此,实际情况可以自由发挥。初始化参数文件中的一些参数对SGA的大小有决定性的影响。参数Db_block_Buffers(SGA中存 储区高速缓存的缓冲区数目),参数Shared_pool_size(分配给共享SQL区的字节数),是SGA大小的主要影响者。Database Buffers 参数是SGA大小和数据库性能的最重要的决定因素。该值较高,可以提高系统的命中率,减少I/O。每个缓冲区的大小等于参数Db_block_size的 大小。Oracle数据库块以字节表示大小。Oracle SGA区共享池部分由库高速缓存、字典高速缓存及其他一些用户和服务器会话信息组成,共享池是最大的消耗成分。调整SGA区各个结构的大小,可以极大地提 高系统的性能。
数据块缓冲缓存区(Data block buffers cache),Data buffers在8i中是Db_block_buffers*Db_block_size,9i中用Db_cache_size来代替这个参数。在内存的 配置中把别的参数设置完成后,应该把能给的都给Data buffers。Oracle 在运行期间向数据库高速缓存读写数据,高速缓存命中表示信息已在内存中,高速缓存失败意味着Oracle必需进行磁盘I/O。保持高速缓存失败率最小的关 键是确保高速缓存的大小。Oracle8i中初始化参数Db_block_buffers控制数据库缓冲区高速缓存的大小。可通过查询V$sysstat 命中率,以确定是否应当增加Db_block_buffers的值。
SELECT name,value FROM V$sysstat
WHERE name in (’dbblock gets’,’consistent gets’,’physical reads’);
通过查询结果命中率=1-physical reads/(dbblock gets+consistent gets) 如果命中率<0.6~0.7,则应增大Db_block_buffers。
字典缓存区(Dictionary CACHE),数据字典缓存区的大小由数据库内部管理,大小由参数Shared_pool_size来设置。数据字典高速缓存包括了有关数据库的结构、用 户、实体信息等。数据字典的命中率对系统有很大的影响。命中率的计算中,getmisses 表示失败次数,gets表示成功次数。查询V$ROWCACHE表:
SELECT (1-(SUM(getmisses)/(SUM(gets)+SUM(getmisses))))*100
FROM V$rowcache;
如果该值>90%,说明命中率合适。否则,应增大共享池的大小。
重做日志缓冲区(Read log buffer),下面将有陈述,在此就不做说明。
SQL共享池(Shared pool size),该共享池包括包括执行计划及针对数据库执行SQL语句的语法分析用的,在第二次运行相同的SQL语句时可用SQL中的语法分析来加快执行速 度。如果它太小,语句会连续不断地再装入到库缓存区,从而影响性能。可以通过Alter system命令来修改此参数,9I以后的版本可以动态地修改其大小。
大池(Large pool size),是一个可选的内存区。如果选择可对数据库象备份/恢复这些大的操作提高性能。如果不选择此参数,则系统会使用共享池。
JAVA池(Java pool size),由其名字而言可知,是为满足JAVA命令语法分析的需求。在UNIX系统中如果区组的大小为4MB,则默认大小应该为24M,如果区组大小为 16MB,则默认大小为32M。如果数据库没有使用JAVA,则保持在10M—20M足够。
多缓冲区池(Multiple buffer pools),可以使用多缓冲区池把大数据集与应用的剩余部分分开,以减少它们争夺缓存区内相同资源的可能性,创建时需要在初始化参数中设定其大小。
程序全局区(Program global area,PGA)是Oracle的一个私有的内存区,9i以后的版本中,如果Workarea_size_policy=auto,则所有的会话共用一 块内存,该内存在参数Pga_aggregate_target设置,它的一个好的初始设置是:对于一个OLTP系统 Pga_aggregate_target=(totalL_mem*80%)*20%;对于一个DSS系统Pga_aggregate_target= (total_mem*80%)*50%。这里的total_mem是物理内存。在调整Pga_aggregate_target参数时,下面的几个动态 视图会有帮助的:V$sysstat和 V$sesstat;V$sql_workarea_active;V$pgastat;V$sql_workarea; V$process。
五.设置和管理CPU
在设置和安装数据库的过程中,基本不用对CPU做什么配置的,系统会自动默认的,但是在管理过程中我们可以利用操作系统监控工具来监控CPU的状况。例如 在UNIX系统中,可以运行sar–u的工具来检查整个系统使用CPU的水平。其统计信息包括:用户时间、系统时间、空闲时间、I/O等待时间。在正常工 作负载的情况下,如果空闲时间和I/O等待时间接近于0或少于5%,那就表示CPU的使用存在问题。
对于Windows系统可以通过性能监视器(Performance monitor)来检查CPU的使用状况可以提供以下信息:处理器时间、用户时间、特权时间、中断时间、DPC时间。
如果CPU的使用存在问题,则可以通过以下的方式来解决:优化系统和数据库;增加硬件的能力;对CPU资源分配进行划分优先级,Oracle数据库资源管理器(Database Resource Manager)负责在用户和应用程序之间分配和管理CPU资源。
六.设置和管理表空间
数据库文件之间的I/O竞争是数据库之大忌, 所以对数据库规划之前要先对数据文件的I/O进行初步的评估, 通常情况下, 应用的产品数据库表所在的表空间会很活跃, 索引表空间和数据字典之类的表空间也很活跃的, 对于事物比较频繁的应用中, 重做表空间也很活跃的, 所以对不同类型的数据库其数据文件的I/O竞争也会略有不同的, 但是基本上还是遵从以下的原则比较好: 应用的表和索引通常应该被分配或分区到多个表空间中, 以降低单个数据文件的I/O, 最好把每一种功能相同的区域对象建立单独的表空间; 没有理由把除数据字典表和系统回退段外的其他东西放到系统表空间中, 要把能移出系统表空间的对象都移出; 索引段不应该和相关表放在同一表空间中, 因为他们在数据管理和查询时会产生很多的并发I/O; 临时表空间是用以存储大量的排序, 所以其它的应用对象是不能放在临时表空间。
以上讲的是数据库文件分布的原理, 原理归原理, 事实应用中, 我们还是以经验来设置分布比较好些, 当然在没有经验之前还是参考原理以致于不会走弯路。
数据库和表空间可以是一对多的关系,表空间和数据文件也可以是一对多的关系,数据文件和数据对象也可以是一对多的关系。当创建一个数据对象(如表或索引) 时,可以通过默认值或特殊命令将其赋予一个表空间,这样就会在该表空间中创建一个段(Segment)来存储与该对象有关的数据。一个段由一些称作区间 (Extent,一组连续的Oracle块)的区段组成,一但现有的区段不能存储数据时,这个段就要获得另一个区间来支持将数据插入到对象中。因此这个段 所使用的空间由它的参数决定的,这些参数可以在创建时指定,也可以在以后更改。如在Create table,Create index,Create cluster,Create rollback segment命令中没有指定存储参数,则数据库会默认它存储所在的表空间的参数,这些参数有 initial,next,pctincrease,maxextents,minextents等。在创建后不能修改initial和 minextents值,每个表空间的存储参数默认值可以在Dba_tablespaces视图中查询出来。
磁盘I/O是系统性能的瓶颈,解决好磁盘I/O,可明显提高性能。通过查询V$filestat可以知道每个物理文件的使用频率(phyrds表示每个数据文件读的次数,phywrts表示每个数据文件写的次数)
SELECT name,phyrds,phywrts FROM V$datafile df,V$filestat fs
WHERE df.file# =fs.file#;
对于使用频率较高的物理文件,可以采用以下策略: 将I/O尽可能平均分配在尽可能多的磁盘上;为表和索引建立不同的表空间;将数据文件与重做日志文件分离在不同的磁盘上;减少不经Oracle server的磁盘I/O。
如果大家没有经验的情况下不小心把数据文件规划的不恰当, 以致于产生了大量的I/O竟争现象, 那么就要根据上面的原则重新调整数据文件的分布, 以平衡数据文件之间的I/O竟争, 具体如何移动数据文件, 各种数据库的方法不尽相同, 但是基本的原理还是相同的,下面是针对Oracle8i如何移动数据文件的两种方法的举例(9i略有不同):
第一种方法﹕(Alter database)
关闭数据库-移动数据库文件-装载并改名-启动
- 浏览: 604436 次
- 性别:
- 来自: 深圳
文章分类
- 全部博客 (300)
- Web前端 (27)
- Java疑难 (60)
- 面试 (59)
- 汇编语言 (1)
- 计算机组成原理 (2)
- 操作系统 (3)
- 计算机网络 (6)
- C/C++疑难 (9)
- SSH (2)
- Web开发 (15)
- 故障 (3)
- 软件开发 (16)
- Portal开发 (1)
- 后台开发 (6)
- 数据库 (35)
- 设计模式 (4)
- 数据结构与算法 (4)
- Linux (3)
- 项目管理 (10)
- 多线程 (12)
- 嵌入式 (9)
- 网络编程 (4)
- 架构设计 (20)
- 软件工具技巧 (7)
- 并行并发 (4)
- 窗口编程 (7)
- 串口编程 (0)
- Flex (2)
- 协议 (1)
- 通讯方式 (4)
- 性能分析优化 (5)
- 测试相关 (4)
- 海量数据处理 (2)
- JAVA核心技术 (10)
- SOA (3)
- 攻略规划 (1)
- 爬虫/搜索 (2)
- 正则表达式 (1)
- A Comparison Of NoSQL Database Management Systems And Models (1)
最新评论
-
charles751:
分析的很好!但有一点:只要同步组合操作就可以了,不一定非要sy ...
Vector 是线程安全的? -
S346618898:
core Java中有一段:Vector类对自己的所有可修改方 ...
Vector 是线程安全的? -
code_cj:
基本上明白了.但执行顺是否应该是/etc/profile -& ...
profile bashrc bash_profile之间的区别和联系 -
xd2008ck:
各自有各自的场景吧楼主不要太激进了
Vector 是线程安全的? -
zwt2001267:
写的不错,赞一个
Vector 是线程安全的?
发表评论
-
sql 临时表
2013-08-27 00:14 1036在使用T-SQL编写触发器或者函数的时候,经常需要用到一个临 ... -
Mysql数据库优化
2013-05-17 11:18 11761.数据库的对象: 1)优化表的类型: 2) ... -
深入Java事务的原理与应用
2013-04-23 14:57 891一、什么是JAVA事务 通常的观念认为,事务仅与数据库 ... -
数据库设计——数据库生命周期
2013-04-22 14:51 963摘自http://www.cnblogs.com/DBFo ... -
NoSQL数据库笔谈
2013-04-22 14:40 862http://sebug.net/paper/databa ... -
MySQL分区性能初探
2013-04-22 09:18 968一, 分区概念 分区允许根据指定的 ... -
sql语句的执行顺序
2013-04-19 16:04 1058SQL语句的执行顺序才 ... -
数据库调优
2013-04-19 14:37 559“数据库调优”的事情,心想这不是DBA的事吗,但回答不好还是 ... -
聚簇索引和非聚簇索引
2013-04-19 14:20 1347聚簇索引和非聚簇索 ... -
数据库调优的方法
2013-04-19 11:48 1165源于http://www.51testing.com/htm ... -
使用复制来提升MySQL的高可用性和处理能力
2013-04-15 00:55 1035摘自http://www.linuxdiyf.c ... -
单键索引还是组合索引
2013-04-08 16:00 11417摘自http://book.51cto.com/a ... -
函数索引
2013-04-02 16:51 3278我们进行数据库检索优化的方法,通常是对特定条件列加索引,减少 ... -
Oracle Index 介绍
2013-04-02 16:46 887概述 索引在各种关系型数据库系统中都是举足轻重的组成部 ... -
位图索引
2013-04-02 15:54 962位图索引区别于传统B*树索引有两个结构特点:其一是叶子节点上 ... -
B树索引与位图索引
2013-04-02 15:05 2272一、 B树索引的缺陷 在实际工作中,B树索引是Ora ... -
海量数据处理之数据库索引及优化
2013-04-02 11:03 1125索引是对数据库表中 ... -
sql where 1=1和 0=1 的作用
2013-03-24 18:18 849where 1=1; 这个条件始终 ... -
count(0)
2013-03-24 18:13 1387select count(0) as user_to ... -
SQL中的CASE WHEN用法
2013-03-24 02:32 1438SQL中的CASE WHEN语句是经常要用到的, ...
相关推荐
ORACLE数据库物理分布设计 概述 我们无论使用哪种数据库,无论怎样设计数据库,我想都会遵从一个原则:数据安全性 和性能高效这两个主要方面,但是关于这两个方面的话题太多,在这里就不一 一陈述,我只是从数据库...
### 数据库物理设计及分区设计:关键知识点解析 #### 数据库物理设计概览 数据库物理设计是数据库设计过程中的一个重要阶段,它关注于如何在特定的数据库管理系统(DBMS)平台上高效存储和访问数据。在Oracle数据库...
表空间规划是物理设计的基础,它决定了数据如何分布在磁盘上,以及数据文件的大小、数量和增长方式。合理规划表空间可以优化I/O性能,减少碎片化,提高数据检索效率。 #### 数据库规划 数据库规划包含了数据库的...
数据库物理设计的六个方面是确定数据的存储结构、选择 DBMS、确定数据的物理分布、设计索引、设计数据的存取路径和物理设计的相关因素。物理设计的目标是为了提高数据库的性能、可靠性和安全性。 在数据库设计中,...
数据库物理设计涉及到多个方面,包括数据库的存储结构、索引设计、数据分布、存取路径等。 数据库设计的六个阶段是:需求分析、概念结构设计、逻辑结构设计、物理设计、数据库实施和数据库运行维护。物理设计是...
《ORACLE 数据库物理设计》一书主要探讨的是如何高效地构建、管理和优化Oracle数据库的物理结构,以适应不同环境和需求。Oracle数据库物理设计包括了对数据文件、磁盘空间、I/O优化以及安全性等多个方面的考虑。在...
数据库物理设计是数据库设计的重要组成部分,它关注的是数据库的存储结构、索引、数据分布等方面的设计。物理设计的目的是为了提高数据库的存储效率和查询效率,使数据库能够满足用户的各种需求。 数据库设计是一个...
数据库物理设计是数据库设计的第二步骤,涉及到数据库在磁盘上的物理存储方式。在物理设计阶段,我们需要确定数据库的物理存储结构,包括表空间、索引、日志文件等。 数据库分布 数据库分布是数据库设计的第三步骤...
数据库物理结构设计是数据库系统开发的关键环节,它决定了数据在硬件层面如何存储和访问,从而影响着数据库的性能、可靠性和效率。以下是对这一主题的详细阐述。 首先,数据库的物理结构指的是数据在物理设备(如...
### 数据库物理设计经验谈——深入解析关键知识点 #### 一、引言 数据库的物理设计对于确保数据的安全性和提高性能至关重要。本文将基于提供的标题、描述和部分内容,详细阐述数据库物理设计的重要方面,包括操作...
### 数据库物理设计知识点 #### 一、数据库物理设计概述 **数据库物理设计**是指针对特定硬件环境和软件环境下的数据库管理系统(DBMS),通过合理安排数据库的数据存储、索引组织、缓存策略等,以达到提高数据...
在本文档中,我们将对数据库设计进行详细的介绍,包括数据库设计的概要、数据库概念设计、数据库逻辑设计和数据库物理设计等方面。 1. 数据库设计概要 数据库设计是数据库系统的核心部分,涉及到数据库管理系统的...
2. 数据库设计:数据库设计包括需求分析、概念设计、逻辑设计和物理设计。需求分析需理解业务需求,概念设计将需求转化为实体关系图(ER图),逻辑设计是将ER图转化为关系模式,而物理设计则涉及表空间、索引、分区...
由于内存数据库受物理内存的限制,对数据节点的内存使用和数据分布设计要求更高。在分布式内存数据库中,数据分布策略是决定系统性能的关键因素之一。 数据分布分析主要关注在保证数据高可用性的前提下,如何高效地...
- 物理设计:考虑存储效率和查询性能,选择索引、分区等策略,将逻辑设计转化为具体的数据库结构。 3. **SQL语言**: - DDL(Data Definition Language):用于创建和修改数据库结构,如CREATE TABLE、ALTER ...
数据库重组是优化数据库物理存储的重要手段,它包括重新安排数据在磁盘上的分布、重建索引、调整块大小等,以适应数据的变化和查询模式的改变,从而提升系统性能。 总之,数据库物理存储是数据库系统高效运行的基础...
5. 数据库物理设计:对数据库的物理结构进行设计,包括数据存储区、索引设计等。 6. 数据库分布:对数据库的分布进行设计,包括数据存储区的分布、数据传输的分布等。 四、数据库设计报告文档模板的应用 数据库...
总结,Oracle数据库设计与优化是一个涉及多方面知识的复杂过程,包括但不限于物理结构设计、SQL优化、索引策略、存储过程使用、性能监控以及备份恢复策略。理解这些核心概念并灵活应用,将有助于构建高效、稳定且...
3.2 **数据库物理设计** 物理设计关注如何在特定的数据库管理系统(DBMS)上实现逻辑设计。这包括选择合适的数据类型、存储引擎、分区策略和存储格式。物理设计优化了数据的存储和访问速度,比如,通过合理设置...
物理结构设计关注的是数据库在实际存储设备上的表现形式,如何优化存储结构以提高查询效率,包括索引的选择、数据分布的调整等。 通过数据库设计工具的使用,学生可以更直观、更高效地完成上述设计步骤。现代数据库...