`

管理OCR与Voting Disk(原创)

 
阅读更多

Voting Disk 概述

Oracle Clusterware由2部分组成,分别是Voting Disk和 OCR。Voting Disk里面记录着节点成员的信息。如RAC数据库中有哪些节点成员,节点增加或者删除时也同样会将信息记录进来。Voting Disk必须存放在共享存储上,通常来说是存放在裸设备上。Voting Disk主要为了在出现脑裂时,决定那个Partion获得控制权,其他的Partion必须从集群中剔除。为了保证Voting Disk的安全,需要配置多个Voting Disk,Voting disk使用的是一种“多数可用算法”。当有多个Voting  disk时,则必须一半以上的Votedisk同时使用,Clusterware才能正常使用。 比如配置了4个Votedisk,坏一个Votedisk,集群可以正常工作,如果坏了2个,则不能满足半数以上,集群会立即宕掉,所有节点立即重启,所 以如果添加Votedisk,尽量不要只添加一个,而应该添加2个。Oracle建议Voting Disk的个数应该为奇数个,如 1、3、5个,每个Voting Disk的大小约为20MB。关于Voting Disk的更多内容,看参阅笔者的如下博客
http://czmmiao.iteye.com/blog/1577531

维护Voting Disk

注意:对Voting Disk的更改必须用root来进行,添加或删除Voting Disk都必须在crs资源关闭的情况下进行,同时即使在CRS关闭情况下仍然需要使用-force参数
查看Voting Disk

# ./crsctl query css votedisk
 0.     0    /dev/raw/raw2

备份Voting Disk
#dd if=/dev/raw/raw2 f=/home/oracle/voting_disk.bak
恢复Voting Disk
#dd if=/home/oracle/voting_disk.bak f=/dev/raw/raw2

添加和删除Voting Disk

# raw -qa
/dev/raw/raw1:  bound to major 8, minor 17
/dev/raw/raw2:  bound to major 8, minor 33
/dev/raw/raw3:  bound to major 8, minor 58

# ./crsctl stop crs
Stopping resources.
Successfully stopped CRS resources
Stopping CSSD.
Shutting down CSS daemon.
Shutdown request successfully issued.

# ./crsctl add css votedisk /dev/raw/raw4 -force
Now formatting voting disk: /dev/raw/raw4
CLSFMT returned with error [4].
failed 9 to initailize votedisk /dev/raw/raw4.

# ./crsctl add css votedisk /dev/raw/raw3 -force
Now formatting voting disk: /dev/raw/raw3
successful addition of votedisk /dev/raw/raw3.

# ./crsctl query css votedisk
 0.     0    /dev/raw/raw2
 1.     0    /dev/raw/raw4
 2.     0    /dev/raw/raw3
located 3 votedisk(s).
# ls -l /dev/raw/raw*
crw-rw---- 1 oracle oinstall   162, 1 Jan  1 20:19 /dev/raw/raw1
crw-rw---- 1 oracle oinstall   162, 2 Jan  1 20:18 /dev/raw/raw2
crw-rw---- 1 oracle oinstall   162, 3 Jan  1 20:22 /dev/raw/raw3
-rw-r--r-- 1 root   root     10240000 Jan  1 20:18 /dev/raw/raw4

可以看到在没有/dev/raw/raw4设备的情况下执行添加voting disk命令时,报错并在/dev/raw/目录下创建了raw4文件,我们必须删除该文件

# ./crsctl delete css votedisk /dev/raw/raw4 -force
successful deletion of votedisk /dev/raw/raw4.
# ls -l /dev/raw/raw*
crw-rw---- 1 oracle oinstall   162, 1 Jan  1 20:34 /dev/raw/raw1
crw-rw---- 1 oracle oinstall   162, 2 Jan  1 20:18 /dev/raw/raw2
crw-rw---- 1 oracle oinstall   162, 3 Jan  1 20:22 /dev/raw/raw3
-rw-r--r-- 1 root   root     10240000 Jan  1 20:18 /dev/raw/raw4
# rm -f /dev/raw/raw4
# ./crsctl query css votedisk
 0.     0    /dev/raw/raw2
 1.     0    /dev/raw/raw3
located 2 votedisk(s).

OCR概述

OCR 负责维护整个集群的配置信息,包括RAC以及Clusterware资源,包括的信息有节点成员、数据库、实例、服务、监听器、应用程序等。为了解决集群 的“健忘”问题,整个集群会有一份配置OCR,最多两分OCR,一个primary OCR和一个mirror OCR互为镜像,以防OCR的单点故障。关于“健忘”可以参阅笔者的

http://czmmiao.iteye.com/admin/blogs/1629166

ORACLE 把集群的配置文件放在共享存储上叫做OCR DISK。 节点通过OCR Process读写OCR。 但只有一个节点能够读写OCR DISK 叫OCR Master节点,其它节点通过本节点的OCR process 向master node的OCR process提交请求,由master OCR Process完成物理读写,并同步所有节点OCR cache中的内容。就OCR而言,每个集群都会有一个Master节点,这个节点一半来说是集群中生存时间最长的那个节点(生存时间最长也就意味着该节 点越稳定)。
我们在安装Clusterware的在选择OCR的存储位置时,如果选择"Normal Redundancy",则会存储两份相互镜像的OCR。如果选择"External Redundancy"则表明存储本身已经坐了冗余配置,不需要创建镜像OCR。该位置会记录在/etc/oracle/ocr.loc(Linux)或 /var/opt/oracle/ocr.loc(Solaris)中。
OCR存储的配置信息是以目录树的形式来记录一系列“键-值”对应信息 的。OCR记录着 CRS进程管理资源的所有配置信息,大小约为100MB。OCR key:有3个大分支,分别是SYSTEM.css,DATABASE 和CRS。每个分支下面又有许多小分支。这些记录的信息只能由root用户修改。 

由于 OCR的信息十分重要,Oracle会每4小时队其做一次备份,并且保留最后的3个备份,以及前一天、前一周的最后一个备份。这个备份由Master Node的CRSD进程完成,备份的默认位置为$CRS_HOME/crs/cdata/<cluster_name>目录下。每次备份后, 备份文件的名字会自动变更,以反映备份时间顺序,最近一次备份叫做backup00.ocr。建议DBA除了在本地保留这些备份外,还应在其他存储设备上 保留一份备份,以防止意外的存储故障。

ocrdump
如果想阅读ocr信息,可以使用ocrdump命令将OCR的内容以ASCII的方式打印出,但是这个命令不能用作OCR的备份恢复,只能用作阅读,
命令格式:ocrdump [-stdout] [filename] [-keyname name] [-xml]
参数说明:
-stdout:把内容打印输出到屏幕上
Filename:内容输出到文件中
-keyname:只打印某个键及其子健内容
-xml:以xml格式打印输出
示例:把system.css键的内容以.xml格式打印输出到屏幕
#./ocrdump -stdout -keyname SYSTEM.css -xml|more
这个命令在执行过程中,会在$CRS_HOME\log\<node_name>\client目录下产生日志文件,文件名ocrdump_<pid>.log,如果命令执行出现问题,可以从这个日志查看问题原因。

ocrcheck
Ocrcheck命令用于检查OCR内容的一致性,命令执行过程会在$CRS_HOME\log\nodename\client目录下产生ocrcheck_<pid>.log日志文件。 这个命令不需要参数。

#./ocrcheck
Status of Oracle Cluster Registry is as follows :
         Version                  :          2
         Total space (kbytes)     :     163668
         Used space (kbytes)      :       4348
         Available space (kbytes) :     159320
         ID                       : 1345945283
         Device/File Name         : /dev/raw/raw1
                                    Device/File integrity check succeeded

                                    Device/File not configured

         Cluster registry integrity check succeeded

ocrconfig

查看自动备份信息

#./ocrconfig -help

$ ocrconfig -showbackup
czmmiao2     2012/12/26 17:26:16     /u01/app/oracle/product/10.2.0/db_1/cdata/crs
czmmiao2     2012/12/18 21:12:37     /u01/app/oracle/product/10.2.0/db_1/cdata/crs
czmmiao1     2012/12/16 21:54:20     /u01/app/oracle/product/10.2.0/db_1/cdata/crs
czmmiao2     2012/12/26 17:26:16     /u01/app/oracle/product/10.2.0/db_1/cdata/crs
czmmiao2     2012/12/26 17:26:16     /u01/app/oracle/product/10.2.0/db_1/cdata/crs

$ ls -l /u01/app/oracle/product/10.2.0/db_1/cdata/crs
total 29880
-rw-r--r-- 1 root   root     5083136 Dec  7 16:05 backup00.ocr
-rw-r--r-- 1 root   root     5083136 Nov 27 19:14 backup01.ocr
-rw-r--r-- 1 oracle dba      5083136 Nov 26 22:32 backup02.ocr
-rw-r--r-- 1 oracle dba      5083136 Nov 26 22:32 day.ocr
-rw-r--r-- 1 oracle oinstall   22084 Jan  1 20:52 OCRDUMPFILE
-rw-r--r-- 1 root   root     5083136 Dec 16 21:54 temp.ocr
-rw-r--r-- 1 oracle dba      5083136 Nov 26 22:32 week.ocr

使用导出,导入进行备份和恢复
Oracle推荐在对集群做调整时,比如增加,删除节点之前,应该对OCR做一个备份,可以使用export备份到指定文件,如果做了replace或者restore等操作,Oracle建议使用cluvfy comp ocr -n all命令来做一次全面的检查。

# ./crsctl stop crs
Stopping resources.
Successfully stopped CRS resources
Stopping CSSD.
Shutting down CSS daemon.
Shutdown request successfully issued.

# ./ocrconfig -export ocrexp.exp       #导出ocr
# ls -l ocrexp.exp
-rw-r--r-- 1 root root 102935 Jan  1 21:17 ocrexp.exp

# ./crsctl start crs
Attempting to start CRS stack
The CRS stack will be started shortly

# dd if=/dev/zero of=/dev/raw/raw1 bs=1M        #破坏ocr

dd: writing `/dev/raw/raw1': No space left on device
160+0 records in
159+0 records out
167685120 bytes (168 MB) copied, 18.0218 seconds, 9.3 MB/s
# ./ocrcheck
PROT-601: Failed to initialize ocrcheck
# ./runcluvfy.sh comp ocr -n all
Verifying OCR integrity
Unable to retrieve nodelist from Oracle clusterware.
Verification cannot proceed.
# ./ocrconfig -import ocrexp.exp
       #导入ocr

# ./ocrcheck
# ./runcluvfy.sh comp ocr -n all

移动和删除OCR

移动OCR时,不能直接修改OCR,必须要先添加镜像才能修改,否则会报错

# ./ocrconfig -replace ocr /dev/raw/raw3
PROT-1: Failed to initialize ocrconfig

# ./ocrconfig -replace ocrmirror /dev/raw/raw3        #创建镜像ocr

# ./ocrcheck
Status of Oracle Cluster Registry is as follows :
         Version                  :          2
         Total space (kbytes)     :     163668
         Used space (kbytes)      :       4344
         Available space (kbytes) :     159324
         ID                       :   38625139
         Device/File Name         : /dev/raw/raw1
                                    Device/File integrity check succeeded
         Device/File Name         : /dev/raw/raw3
                                    Device/File integrity check succeeded
         Cluster registry integrity check succeeded

# cat /etc/oracle/ocr.loc
#Device/file /dev/raw/raw3 getting replaced by device /dev/raw/raw3
ocrconfig_loc=/dev/raw/raw1
ocrmirrorconfig_loc=/dev/raw/raw3

# ./ocrconfig -replace ocr /dev/raw/raw4        #修改primary ocr位置

# ./ocrcheck

Status of Oracle Cluster Registry is as follows :
         Version                  :          2
         Total space (kbytes)     :     163668
         Used space (kbytes)      :       4344
         Available space (kbytes) :     159324
         ID                       :   38625139
         Device/File Name         : /dev/raw/raw4
                                    Device/File integrity check succeeded
         Device/File Name         : /dev/raw/raw3
                                    Device/File integrity check succeeded
         Cluster registry integrity check succeeded

# ./ocrconfig -replace ocrmirror               #删除镜像ocr

# cat /etc/oracle/ocr.loc
#Device/file /dev/raw/raw3 being deleted
ocrconfig_loc=/dev/raw/raw4


参考至:《大话Oracle RAC》张晓明著
               http://blog.csdn.net/inthirties/article/details/5431368
               http://blog.csdn.net/tianlesoftware/article/details/6049378

本文原创,转载请注明出处、作者
如有错误,欢迎指正
邮箱:czmcj@163.com

0
6
分享到:
评论

相关推荐

    Oracle RAC 11gR2日常维护管理之OCR和VotingDisk维护.pdf

    本知识点将详细介绍Oracle RAC 11gR2中OCR(Oracle Cluster Registry)和Voting Disk(表决磁盘)的日常维护管理。 OCR是存储Oracle集群和RAC数据库资源配置信息的关键组件。它包含了数据库实例、网络配置、存储...

    Oracle 10G RAC下OCR和Voting disk的管理

    ### Oracle 10G RAC 下 OCR 和 Voting Disk 的管理 #### 一、Voting Disk (表决...以上步骤详细介绍了如何在Oracle 10g RAC环境下管理和维护Voting Disk与OCR。通过这些操作,可以确保集群的稳定运行和数据的一致性。

    Oracle_RAC_CRS、OCR、Voting破坏重建

    CRS 负责集群的管理和监控,OCR 负责存储集群的配置信息,而 Voting Disk 则是用来确保集群的高可用性。本文将详细介绍如何破坏重建 CRS、OCR 和 Voting Disk。 一、准备工作 在破坏重建 CRS、OCR 和 Voting Disk ...

    Oracle 11.2.0.3 RAC 重建 OCR 和 Voting Disk 案例

    如果Voting Disk出现问题,可能引发“split brain”情况,即集群无法确定哪个节点是活动的。重建Voting Disks的步骤包括: 1. 备份:同样,首先备份现有Voting Disks,可以使用`crsctl get vote -v`查看状态,然后...

    【故障】RAC ASM磁盘路径故障导致OCR和Voting Disk被Force Dismount

    然而,当RAC中的ASM磁盘路径出现故障时,可能会导致OCR(Oracle Cluster Registry)和Voting Disk被Force Dismount,这是一个严重的故障情况,可能影响到整个集群的稳定性。 OCR是RAC中的关键组件,存储了集群的...

    voting disk破坏后的恢复

    - 使用`crsctl add file -type=ocr -device=&lt;device&gt;`命令添加新的Voting Disk。这里的`&lt;device&gt;`指的是要使用的设备名。 4. **重新配置Clusterware**: - 登录到每个集群节点上,运行`/etc/init.d/crs stop`命令...

    Oracle RAC 资料收集日常基本维护命令

    ### Oracle RAC 资料收集与日常基本维护命令 #### 概述 Oracle Real Application Clusters (Oracle RAC) 是一种多实例集群数据库技术,它允许多个数据库实例同时访问一个共享数据库。这种架构提高了数据库系统的...

    RAC常用命令及说明

    在本文中,我们介绍了 RAC 中常用的命令及说明,包括查看 Voting Disk 的位置、备份 Voting Disk、恢复 Voting Disk、查看 Voting Disk 的内容、Oracle Clusterware、OCR、OCR 备份、OCR 恢复和自动备份恢复 OCR 等...

    虚拟机下RedHat5.4双机

    - 创建并配置OCR和VOTING DISK的文件系统,如使用ASM来管理这些共享磁盘。 - 配置TNS监听器,指向VIP,以便客户端通过VIP连接数据库。 5. **测试与维护**: - 完成安装后,进行故障转移和恢复测试,确保RAC的高...

    基于LINUX的Oracle 10G RAC管理维护学习手记.pdf

    总结而言,Oracle 10G RAC的管理维护涉及复杂但关键的CRS进程、VIP机制、OCR与Voting Disk管理,以及ASM的高效存储解决方案。理解和掌握这些基础知识对于成功部署和维护Oracle RAC集群至关重要。

    OracleClusterware.ppt

    综上所述,Oracle Clusterware是构建Oracle RAC的关键组件,它通过OCR和Voting Disk等机制保证了集群的稳定性和一致性,同时通过一系列后台进程管理和协调集群资源,确保了数据库的高可用性和数据的一致性。

    rac日常维护(整理版)

    - 确保OCR和Voting Disk的完整性和一致性,定期进行OCR和Voting Disk的备份。 - 使用ASM进行存储管理,监控ASM磁盘组的健康状态和性能指标。 - 对RAC实例进行性能调优,包括SQL查询优化、内存分配和调度策略调整...

    oracle RAC 测试案例.doc

    - **OCSSD进程crash模拟测试**:OCR(Oracle Cluster Registry)和Voting Disk服务守护进程(OCSSD)负责存储集群配置信息。如果OCSSD崩溃,测试将检查OCR和Voting Disk的备份机制是否有效。 - **EVMD进程crash...

    Oracle11g日常操作与维护手册

    它能帮助管理员启动、停止、监控实例,管理监听程序,以及进行OCR和 Voting Disk的操作。 **2.6.1 管理实例** 通过SRVCTL,可以轻松地启动、停止、查询单个实例或整个集群的实例状态。例如,`srvctl status ...

    基于LINUX的Oracle10GRAC管理维护.doc

    - **CRS管理**:包括OCR和voting disk的维护,确保集群稳定性。 - **RDBMS管理**:涵盖SPFILE参数管理、redo/undo管理、archivelog和flashback配置,以及ASM的管理。 - **备份和恢复**:针对不同情况(节点可见/...

    OracleClusterware.pptx

    Oracle Clusterware还包含了两个关键的磁盘文件:OCR (Oracle Cluster Registry)和Voting Disk。OCR存储了集群的配置信息,类似于集群的配置数据库,用于解决“脑裂”(split-brain)和“健忘”(forgetfulness)...

    Oracle在Linux下的安装配置

    其中包括Oracle的Real Application Clusters (RAC)、Cluster Ready Service (CRS)、Cluster Verification Utility (CVU)、Oracle Universal ...)、Oracle Cluster Registry (OCR)、Voting Disk以及Virtual IP (VIP)...

    Oracle RAC技术原理与运维概述.pptx

    理解CRS的资源管理,如ASM磁盘和磁盘组的管理,OCR和Voting Disk的备份、恢复和维护,以及VIP、PUBLIC IP、HAIP和PRIVATE IP的配置更改。此外,深入理解业务需求,特别是关键表在各节点的访问情况,对于优化RAC性能...

Global site tag (gtag.js) - Google Analytics