<<转>>
概述:
Oracle数据库是目前业界最常用的大型数据库系统,我在实际项目中遇到出现ORA-00257错误(空间不足错误),通过查找资料,绝大部分说这是由于归档日志太多,占用了全部的硬盘剩余空间导致的,通过简单删除日志或加大存储空间就能够解决。但是我在Oracle 10g上发现,存储空间还有很大,却也报这个错误。原来是Oracle 10g中新的特性,对Flash Recovery的管理导致的。
1、软硬件环境
服务器HP Proliant DL580G4(Intel Xeon 3.16GHz/4GB/ 72.8*4/RAID4)
操作系统Red Flag DC Server release 5.0 (Trinity) for x86-64 Linux
数据库Oracle 10.2.0.1.0
2、问题现象
数据库系统已经试运行了半个多月,在7月24日晚上连接数据库后做数据更新时出现ORA-00257错误,如下图。
提示归档错误,通过查找ORACLE错误代码,解释为硬盘空间不足,需要删除归档日志增加空间,但是服务器可用空间200GB,目前只用了10GB左右,这是为什么呢?
3、诊断过程:
1)查看ORACLE数据库归档日志情况
[root@hrmsdb /]# cd /oracle/flash_recovery_area/HKCHR/archivelog [root@hrmsdb archivelog]# ls 2006_07_04 2006_07_13 2006_07_17 2006_07_20 2006_07_23 2006_07_11 2006_07_14 2006_07_18 2006_07_21 2006_07_24 2006_07_12 2006_07_15 2006_07_19 2006_07_22 2006_07_25 [root@hrmsdb archivelog]# cd 2006_07_25 [root@hrmsdb 2006_07_25]# ls [root@hrmsdb 2006_07_25]# cd ../2006_07_24 [root@hrmsdb 2006_07_24]# ls o1_mf_1_92_2d933vgb_.arc o1_mf_1_96_2d954ns7_.arc o1_mf_1_98_2d969d5h_.arc o1_mf_1_95_2d9537cs_.arc o1_mf_1_97_2d956km0_.arc |
说明在出现问题之前数据库归档处理一直是正常的。
2)查看数据库REDOLOG情况
[oracle@hrmsdb ~]$ sqlplus /nolog SQL*Plus: Release 10.2.0.1.0 - Production on 星期二 7月 25 10:44:18 2006 Copyright (c) 1982, 2005, Oracle. All rights reserved. SQL> connect / as sysdba 已连接。 SQL> select * from v$log; GROUP# THREAD# SEQUENCE# BYTES MEMBERS ARC STATUS FIRST_CHANGE# FIRST_TIME ---------- ---------- ---------- ---------- ---------- --- --------------------------------------- -------------- 1 1 101 52428800 1 NO CURRENT 3621973 24-7月 -06 2 1 99 52428800 1 NO INACTIVE 3600145 24-7月 -06 3 1 100 52428800 1 NO INACTIVE 3611932 24-7月 -06 |
发现ARC状态为NO,表示系统没法自动做归档。
3)手工切换日志
SQL> alter system switch logfile; alter system switch logfile * 第 1 行出现错误: |
ORA-01013: 用户请求取消当前的操作
在等待长时间没反应后,中断操作,手工切换日志没有成功。
4)查看Oracle数据库后台归档服务进程
[oracle@hrmsdb ~]$ ps -ef|grep oracle oracle 4601 1 0 Jul11 ? 00:00:04 /oracle/product/10.2.0/db_1/bin/ tnslsnr LISTENER -inherit oracle 5025 1 0 Jul11 ? 00:00:00 /usr/bin/ssh-agent -s oracle 20923 1 0 Jul24 ? 00:00:01 ora_pmon_hkchr oracle 20925 1 0 Jul24 ? 00:00:00 ora_psp0_hkchr oracle 20927 1 0 Jul24 ? 00:00:00 ora_mman_hkchr oracle 20929 1 0 Jul24 ? 00:00:01 ora_dbw0_hkchr oracle 20931 1 0 Jul24 ? 00:01:07 ora_lgwr_hkchr oracle 20933 1 0 Jul24 ? 00:00:05 ora_ckpt_hkchr oracle 20935 1 0 Jul24 ? 00:00:01 ora_smon_hkchr oracle 20937 1 0 Jul24 ? 00:00:00 ora_reco_hkchr oracle 20939 1 0 Jul24 ? 00:00:00 ora_cjq0_hkchr oracle 20941 1 0 Jul24 ? 00:00:01 ora_mmon_hkchr oracle 20943 1 0 Jul24 ? 00:00:05 ora_mmnl_hkchr oracle 20945 1 0 Jul24 ? 00:00:00 ora_d000_hkchr oracle 20947 1 0 Jul24 ? 00:00:00 ora_s000_hkchr oracle 20953 1 0 Jul24 ? 00:09:41 ora_arc0_hkchr oracle 20955 1 1 Jul24 ? 00:10:29 ora_arc1_hkchr oracle 20959 1 0 Jul24 ? 00:00:00 ora_qmnc_hkchr oracle 20967 1 0 Jul24 ? 00:00:00 ora_q000_hkchr oracle 20969 1 0 Jul24 ? 00:00:00 ora_q001_hkchr oracle 21715 1 0 Jul24 ? 00:00:19 oraclehkchr (LOCAL=NO) oracle 21765 1 0 Jul24 ? 00:00:00 ora_j000_hkchr oracle 21816 1 0 Jul24 ? 00:00:00 ora_j001_hkchr oracle 21832 1 0 Jul24 ? 00:00:00 ora_j002_hkchr oracle 21839 1 0 Jul24 ? 00:00:00 ora_j003_hkchr oracle 21859 1 0 Jul24 ? 00:00:00 ora_j004_hkchr oracle 21861 1 0 Jul24 ? 00:00:00 ora_j005_hkchr oracle 21886 1 0 Jul24 ? 00:00:00 ora_j006_hkchr oracle 21888 1 0 Jul24 ? 00:00:00 ora_j007_hkchr root 23187 23186 0 10:39 ? 00:00:00 login -- oracle oracle 23188 23187 0 10:39 pts/0 00:00:00 -bash oracle 23216 23188 0 10:39 pts/0 00:00:00 sqlplus oracle 23217 23216 0 10:39 ? 00:00:00 oraclehkchr (DESCRIPTION=(LOCAL= YES)(ADDRESS=(PROTOCOL=beq))) root 23224 23223 0 10:40 ? 00:00:00 login -- oracle oracle 23225 23224 0 10:40 pts/1 00:00:00 -bash oracle 23310 23225 0 10:46 pts/1 00:00:00 ps -ef oracle 23311 23225 0 10:46 pts/1 00:00:00 grep oracle [oracle@hrmsdb ~]$ 后台进程都正常运行。 |
5)查看FLASH_RECOVERY_AREA空间使用情况
[root@hrmsdb /]# cd /oracle [root@hrmsdb oracle]# ls admin flash_recovery_area oraInventory product [root@hrmsdb oracle]# du -a -k flash_recovery_area 4 flash_recovery_area/HKCHR/onlinelog 42456 flash_recovery_area/HKCHR/archivelog/2006_07_15/o1_mf_1_74_2cj1h1jz_.arc ………………. 42448 flash_recovery_area/HKCHR/archivelog/2006_07_14/o1_mf_1_68_2cfzwwvt_.arc 512560 flash_recovery_area/HKCHR/archivelog/2006_07_14 1469224 flash_recovery_area/HKCHR/archivelog 6988 flash_recovery_area/HKCHR/backupset/2006_07_04/o1_mf_ncsnf_TAG20060704T1 74229_2bng1o0b_.bkp 876916 flash_recovery_area/HKCHR/backupset/2006_07_04/o1_mf_nnndf_TAG20060704T1 74229_2bng0cx4_.bkp 883908 flash_recovery_area/HKCHR/backupset/2006_07_04 883912 flash_recovery_area/HKCHR/backupset 2353144 flash_recovery_area/HKCHR 2353148 flash_recovery_area [root@hrmsdb oracle]# FLASH_RECOVERY_AREA空间使用了2.35GB |
6)查看FLASH_RECOVERY_AREA空间中各部分使用情况
SQL> select * from v$recovery_file_dest; NAME SPACE_LIMIT SPACE_USED SPACE_RECLAIMABLE NUMBER_OF_FILES ------------------------------------------------------------------------------------------------------------------ /oracle/flash_recovery_area 2147483648 2134212608 0 35 SQL> select * from v$flash_recovery_area_usage; FILE_TYPE PERCENT_SPACE_USED PERCENT_SPACE_RECLAIMABLE NUMBER_OF_FILES ------------ ------------------ ------------------------- ---------------- -------------- -------------- ------------- CONTROLFILE 0 0 0 ONLINELOG 0 0 0 ARCHIVELOG 69.97 0 40 BACKUPPIECE 30.01 0 2 IMAGECOPY 0 0 0 FLASHBACKLOG 0 0 0 已选择6行。 |
发现ARCHIVELOG占近70%,BACKUPPIRCR占了30%,这样FLASH_RECOVERY_AREA空间的空间已经被完全占据了。
4、解决过程
根据数据库目前可用存储空间为200GB、FLASH_RECOVERY_AREA空间为2GB的实际情况,把FLASH_RECOVERY_AREA的空间修改为20GB。
SQL> alter system set DB_RECOVERY_FILE_DEST_SIZE=20g; 系统已更改。 SQL> select * from v$recovery_file_dest; ------------------------------------------------------- ---------- ----------------------------------- NAME SPACE_LIMIT SPACE_USED SPACE_RECLAIMABLE NUMBER_OF_FILES ----------- ---------- ----------------- ------------- -------------- ---------- ---------- ------------ /oracle/flash_recovery_area 2.1475E+10 2264587776 0 38 |
这时再查看日志的状态,发现REDO LOG处于正常的归档状态。
SQL> select * from v$log; GROUP# THREAD# SEQUENCE# BYTES MEMBERS ARC STATUS FIRST_CHANGE# FIRST_TIME ---------- ---------- ---------- ---------- ---------- --- -------------------------------------------- -------------- 1 1 101 52428800 1 YES ACTIVE 3621973 24-7月 -06 2 1 102 52428800 1 NO CURRENT 3650399 25-7月 -06 3 1 100 52428800 1 YES INACTIVE 3611932 24-7月 -06 SQL> select * from v$flash_recovery_area_usage; FILE_TYPE PERCENT_SPACE_USED PERCENT_SPACE_RECLAIMABLE NUMBER_OF_FILES ------------ ------------------ ------------------------- --------------- CONTROLFILE 0 0 0 ONLINELOG 0 0 0 ARCHIVELOG 7.6 0 43 BACKUPPIECE 4.21 0 2 IMAGECOPY 0 0 0 FLASHBACKLOG 0 0 0 已选择6行。 SQL> |
5、小结
造成本次故障的原因由两方面同时发生所造成的:
·其一是Flash_Recovery_Area空间缺省安装时比较小,只有2GB,容易用完;
·其二是由于采用归档方式通过Veritas备份,由于备份软件没有运行,造成归档日志没有及时删除。
从本次故障解决处理中,我们可以得出经验教训:
·Oracle 10g数据库物理空间管理方式与以前Oracle发生了变化,对归档日志所在的Flash_Recovery_Area空间进行了另外限制;
·对数据库系统管理员要对Oracle数据库归档日志、备份软件运行状况定期检查,提前发现、处理可能发生的故障。
相关推荐
为了更深入地理解这个问题,可以参考提供的“ora-00257.wrf”视频教程,它应该包含详细的步骤和屏幕截图,帮助你直观地解决问题。WebEx录制的屏幕分享也可以提供实时操作的演示,这对于初学者尤其有帮助。 在实际...
ORA-00257 错误处理过程 Oracle 的 Archivelog 机制是为了确保数据库的可恢复性,在数据库中, archivelog 文件是记录数据库的所有变化的日志文件,当 archivelog 文件达到一定的大小时, Oracle 就会抛出 ORA-...
以下是针对“ORA-00257归档日志清理问题”的详细解决方案和相关知识点: 1. **错误解析**:ORA-00257通常表示数据库尝试写入归档日志文件但找不到可用的空间。这可能是因为归档日志目录已满,或者归档日志文件的...
今天在使用oracle数据库做项目时,突然报错:ORA-00257: archiver error....经过本人一番折腾此问题还要归档于日志满了,下面小编把Oracle归档日志写满(ora-00257)的解决办法在此分享给大家供大家参考
- **ORA-16603**: 此错误通常发生在归档日志应用过程中,可能是因为归档日志已经过期或损坏。解决方法涉及修复归档日志文件或重新传输归档日志。 为了解决这些错误,管理员需要仔细检查相关的日志文件,并可能需要...
3. 解决方案实例:提供具体的SQL语句或操作步骤来解决问题。 4. 预防措施:介绍如何通过优化配置、应用设计或监控策略来防止类似问题的再次出现。 5. 源码分析:如果标签提到“源码”,可能涉及Oracle数据库的源代码...
标题和描述中提到的是关于如何解决Oracle数据库系统中出现的Ora-00600错误的故障处理方法。Ora-00600错误是Oracle数据库内部错误,通常表明系统遇到了无法处理的异常情况。这篇文档可能提供了解决这个问题的步骤和...
### Oracle异常处理归纳 本文将基于提供的文档信息对...以上是根据给定文档信息整理出的Oracle异常处理归纳,希望能够帮助遇到这些问题的用户快速解决问题。需要注意的是,在实际操作中还需结合具体情况灵活应对。
【ORA-12899错误详解】 当在Oracle数据库中遇到`ORA-12899`错误时,这通常意味着某个字段的值超过了该字段定义的最大长度。在给出的文档上下文中,这个错误是由于尝试将一个长度为66的字符串插入到最大长度为50的`...
ORA-12154(无法解析服务名)或ORA-12541(无监听程序)等错误通常与网络配置有关,需要检查TNS(Transparent Network Substrate)配置。 9. **实例和进程问题**: 如ORA-00600(内部错误)和ORA-04031(无法分配...
"Oracle错误码大全"文档正是为了解决这一问题,它收集并整理了Oracle数据库可能出现的各种错误码及其对应的含义,方便用户快速查找和解决问题。 错误码在Oracle中被定义为一个十进制数字,通常以"ORA-"开头,后面...
3. **联系Oracle支持服务**:对于ORA-7445这样的内部错误,通常需要Oracle的支持来协助诊断和解决问题。 #### 其它ORA-NNNN报错 Oracle数据库中还有许多其他类型的错误代码,每种代码都指向了一个特定的问题。面对...
- **ORA-00603, ORA-29702**:在安装RAC过程中,这些错误可能表明网络配置问题。这通常需要仔细检查网络设置,确保所有必要的接口和虚拟IP配置正确。 5. **实例管理类问题** - 实例启动失败、性能下降等问题通常...
3. 当数据库处于归档日志模式(ARCHIVELOG mode),并且尝试启动数据库时,如果出现ORA-00313和ORA-00312错误,这通常涉及在线重做日志组(online redo log groups)的问题。错误提示指出了无法打开重做日志组中的...
切换到归档模式是数据库备份与恢复策略的重要组成部分,以下是在Oracle数据库中切换到归档模式的步骤和遇到问题的解决方法。 首先,要查看当前数据库的日志模式,可以使用以下SQL命令: ``` SQL> ARCHIVELOG LIST; ...
- **问题列表**: 文档中列出了在使用Oracle数据库过程中可能会遇到的一些常见问题及其解决方案。 以上是对《Oracle数据库操作大全》文档的部分内容的详细总结和解释,涵盖了数据库创建、基本操作以及如何解决常见的...
4. **数据库错误记录**:比如表空间不足、出现坏块、数据库内部错误(ORA-600)等问题,这些错误会被记录下来,以便于DBA及时发现问题并采取措施解决。 - **处理方法**: - 如果启动参数设置不当,应检查初始化...
在Linux环境中,Oracle数据库的日常维护是至关重要的,它确保了系统的稳定性和数据的安全性。以下是一些关键的Oracle数据库维护命令和相关的知识...这不仅可以预防和解决问题,还能确保系统的高效运行和数据的安全性。
为了最小化异常情况下的损失,并在错误发生后尽快恢复数据库运行,实施合理的数据库备份策略是必要的。 在UNIX系统中,利用系统调度功能实现自动备份可以简化这个过程,提高效率并确保数据的安全。这包括定期删除...