Oracle 隐含参数_asm_hbeatiowait引起的ASM磁盘组DISMOUNT
-
(1)恒生电子资管云HOMS系统B区2015年3月6日上午故障现象:【数据库服务器无法连接】
-
(2)恒生电子资管云HOMS系统B区2015年3月9日下午故障现象:【数据库服务器无法连接】
-
图1-1 事故现场截图
-
根据应用层返回错误结合ASM日志和告警日志文件信息分析。错误出现原因分析如下图。
图 1-2 应用层返回错误原因
-
采取措施1:查看集群资源状态:crsctl status res -t
系统返回1:集群资源状态无法获取,错误监听不存在【TNS-12541:TNS:NO LISTENER】
采取措施2:检查OCR以及Voting DISK状态:ocr check
系统返回2:OCR与voting DISK状态无法获取,错误监听不存在【TNS-12541:TNS:NO LISTENER】初步判断:监听程序已经失败。
验证措施1:srvctl status listener
返回错误1:监听程序不存在。=>确定监听已经失败。查看监听进程:ps -ef|grep lsnr
验证结果:监听框架已经启动,监听进程存在。
进一步判断:监听没有工作,框架内任务失败。查看集群件跟踪文件:
/u01/app/grid/oradiag_grid/diag/clients/user_grid/host_1874443374_80/trace
发现DATA磁盘组失败,导致监听程序无法访问OCR,引起监听资源异常。具体如下:图 1-3 0309下午库监听初次失败时间
图 1-4 trace文件显示ASM磁盘组DATA dismount之后的connect failed
-
诊断:存储OCR和voting DISK的ASM 磁盘组DATA 发生故障,导致DATA磁盘组OFFLINE,由此引发监听无法工作,因为RAC监听作为资源注册到了OCR,此时OCR不可访问。
图 1-5 错误后RAC系统行为
诊断:Oracle 集群件不断尝试重新mount DATA,但是可能因为文件句柄等内部错误而失败。DATA磁盘组内磁盘文件头可能发生逻辑损坏。没有理由冗余的2个镜像都发生读取失败(两个磁盘都坏掉的几率还是比较小的),如下图由ASM日志发现DATA两个镜像MIRROR都发生了读取失败: -
该日志告诉我们在两个镜像数据文件的偏移量为724992的位置发生错误,I/O请求失败,可能发生数据块的物理损坏或者逻辑错误。可以发现,网络传输的请求能够准确到达内核层面,但是内部或I/O处理出现错误。重要的是故障发生时刻的进程状态与磁盘文件头状态信息,是否发生不一致导致磁盘组DISMOUNT。
-
仔细查看ASM日志,发现该问题在2014年就已经出现过DATA磁盘组的dismount问题,具体截图如下所示:(其实该问题的征兆早就已经出现)
-
图 1-7 查看ASM历史日志
这是什么情况???貌似这个时间就已经有ASM磁盘组DATA的问题了。
-
图 1-8 DATA错误一例图 1-9 ASM磁盘组历史故障记录一例
图 1-10 ASM磁盘组历史故障记录一例
图 1-11 ASM磁盘组历史故障记录一例
相关推荐
当现有的ASM磁盘组无法满足存储需求时,可以通过添加新的磁盘来扩展ASM磁盘组的空间。本文档提供了一个标准的ASM磁盘组扩容方案,该方案已经在多个生产环境中得到验证和应用。 #### 目标环境 本方案适用于Oracle ...
5. **配置错误**:ASM磁盘组的配置可能存在错误,如磁盘的命名、OCR和Voting Disk的存放位置等。错误的配置可能导致系统在尝试访问时遇到问题。 解决这类问题通常涉及以下几个步骤: 1. **故障排查**:首先,需要...
标题中的“【故障】ASM diskgroup dismount with \"Waited 15 secs for write IO to PST\"”描述了一个Oracle Automatic Storage Management (ASM)磁盘组出现的问题,即在尝试卸载ASM磁盘组时,系统等待了15秒用于...
- **挂载/卸载磁盘组**:使用`alter diskgroup mount`和`alter diskgroup dismount`命令来挂载或卸载指定的磁盘组。 ```sql SQL> alter diskgroup 'DG1' mount; SQL> alter diskgroup 'DG1' dismount; ``` - ...
资源内项目源码是来自个人的毕业设计,代码都测试ok,包含源码、数据集、可视化页面和部署说明,可产生核心指标曲线图、混淆矩阵、F1分数曲线、精确率-召回率曲线、验证集预测结果、标签分布图。都是运行成功后才上传资源,毕设答辩评审绝对信服的保底85分以上,放心下载使用,拿来就能用。包含源码、数据集、可视化页面和部署说明一站式服务,拿来就能用的绝对好资源!!! 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、大作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.txt文件,仅供学习参考, 切勿用于商业用途。
wrf转mp4播放器1.1.1
内容概要:本文档详细介绍了如何在Simulink中设计一个满足特定规格的音频带ADC(模数转换器)。首先选择了三阶单环多位量化Σ-Δ调制器作为设计方案,因为这种结构能在音频带宽内提供高噪声整形效果,并且多位量化可以降低量化噪声。接着,文档展示了具体的Simulink建模步骤,包括创建模型、添加各个组件如积分器、量化器、DAC反馈以及连接它们。此外,还进行了参数设计与计算,特别是过采样率和信噪比的估算,并引入了动态元件匹配技术来减少DAC的非线性误差。性能验证部分则通过理想和非理想的仿真实验评估了系统的稳定性和各项指标,最终证明所设计的ADC能够达到预期的技术标准。 适用人群:电子工程专业学生、从事数据转换器研究或开发的技术人员。 使用场景及目标:适用于希望深入了解Σ-Δ调制器的工作原理及其在音频带ADC应用中的具体实现方法的人群。目标是掌握如何利用MATLAB/Simulink工具进行复杂电路的设计与仿真。 其他说明:文中提供了详细的Matlab代码片段用于指导读者完成整个设计流程,同时附带了一些辅助函数帮助分析仿真结果。
国网台区终端最新规范
《基于YOLOv8的智慧农业水肥一体化控制系统》(包含源码、可视化界面、完整数据集、部署教程)简单部署即可运行。功能完善、操作简单,适合毕设或课程设计
GSDML-V2.33-LEUZE-AMS3048i-20170622.xml
微信小程序项目课程设计,包含LW+ppt
微信小程序项目课程设计,包含LW+ppt
终端运行进度条脚本
幼儿园预防肺结核教育培训课件资料
python,python相关资源
《基于YOLOv8的智慧校园电动车充电桩状态监测系统》(包含源码、可视化界面、完整数据集、部署教程)简单部署即可运行。功能完善、操作简单,适合毕设或课程设计
deepseek 临床之理性软肋.pdf
SM2258XT量产工具(包含16种程序),固态硬盘量产工具使用
RecyclerView.zip
水务大脑让水务运营更智能(23页)