`

一次严重的WebLogic频繁宕机故障处理

 
阅读更多
环境描述
AIX5308、WebLogic9.2 MP3集群(6应用节点,1管理节点,1集群分发节点)
JDK:IBMJava5 64-bit JDK (Service Refresh SR6b + IZ08455)

JVM:-Xms2048M –Xmx2048M

Patch ID: NGZ8
      Performance Pack:server/native/aix/ppc64/libmuxer.so
系统使用过程中,平均每一个月至少宕机一次,表现为WebLogic服务节点呈挂死现象,业务系统不能使用,只能重启服务节点后系统方能使用,并且在业务系统使用过程中,速度达不到理想的效果。


故障分析1、
WebLogic服务节点挂机现象,经检
查WebLogic日志,发现在服务节点挂机之前有出“java/lang/OutOfMemoryError”等报错,同时domains目录下也生成有javacore、heapdump等文件。


l
JVM内存使用情况


***WARNING*** Java heap is almost exhausted : 0% free Java heap
Dump Event "systhrow" (00040000) Detail "java/lang/OutOfMemoryError" received
Free Java heap size: 9,664 bytes
Allocated Java heap size: 4,294,967,296 bytes
目前分配给Server的4G内存已全部使用,但又未得到新的内存,出现了OutOfMemoryError


l


线程使用情况


从线程使用情况看,只有个别线程正在运行,其它线程均在等待或被阻塞。
而运行的线程正在进行数据据访问操作


l


检查内存使用情况


在重新调整JVM为1G的情况下,分析了内存再次溢出的DUMP文件,从下图看出有存内存泄漏问题,而且情况较为严重,一个class共消耗内存670M,这个泄漏对象当前正在进行JDBC数据访问操作。


在JVM为1G的条件下,根据分析结果表明,目前内存泄漏问题主要表现在两个地方:
1)对象com.XXXX.XXXX.XXXX.XXXX.model.DefectQueryVO
此对象分别创建了36414次、1239307次。
2)
一系列JDBC操作,这个操作说明在进行数库访问、数据交换。

因此已建议开发商软件工程师检查程序并进行优化。



故障处理结果
将相应的表进行分区处理,优化了数据库,后来使用正常。
分享到:
评论

相关推荐

    WebLogic宕机大全总结

    然而,在实际生产环境中,WebLogic Server可能会遭遇各种故障,其中最为常见的就是服务器宕机或挂起的问题。本文旨在通过分析实际案例来总结WebLogic宕机的原因及应对措施,以期为企业运维人员提供参考。 #### 二、...

    weblogic宕机处理文档

    在处理WebLogic宕机问题时,我们首先遇到的是与数据库相关的优化问题。在这个场景中,项目组最初认为数据库是问题所在,因为SGA(System Global Area)使用的是默认参数,导致缓冲区命中率低。这可能意味着数据读取...

    RAC节点宕机故障分析

    RAC 节点宕机故障分析是一个复杂的过程,需要对节点宕机故障的原因、事件、ORA-600 错误、Bug 和 LMS 进程进行分析和确认。通过对这些方面的分析,可以获取节点宕机故障的相关信息,诊断和解决 RAC 节点宕机故障。

    ORACLE数据库一次意外宕机的分析处理实记(ora-1578)[文].pdf

    "ORACLE数据库一次意外宕机的分析处理实记(ora-1578)" 在本文中,我们将讲述ORACLE数据库一次意外宕机的分析处理过程。该宕机事件发生在测试环境中的一台装有ORACLE数据库的AIX小机上,导致数据库宕机。我们将从...

    weblogic定期故障分析

    - **故障表现**:系统每隔一段时间就会出现一次宕机情况,具体表现为WebLogic服务器因内存不足而无法继续服务。 **2. 故障分析** - **内存使用情况**:在发生故障时,通过heap dump文件发现,有一个类消耗了大量的...

    永不宕机的服务器

    集群中的每台服务器都可处理一部分工作负载,如果某台服务器宕机,其任务可由其他服务器接管。 4. **热备与冷备**:热备是指备用服务器处于待命状态,一旦主服务器出现问题,可立即切换;而冷备则是在主服务器故障...

    nginx负载均衡配置,宕机自动切换方式

    更重要的是,nginx还提供了宕机自动切换的能力,这确保了在某后端服务器发生故障时,能够快速切换到健康节点继续提供服务,从而保障了服务的连续性和稳定性。 在nginx中进行负载均衡配置,一般会利用到默认安装的...

    服务器宕机怎么办?服务器故障应急预案.docx

    面对如此严峻的形势,企业必须制定出周密的服务器故障应急预案,以确保在面对服务器宕机时能迅速而有效地应对,最大限度地减少损失。 首先,我们要认识到导致服务器宕机的原因多种多样,其中外部攻击如黑客入侵和...

    宕机检测工具

    在IT运维领域,确保服务的...总的来说,宕机检测工具是现代IT运维不可或缺的一部分,它们提升了故障检测的效率,减少了由于服务器问题导致的业务中断。通过合理使用和配置,企业可以更好地保障服务的稳定性和用户体验。

    基于Nmon的PowerHA宕机故障分析.docx

    【基于Nmon的PowerHA宕机故障分析】 在IT领域,尤其是系统管理和高可用性环境,对系统的稳定性有着极高的要求。PowerHA(Power High Availability)是IBM提供的一种集群解决方案,用于确保关键业务的连续运行。然而...

    mysql主备机宕机自动切换

    ### MySQL 主备机宕机自动切换详解 #### 一、MySQL主备复制机制简介 MySQL复制(Replication)是MySQL数据库系统中一个重要的特性,它允许数据从一台MySQL服务器(称为Master)复制到另一台或多台MySQL服务器...

    tomcat宕机重启脚本

    tomcat宕机重启脚本,比较简单的一种设置

    Nginx实现tomcat与weblogic集群的负载均衡及故障处理

    如果某个Tomcat或WebLogic实例宕机,Nginx会自动停止向该实例发送请求,直到它恢复。此外,可以通过调整Nginx配置中的权重参数来实现故障切换时的流量重新分配。 对于性能调优,Tomcat可以通过调整`server.xml`中的...

    主数据库服务器宕机应急预案(正式篇)

    主数据库服务器宕机应急预案(正式篇) 数据库服务器宕机应急预案 预案目的 主数据库服务器宕机应急预案的目的是在主数据库服务器宕机时,快速恢复主数据库服务器的正常使用,以保证金融线上业务的正常访问。 ...

    宕机没有任何好处——POWER7 能够确保宕机不影响您的业务

    - **行业差异**:不同行业对宕机的容忍度和损失成本不同,如金融服务行业对RAS(可靠性、可用性、可服务性)的投资最高,因此停机时间最短,而医疗行业虽然单次停机损失相对较小,但总停机时间较长。 #### 2. 企业...

    宕机是什么意思?.docx

    尽管这些事件可能不会引起公众广泛关注,但频繁的宕机会严重影响用户体验,从而影响网站的长期发展。 ### 结论 综上所述,宕机是计算机领域中一个常见的问题,它不仅涉及到技术层面的问题解决,还需要企业和个人在...

    由重启引起的Oracle RAC节点宕机分析及追根溯源.docx

    值得注意的是,尽管这些节点出现了频繁故障,但由于业务隔离的配置,单个节点的故障并未对业务造成严重影响。然而,大规模的节点故障仍然引发了关注,表明可能存在某些共性问题。 #### 2. 技术环境 - **主机版本**...

    记录一次CentOS7因断电导致宕机的修复过程.pdf

    本文档记录了一次 CentOS 7 服务器因断电导致宕机的修复过程。该服务器的修复过程中遇到了许多问题,包括 fstab 文件的缺失、分区表的损坏、root 分区的损坏等问题。通过对这些问题的解决,最终成功地修复了服务器。...

    mysql宕机恢复经典问题解决

    如发生在 mysql 软件可承受力够但是服务器硬件,或者其他服务导致的 宕机 又或者 MYSQL 参数配置过大或者参数配置不合理...,出现宕机的可能多种多样,本文档主要体现的是宕机后可能出现的问题和后遗症较大的情况是什么

    一次宕机后的网关性能优化.pdf

    文档"一次宕机后的网关性能优化.pdf"主要探讨了在经历一次宕机事件后,如何对API网关进行性能优化以防止类似问题再次发生。本文将深入解析文档中的四个关键部分:PART ONE、PART TWO、PART THREE和PART FOUR,并提取...

Global site tag (gtag.js) - Google Analytics