一个load飙高的过程分析,非常有价值。
http://blog.csdn.net/axman/article/details/7104819
分类: 手记 故障分析 2011-12-27 11:50 2592人阅读 评论(3) 收藏 举报
ae的多语言应用中不断出现load飙高的情况 ,即使重启过10几个小时以后,cpu慢慢从1核到4核到被吃光。
而且集群中8台机器都是如此,所以应用方自己开始开分析原因。
前两天跟踪没结果,后来有一位同学根据tb达人的分析中得到启发:
关于us高和ys高的问题分析:
当us值过高时,表示运行的应用消耗大量的CPU。java应用造成us高的原因主要是线程一直处于可运行(Runnable)状态,通常这些线程在执行无阻塞、循环、正则或纯粹的计算等任务造成的;另外一个可能也会造成us高的原因是频繁GC。
当sy值高时,表示linux花费了更多的时间在进行java线程切换。java应用造成这种现象的主要原因是启动的线程比较多,且这些线程多数处于不断的阻塞(例如锁等待,IO等待状态)和执行状态的变化过程中,这就导致了操作系统要不断地切换执行的线程,产生大量的线程上下文切换。
以下代码用于验证上面的经验:
public static void main(String[] args) {
for (int i = 0; i < 500; i++) {
new Thread().start();
}
}
static class ComsumeCPURunnable implements Runnable {
public void run() {
long start = System.currentTimeMillis();
long end = start;
while (end - start < 10000) {
end = System.currentTimeMillis();
}
}
}
运行结果为:
模拟sy占用很高的代码:
public static void main(String[] args) {
for (int i = 0; i < 500; i++) {
Object lock = new Object();
new Thread(new RunnableA(lock)).start();
new Thread(new RunnableB(lock)).start();
}
}
static class RunnableA implements Runnable {
private Object lock = null;
public RunnableA(Object lock){
this.lock = lock;
}
public void run() {
while (true) {
try {
synchronized (lock) {
lock.wait(50);
}
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
}
static class RunnableB implements Runnable {
private Object lock = null;
public RunnableB(Object lock){
this.lock = lock;
}
public void run() {
while (true) {
synchronized (lock) {
lock.notify();
}
try {
Thread.sleep(20);
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
}
运行结果:
线上实际的情况是us很高;那原因就不在于线程等待或者阻塞导致的.
通过ps Lf [pid]命令可以看到所有java线程情况,cpu占用率、线程时间。可以看到占用cpu比较高的就几个线程:
UID PID PPID LWP C NLWP STIME TTY STAT TIME
admin 10702 10692 11817 26 415 19:03 ? Rl 65:19
admin 10702 10692 11807 16 415 19:03 ? Rl 39:56
admin 10702 10692 11805 26 415 19:03 ? Rl 65:32
admin 10702 10692 11801 26 415 19:03 ? Rl 66:09
LWP(java线程id),NLWP(java线程总数)
再通过jstack –l [pid]命令 dump java线程栈的情况,将以上线程id转换成16进制,后在dump出来的jstack文件中搜索,发现所有线程都属于xss过滤线程:
"TP-Processor59" daemon prio=10 tid=0x00002aab4b11b800 nid=0x450 runnable [0x0000000049fa7000]
java.lang.Thread.State: RUNNABLE
at xxxxxxxxxxxxxxxx....................
最后的问题定位于at xxxxxxxxxxxxxxxxx这里的二方库调用,问题被提交到我们这里时,我知道之前这个二方库存在一个死循环的bug并已经在新版本中解决,
直接通知应用方升级新版本的二方库测试一切正常,问题解决。
解决这样的问题,要求我们对 jps, jstack, jstat, top -p, jinfo, jmap等Java自身携带的工具,以及系统命(ps,pstree,pstack等),Jvisualvm及所有的插件非常熟悉,
这些工具基本98%的以上问题能分析出来。
对于jstack做的ThreadDump的栈,可以反映如下信息。
如果某个相同的call stack经常出现, 我们有80%的以上的理由确定这个代码存在性能问题(读网络的部分除外);
如果相同的call stack出现在同一个线程上(tid)上, 我们很很大理由相信, 这段代码可能存在较多的循环或者死循环;
如果某call stack经常出现, 并且里面带有lock,请检查一下这个lock的产生的原因, 可能是全局lock造成了性能问题;
在一个不大压力的群集里(w<2), 我们是很少拿到带有业务代码的stack的, 并且一般在一个完整stack中, 最多只有1-2业务代码的stack,
如果经常出现, 一定要检查代码, 是否出现性能问题。
如果你怀疑有dead lock问题, 那么请把所有的lock id找出来,看看是不是出现重复的lock id。
分享到:
相关推荐
"查看JVM进程的CPU火焰图工具"就是这样一个用于监控和分析JVM性能的利器,尤其在Linux环境下,它可以帮助开发者直观地了解JVM中的CPU使用情况。 首先,让我们了解一下CPU火焰图。CPU火焰图是一种可视化技术,用于...
在Java应用程序的运行过程中,有时候会遇到JVM(Java虚拟机)CPU使用率过高的问题。这通常是由于线程执行不恰当或者存在死锁、资源争抢等状况引起的。为了定位并解决这些问题,开发者需要有效地监控和分析Java线程的...
首先,JProfiler11是一款专业级别的Java性能分析工具,它能够对JVM进行深入的内存和CPU分析。通过集成到Idea中,开发者可以直接在IDE内部进行性能检测,无需离开熟悉的开发环境。只需下载JProfiler11的安装包,并...
分析JVM崩溃日志时,重点是定位问题所在的代码行,了解触发错误的操作,以及查看是否有内存管理问题,如堆溢出或栈溢出。同时,还要检查堆栈跟踪,确定哪些线程或方法在崩溃时刻正在执行,并结合Java堆、方法区、元...
7. **性能优化实践**:通过案例分析,学习如何识别和解决常见的性能问题,如内存溢出、CPU过高、响应时间过长等。同时,探讨最佳实践,如避免全局锁、减少对象创建、优化数据结构等。 8. **JVM与其他语言的交互**:...
在《大神带你学Java(第1天)》的文件中,可能会详细讲解如何使用各种工具如JConsole、VisualVM或JProfiler来监控和诊断JVM状态,包括CPU使用率、内存分配、线程状态等。通过这些工具,我们可以定位性能瓶颈,比如...
5. **CPU使用率**:监控JVM的CPU使用情况,过高可能意味着存在性能瓶颈或无用计算。 6. **系统资源监控**:除了JVM内部,`jvm-mon`还能提供操作系统级别的信息,如CPU、内存和磁盘使用情况,以全面了解系统健康状况...
其中之一就是JProfiler插件,它是一款针对JVM(Java虚拟机)的高级性能分析工具。JProfiler通过深入洞察JVM内部工作原理,帮助开发者识别并解决性能瓶颈,优化应用程序。 **JProfiler的主要功能** 1. **内存分析...
### JVM堆栈性能分析 #### 一、Thread Dump 介绍 **1.1 什么是 Thread Dump?** Thread Dump,即线程快照,是诊断Java应用问题的重要工具之一。每个Java虚拟机(JVM)都能生成所有线程在某一时刻的状态快照。尽管...
1. JVisualVM:提供内存分析、线程监控、CPU性能分析等功能。 2. JConsole:监控JVM的性能和内存状态。 3. jinfo、jmap、jhat:命令行工具用于获取JVM配置、堆转储、堆分析等。 五、内存泄漏与检测 1. 内存泄漏...
JVM分析器的主要目标是对JVM的内存使用、CPU消耗、线程活动、类加载情况等进行实时监测,以便于定位性能瓶颈和内存泄漏等问题。在这个项目中,它特别关注了Hadoop和Spark这样的大数据处理框架,这些框架在JVM上运行...
它集成了一系列功能,如内存分析、线程检查、CPU消耗监控、类加载和垃圾收集等,使得开发者能够深入了解应用在JVM上的运行状况。在本文中,我们将详细探讨如何使用VisualVM来监控本地和远程的JVM实例。 1. **...
《项目典型数据应用缓存的JVM之旅》 在IT行业中,优化应用程序性能是一个永恒的话题,尤其是在大数据量、高并发的场景下。本篇将深入探讨如何利用Java虚拟机(JVM)进行高效的缓存处理,以提升项目的典型数据应用...
3. **监控与诊断**:使用JVisualVM、JConsole等工具进行实时监控,分析GC日志,找出性能瓶颈。 4. **对象生命周期管理**:合理设计对象生命周期,避免大量短生命周期对象晋升到老年代,导致不必要的Full GC。 5. *...
JProfiler的CPU分析模块可以显示哪些方法占用了最多的CPU时间,从而帮助定位性能瓶颈。它支持方法调用的概览,可以显示调用树,帮助开发者理解代码的执行流程和耗时。 **3. 内存分析** 内存分析是JProfiler的核心...
### JVM实战-JVM调优案例分析与MyEclipse性能调优实战 #### 实验背景与目标 在现代软件开发过程中,提升开发效率是至关重要的环节之一。MyEclipse和Eclipse作为主流的集成开发环境(IDE),被广泛应用于Java项目的...
它提供了非常丰富的监控功能,包括但不限于内存使用情况分析、线程分析、CPU使用情况分析等。 **使用步骤:** 1. **启动JRMc**:在命令行输入`jrmc`或通过图形界面启动。 2. **监控本地JVM**:启动后,JRMc会自动列...
JVM 输出 GC 日志导致 JVM 卡住是一个复杂的问题,需要作者通过多方面的分析和监控来定位和解决问题。 知识点: 1. JVM 垃圾回收机制(Garbage Collection,GC) 2. JVM 日志配置,包括 GC 日志、JIT 编译日志和 ...