`
uule
  • 浏览: 6358448 次
  • 性别: Icon_minigender_1
  • 来自: 一片神奇的土地
社区版块
存档分类
最新评论

jstack - 检测死锁、等待、CPU耗时

    博客分类:
  • JVM
 
阅读更多

jstack

jstack用于检测死锁

使用jstack跟踪Java进程

虚拟机stack全分析

Java虚拟机工具之堆栈跟踪工具jstack定位死循环

 

 

 

dump日志分析工具

 "IBM Thread and Monitor Dump Analyzer for Java" 下载地址:https://www.ibm.com/developerworks/community/groups/service/html/communityview?communityUuid=2245aa39-fa5c-4475-b891-14c205f7333c

 

jstack用于生成java虚拟机当前时刻的线程快照。线程快照是当前java虚拟机内每一条线程正在执行的方法堆栈的集合,生成线程快照的主要目的是定位线程出现长时间停顿的原因,如线程间死锁、死循环、请求外部资源导致的长时间等待等。 

线程出现停顿的时候通过jstack来查看各个线程的调用堆栈,就可以知道没有响应的线程到底在后台做什么事情,或者等待什么资源。 如果java程序崩溃生成core文件,jstack工具可以用来获得core文件的java stack和native stack的信息,从而可以轻松地知道java程序是如何崩溃和在程序何处发生问题。另外,jstack工具还可以附属到正在运行的java程序中,看到当时运行的java程序的java stack和native stack的信息, 如果现在运行的java程序呈现hung的状态,jstack是非常有用的。

   -F:当正常输出的请求不被响应时,强制输出线程堆栈

   -l:除堆栈外,显示关于锁的附加信息

   -m:如果调用到本地方法的话,可以显示C/C++的堆栈

命令格式:jstack [option] vmid

 

 

jstack命令的语法格式: jstack  <pid>。可以用jps查看java进程id。这里要注意的是:

1. 不同的 JAVA虚机的线程 DUMP的创建方法和文件格式是不一样的,不同的 JVM版本, dump信息也有差别。

2. 在实际运行中,往往一次 dump的信息,还不足以确认问题。建议产生三次 dump信息,如果每次 dump都指向同一个问题,我们才确定问题的典型性。

 

 

一:jstack Dump 日志文件中的线程状态

 

1:dump 文件里,值得关注的线程状态有

死锁, Deadlock(重点关注) 

执行中,Runnable   

等待资源, Waiting on condition(重点关注) 

等待获取监视器, Waiting on monitor entry(重点关注)

暂停,Suspended

对象等待中,Object.wait() 或 TIMED_WAITING

阻塞, Blocked(重点关注)  

停止,Parked

 

2:Dump文件中的线程状态含义及注意事项

 

Deadlock:死锁线程,一般指多个线程调用间,进入相互资源占用,导致一直等待无法释放的情况。

 

Runnable:一般指该线程正在执行状态中,该线程占用了资源,正在处理某个请求,有可能正在传递SQL到数据库执行,有可能在对某个文件操作,有可能进行数据类型等转换。

 

Waiting on condition:该状态出现在线程等待某个条件的发生。具体是什么原因,可以结合 stacktrace来分析。最常见的情况是线程在等待网络的读写,比如当网络数据没有准备好读时,线程处于这种等待状态,而一旦有数据准备好读之后,线程会重新激活,读取并处理数据。在 Java引入 NewIO之前,对于每个网络连接,都有一个对应的线程来处理网络的读写操作,即使没有可读写的数据,线程仍然阻塞在读写操作上,这样有可能造成资源浪费,而且给操作系统的线程调度也带来压力。在 NewIO里采用了新的机制,编写的服务器程序的性能和可扩展性都得到提高。

 

        如果发现有大量的线程都在处在 Wait on condition,从线程 stack看, 正等待网络读写,这可能是一个网络瓶颈的征兆。因为网络阻塞导致线程无法执行。一种情况是网络非常忙,几 乎消耗了所有的带宽,仍然有大量数据等待网络读 写;另一种情况也可能是网络空闲,但由于路由等问题,导致包无法正常的到达。所以要结合系统的一些性能观察工具来综合分析,比如 netstat统计单位时间的发送包的数目,如果很明显超过了所在网络带宽的限制 ; 观察 cpu的利用率,如果系统态的 CPU时间,相对于用户态的 CPU时间比例较高;如果程序运行在 Solaris 10平台上,可以用 dtrace工具看系统调用的情况,如果观察到 read/write的系统调用的次数或者运行时间遥遥领先;这些都指向由于网络带宽所限导致的网络瓶颈。另外一种出现 Wait on condition的常见情况是该线程在 sleep,等待 sleep的时间到了时候,将被唤醒。

 

locked:线程阻塞,是指当前线程执行过程中,所需要的资源长时间等待却一直未能获取到,被容器的线程管理器标识为阻塞状态,可以理解为等待资源超时的线程。

 

Waiting for monitor entry 和 in Object.wait():Monitor是 Java中用以实现线程之间的互斥与协作的主要手段,它可以看成是对象或者 Class的锁。每一个对象都有,也仅有一个 monitor。

 

 

二、死锁案例:

public class DeadThread implements Runnable{  
      
    private Object monitor_A = new Object();  
      
    private Object monitor_B = new Object();  
      
    public void  method_A(){  
         synchronized(monitor_A) {   
               synchronized(monitor_B) {   
                   System.out.println(Thread.currentThread().getName()+" invoke method A");  
               }                  
           }          
    }  
      
    public void  method_B(){  
         synchronized(monitor_B) {   
               synchronized(monitor_A) {   
                   System.out.println(Thread.currentThread().getName()+" invoke method B");  
               }                  
           }          
    }     
  
    public void run() {       
        for(int i=0;i<1;i--){               
            method_A();            
            method_B();                        
        }              
    }  
       
  public static void main(String[] args) {    
      DeadThread t1 = new DeadThread();    
       Thread ta = new Thread(t1, "A");    
       Thread tb = new Thread(t1, "B");    
    
       ta.start();    
       tb.start();   
  }   
}  

 结果:

"B" prio=10 tid=0x0898d000 nid=0x269a waiting for monitor entry [0x8baa2000]  
   java.lang.Thread.State: BLOCKED (on object monitor)  
    at org.marshal.DeadThread.method_A(DeadThread.java:11)  
    - waiting to lock <0xaa4d6f88> (a java.lang.Object)  
    - locked <0xaa4d6f80> (a java.lang.Object)  
    at org.marshal.DeadThread.run(DeadThread.java:28)  
    at java.lang.Thread.run(Thread.java:636)  
  
"A" prio=10 tid=0x0898b800 nid=0x2699 waiting for monitor entry [0x8baf3000]  
   java.lang.Thread.State: BLOCKED (on object monitor)  
    at org.marshal.DeadThread.method_B(DeadThread.java:19)  
    - waiting to lock <0xaa4d6f80> (a java.lang.Object)  
    - locked <0xaa4d6f88> (a java.lang.Object)  
    at org.marshal.DeadThread.run(DeadThread.java:29)  
    at java.lang.Thread.run(Thread.java:636)  
	
Found one Java-level deadlock:  
=============================  
"B":  
  waiting to lock monitor 0x089615d8 (object 0xaa4d6f88, a java.lang.Object),  
  which is held by "A"  
"A":  
  waiting to lock monitor 0x08962258 (object 0xaa4d6f80, a java.lang.Object),  
  which is held by "B"  
  
Java stack information for the threads listed above:  
===================================================  
"B":  
    at org.marshal.DeadThread.method_A(DeadThread.java:11)  
    - waiting to lock <0xaa4d6f88> (a java.lang.Object)  
    - locked <0xaa4d6f80> (a java.lang.Object)  
    at org.marshal.DeadThread.run(DeadThread.java:28)  
    at java.lang.Thread.run(Thread.java:636)  
"A":  
    at org.marshal.DeadThread.method_B(DeadThread.java:19)  
    - waiting to lock <0xaa4d6f80> (a java.lang.Object)  
    - locked <0xaa4d6f88> (a java.lang.Object)  
    at org.marshal.DeadThread.run(DeadThread.java:29)  
    at java.lang.Thread.run(Thread.java:636)  
  
Found 1 deadlock.  

 从这个结果文件我们一看到发现了一个死锁,具体是线程A在等待线程B,而线程B在等待线程A造成的,同时也记录了线程的堆栈和代码行数,通过这个堆栈和行数我们就可以去检查对应的代码块,从而发现问题和解决问题.

也可以发现在哪些地方发生阻塞,访问缓慢等,从而可以准确入手进行优化.

 

 

三、找出某个Java进程中最耗费CPU的Java线程并定位堆栈信息,用到的命令有ps、top、printf、jstack、grep

linux中查找java程序 cpu占用高的代码位置

java应用死循环排查方法或查找程序消耗资源的线程方法

 

具体流程:

来源:VM性能调优监控工具jps、jstack、jmap、jhat、jstat、hprof使用详解


 

第一步先找出Java进程ID,服务器上的Java应用名称为mrf-center:

root@ubuntu:/# ps -ef | grep mrf-center | grep -v grep

root     21711     1  1 14:47 pts/3    00:02:10 java -jar mrf-center.jar

得到进程ID为21711,第二步找出该进程内最耗费CPU的线程,可以使用

1)ps -Lfp pid

2)ps -mp pid -o THREAD, tid, time

3)top -Hp pid

用第三个,输出如下:

 

TIME列就是各个Java线程耗费的CPU时间,CPU时间最长的是线程ID为21742的线程,用

printf "%x\n" 21742

得到21742的十六进制值为54ee,下面会用到。

 

OK,下一步终于轮到jstack上场了,它用来输出进程21711的堆栈信息,然后根据线程ID的十六进制值grep,如下:

root@ubuntu:/# jstack 21711 | grep 54ee

"PollIntervalRetrySchedulerThread" prio=10 tid=0x00007f950043e000 nid=0x54ee in Object.wait()

可以看到CPU消耗在PollIntervalRetrySchedulerThread这个类的Object.wait(),我找了下我的代码,定位到下面的代码:

// Idle wait
getLog().info("Thread [" + getName() + "] is idle waiting...");
schedulerThreadState = PollTaskSchedulerThreadState.IdleWaiting;
long now = System.currentTimeMillis();
long waitTime = now + getIdleWaitTime();
long timeUntilContinue = waitTime - now;
synchronized(sigLock) {
  try {
    if(!halted.get()) {
      sigLock.wait(timeUntilContinue);
    }
  } 
  catch (InterruptedException ignore) {
  }
}

 

它是轮询任务的空闲等待代码,上面的sigLock.wait(timeUntilContinue)就对应了前面的Object.wait()。

 

 

 

 

 

  • 大小: 98.4 KB
分享到:
评论

相关推荐

    MPP的jstack分析结果

    3. **锁信息**:如果线程处于阻塞状态,jstack会显示持有或等待的锁信息,这对于诊断死锁问题极其有用。 4. **监控线程**:在MPP系统中,还有一些特殊的监控线程,如垃圾收集器、线程池管理线程等,jstack也会报告...

    JAVA分析进程占用过大原因

    - 比如,某个循环或递归操作没有正确的退出条件,或者某些线程因等待资源而陷入死锁状态。 #### 四、解决问题 1. **优化代码**:一旦找到问题根源,就需要对代码进行相应的优化。 - 对于循环或递归操作,确保有...

    通过Android trace文件分析死锁ANR实例过程

    2. **使用死锁检测工具**:利用Android Studio或JDK自带的jstack工具进行分析,找出死锁的线程和锁。 3. **调整锁的顺序**:如果多线程访问共享资源时,确保所有线程按照相同的顺序获取锁,可以避免死锁。 4. **超时...

    java问题定位技术+性能优化

    - 在等待条件满足时,使用`wait()`而不是忙等待循环,以节省CPU资源。 - **5.3 Double-Checked Locking单例模式** - 一种确保线程安全的单例模式实现方式。 - **5.4 另一种异常陷阱-连续的关键接口调用** - 处理...

    内存检测工具.rar

    而`jstack`则可以帮助开发者查看线程堆栈信息,找出可能存在的死锁或阻塞问题。 Arthas的CPU监测功能则通过`trace`和`monitor`命令实现。`trace`可以追踪指定方法的调用,记录方法执行时间,从而找出CPU消耗高的...

    Java 监控 运行时

    通过`jstack`命令可以获取线程的详细信息,找出死锁、线程挂起等问题。 - **线程池监控**:对于使用线程池的应用,监控线程池的大小、任务队列长度以及拒绝策略,可以避免资源过度消耗。 3. **CPU使用率** - **...

    Java进程cpu占用率高

    如果垃圾收集过于频繁或者耗时过长,CPU占用率会显著升高。通过调整JVM参数,如增大新生代或老年代大小,选择合适的垃圾收集器(如G1、ZGC或Shenandoah),以及设置合理的内存分配策略,可以优化垃圾收集的性能。 *...

    Java虚拟机-jvm故障诊断与性能优化-源码

    - **CPU耗时分析**:找出消耗CPU最多的代码段。 - **内存分析**:检查是否存在内存泄漏,以及对象生命周期是否正常。 - **锁竞争**:分析线程竞争状态,优化同步机制。 7. **JVM内存溢出** - **堆溢出**:过多...

    TDA-Thread Dump Analyzer - tda-bin-2.3.3.zip

    3. **线程耗时分析**:统计各线程执行时间,找出消耗CPU最多的线程。 4. **锁竞争分析**:分析线程对锁的争用情况,识别潜在的性能瓶颈。 5. **线程活动度分析**:显示线程的活跃程度,帮助定位长期处于非活动状态...

    jvm瓶颈定位 java jvm 学习

    - jmap、jhat、jstack:命令行工具,用于获取堆信息、堆转储、线程堆栈快照等。 4. **JVM瓶颈分析** - CPU瓶颈:过高CPU占用可能源于过多的计算或者无休止的垃圾回收。通过分析方法耗时,找出热点代码进行优化。 ...

    visualvm jdk插件

    - **线程分析**:你可以查看应用中的所有线程状态,包括运行、等待、阻塞等,并且能够对死锁进行检测。这有助于找出可能导致应用卡顿或响应慢的线程问题。 - **CPU使用率监测**:VisualVM可以实时展示CPU的使用情况...

    Visual GC(监控垃圾回收器)

    4. **线程状态**:展示所有运行中的线程,包括它们的状态(如运行、等待、阻塞等),便于分析死锁和线程竞争问题。 5. **类加载信息**:统计已加载的类数量和大小,帮助分析类加载相关的性能问题。 VisualVM不仅...

    Java线上故障排查方案.pdf

    2. **业务异常**:如服务运行一段时间后自动退出、服务间调用耗时过长、多线程并发处理时出现问题、线程死锁等。 #### 三、如何定位问题 解决问题的第一步是准确定位问题所在。以下是一些常用的定位手段,可以按照...

    栈信息分析工具Thead and Monitor Dump Analyzer(TMDA)

    TMDA能够帮助开发者快速定位阻塞、死锁或者过度CPU消耗的问题,这对于优化多线程应用的性能尤为关键。 TMDA主要包含以下几个关键特性: 1. **线程分析**:TMDA可以显示所有线程的详细信息,包括线程ID、线程状态...

    visualvm_137中文版

    它能展示所有运行中的线程状态,包括阻塞、等待、运行等,帮助开发者定位死锁、线程资源竞争等问题。 4. **CPU剖析** 对于性能瓶颈的查找,VisualVM提供了CPU剖析功能。它能够详细记录每个方法的CPU消耗时间,帮助...

    【JAVA WEB实用技巧与优化方案】如何排查JVM线程和内存相关问题

    2. **锁定分析**:它能识别出哪些线程正在持有锁,以及这些锁是否造成了其他线程的阻塞,从而找出可能的死锁或等待链。 3. **内存分析**:虽然IBM Thread and Monitor Dump Analyzer主要是针对线程的,但也能提供...

    Java的工具包Jtop.jar

    3. **内存管理**:Jtop可以帮助分析内存分配和垃圾回收的情况,包括新生代、老年代的内存使用,以及GC事件的频率和耗时,这对于优化内存配置和减少不必要的内存泄漏至关重要。 4. **JVM参数调整**:通过Jtop,用户...

    我的档案

    使用Java自带的JConsole、JProfiler或者VisualVM可以监控CPU使用情况,找出耗时的操作。 3. **线程分析**:线程争用、死锁和不恰当的线程管理会导致性能下降。JStack可以帮助开发者查看线程状态,识别并解决问题。 ...

Global site tag (gtag.js) - Google Analytics