jstack
dump日志分析工具
"IBM Thread and Monitor Dump Analyzer for Java" 下载地址:https://www.ibm.com/developerworks/community/groups/service/html/communityview?communityUuid=2245aa39-fa5c-4475-b891-14c205f7333c
jstack用于生成java虚拟机当前时刻的线程快照。线程快照是当前java虚拟机内每一条线程正在执行的方法堆栈的集合,生成线程快照的主要目的是定位线程出现长时间停顿的原因,如线程间死锁、死循环、请求外部资源导致的长时间等待等。
线程出现停顿的时候通过jstack来查看各个线程的调用堆栈,就可以知道没有响应的线程到底在后台做什么事情,或者等待什么资源。 如果java程序崩溃生成core文件,jstack工具可以用来获得core文件的java stack和native stack的信息,从而可以轻松地知道java程序是如何崩溃和在程序何处发生问题。另外,jstack工具还可以附属到正在运行的java程序中,看到当时运行的java程序的java stack和native stack的信息, 如果现在运行的java程序呈现hung的状态,jstack是非常有用的。
-F:当正常输出的请求不被响应时,强制输出线程堆栈
-l:除堆栈外,显示关于锁的附加信息
-m:如果调用到本地方法的话,可以显示C/C++的堆栈
命令格式:jstack [option] vmid
jstack命令的语法格式: jstack <pid>。可以用jps查看java进程id。这里要注意的是:
1. 不同的 JAVA虚机的线程 DUMP的创建方法和文件格式是不一样的,不同的 JVM版本, dump信息也有差别。
2. 在实际运行中,往往一次 dump的信息,还不足以确认问题。建议产生三次 dump信息,如果每次 dump都指向同一个问题,我们才确定问题的典型性。
一:jstack Dump 日志文件中的线程状态
1:dump 文件里,值得关注的线程状态有
死锁, Deadlock(重点关注)
执行中,Runnable
等待资源, Waiting on condition(重点关注)
等待获取监视器, Waiting on monitor entry(重点关注)
暂停,Suspended
对象等待中,Object.wait() 或 TIMED_WAITING
阻塞, Blocked(重点关注)
停止,Parked
2:Dump文件中的线程状态含义及注意事项
Deadlock:死锁线程,一般指多个线程调用间,进入相互资源占用,导致一直等待无法释放的情况。
Runnable:一般指该线程正在执行状态中,该线程占用了资源,正在处理某个请求,有可能正在传递SQL到数据库执行,有可能在对某个文件操作,有可能进行数据类型等转换。
Waiting on condition:该状态出现在线程等待某个条件的发生。具体是什么原因,可以结合 stacktrace来分析。最常见的情况是线程在等待网络的读写,比如当网络数据没有准备好读时,线程处于这种等待状态,而一旦有数据准备好读之后,线程会重新激活,读取并处理数据。在 Java引入 NewIO之前,对于每个网络连接,都有一个对应的线程来处理网络的读写操作,即使没有可读写的数据,线程仍然阻塞在读写操作上,这样有可能造成资源浪费,而且给操作系统的线程调度也带来压力。在 NewIO里采用了新的机制,编写的服务器程序的性能和可扩展性都得到提高。
如果发现有大量的线程都在处在 Wait on condition,从线程 stack看, 正等待网络读写,这可能是一个网络瓶颈的征兆。因为网络阻塞导致线程无法执行。一种情况是网络非常忙,几 乎消耗了所有的带宽,仍然有大量数据等待网络读 写;另一种情况也可能是网络空闲,但由于路由等问题,导致包无法正常的到达。所以要结合系统的一些性能观察工具来综合分析,比如 netstat统计单位时间的发送包的数目,如果很明显超过了所在网络带宽的限制 ; 观察 cpu的利用率,如果系统态的 CPU时间,相对于用户态的 CPU时间比例较高;如果程序运行在 Solaris 10平台上,可以用 dtrace工具看系统调用的情况,如果观察到 read/write的系统调用的次数或者运行时间遥遥领先;这些都指向由于网络带宽所限导致的网络瓶颈。另外一种出现 Wait on condition的常见情况是该线程在 sleep,等待 sleep的时间到了时候,将被唤醒。
locked:线程阻塞,是指当前线程执行过程中,所需要的资源长时间等待却一直未能获取到,被容器的线程管理器标识为阻塞状态,可以理解为等待资源超时的线程。
Waiting for monitor entry 和 in Object.wait():Monitor是 Java中用以实现线程之间的互斥与协作的主要手段,它可以看成是对象或者 Class的锁。每一个对象都有,也仅有一个 monitor。
二、死锁案例:
public class DeadThread implements Runnable{ private Object monitor_A = new Object(); private Object monitor_B = new Object(); public void method_A(){ synchronized(monitor_A) { synchronized(monitor_B) { System.out.println(Thread.currentThread().getName()+" invoke method A"); } } } public void method_B(){ synchronized(monitor_B) { synchronized(monitor_A) { System.out.println(Thread.currentThread().getName()+" invoke method B"); } } } public void run() { for(int i=0;i<1;i--){ method_A(); method_B(); } } public static void main(String[] args) { DeadThread t1 = new DeadThread(); Thread ta = new Thread(t1, "A"); Thread tb = new Thread(t1, "B"); ta.start(); tb.start(); } }
结果:
"B" prio=10 tid=0x0898d000 nid=0x269a waiting for monitor entry [0x8baa2000] java.lang.Thread.State: BLOCKED (on object monitor) at org.marshal.DeadThread.method_A(DeadThread.java:11) - waiting to lock <0xaa4d6f88> (a java.lang.Object) - locked <0xaa4d6f80> (a java.lang.Object) at org.marshal.DeadThread.run(DeadThread.java:28) at java.lang.Thread.run(Thread.java:636) "A" prio=10 tid=0x0898b800 nid=0x2699 waiting for monitor entry [0x8baf3000] java.lang.Thread.State: BLOCKED (on object monitor) at org.marshal.DeadThread.method_B(DeadThread.java:19) - waiting to lock <0xaa4d6f80> (a java.lang.Object) - locked <0xaa4d6f88> (a java.lang.Object) at org.marshal.DeadThread.run(DeadThread.java:29) at java.lang.Thread.run(Thread.java:636) Found one Java-level deadlock: ============================= "B": waiting to lock monitor 0x089615d8 (object 0xaa4d6f88, a java.lang.Object), which is held by "A" "A": waiting to lock monitor 0x08962258 (object 0xaa4d6f80, a java.lang.Object), which is held by "B" Java stack information for the threads listed above: =================================================== "B": at org.marshal.DeadThread.method_A(DeadThread.java:11) - waiting to lock <0xaa4d6f88> (a java.lang.Object) - locked <0xaa4d6f80> (a java.lang.Object) at org.marshal.DeadThread.run(DeadThread.java:28) at java.lang.Thread.run(Thread.java:636) "A": at org.marshal.DeadThread.method_B(DeadThread.java:19) - waiting to lock <0xaa4d6f80> (a java.lang.Object) - locked <0xaa4d6f88> (a java.lang.Object) at org.marshal.DeadThread.run(DeadThread.java:29) at java.lang.Thread.run(Thread.java:636) Found 1 deadlock.
从这个结果文件我们一看到发现了一个死锁,具体是线程A在等待线程B,而线程B在等待线程A造成的,同时也记录了线程的堆栈和代码行数,通过这个堆栈和行数我们就可以去检查对应的代码块,从而发现问题和解决问题.
也可以发现在哪些地方发生阻塞,访问缓慢等,从而可以准确入手进行优化.
三、找出某个Java进程中最耗费CPU的Java线程并定位堆栈信息,用到的命令有ps、top、printf、jstack、grep
具体流程:
来源:VM性能调优监控工具jps、jstack、jmap、jhat、jstat、hprof使用详解
第一步先找出Java进程ID,服务器上的Java应用名称为mrf-center:
root@ubuntu:/# ps -ef | grep mrf-center | grep -v grep
root 21711 1 1 14:47 pts/3 00:02:10 java -jar mrf-center.jar
得到进程ID为21711,第二步找出该进程内最耗费CPU的线程,可以使用
1)ps -Lfp pid
2)ps -mp pid -o THREAD, tid, time
3)top -Hp pid
用第三个,输出如下:
TIME列就是各个Java线程耗费的CPU时间,CPU时间最长的是线程ID为21742的线程,用
printf "%x\n" 21742
得到21742的十六进制值为54ee,下面会用到。
OK,下一步终于轮到jstack上场了,它用来输出进程21711的堆栈信息,然后根据线程ID的十六进制值grep,如下:
root@ubuntu:/# jstack 21711 | grep 54ee
"PollIntervalRetrySchedulerThread" prio=10 tid=0x00007f950043e000 nid=0x54ee in Object.wait()
可以看到CPU消耗在PollIntervalRetrySchedulerThread这个类的Object.wait(),我找了下我的代码,定位到下面的代码:
// Idle wait getLog().info("Thread [" + getName() + "] is idle waiting..."); schedulerThreadState = PollTaskSchedulerThreadState.IdleWaiting; long now = System.currentTimeMillis(); long waitTime = now + getIdleWaitTime(); long timeUntilContinue = waitTime - now; synchronized(sigLock) { try { if(!halted.get()) { sigLock.wait(timeUntilContinue); } } catch (InterruptedException ignore) { } }
它是轮询任务的空闲等待代码,上面的sigLock.wait(timeUntilContinue)就对应了前面的Object.wait()。
相关推荐
3. **锁信息**:如果线程处于阻塞状态,jstack会显示持有或等待的锁信息,这对于诊断死锁问题极其有用。 4. **监控线程**:在MPP系统中,还有一些特殊的监控线程,如垃圾收集器、线程池管理线程等,jstack也会报告...
- 比如,某个循环或递归操作没有正确的退出条件,或者某些线程因等待资源而陷入死锁状态。 #### 四、解决问题 1. **优化代码**:一旦找到问题根源,就需要对代码进行相应的优化。 - 对于循环或递归操作,确保有...
2. **使用死锁检测工具**:利用Android Studio或JDK自带的jstack工具进行分析,找出死锁的线程和锁。 3. **调整锁的顺序**:如果多线程访问共享资源时,确保所有线程按照相同的顺序获取锁,可以避免死锁。 4. **超时...
- 在等待条件满足时,使用`wait()`而不是忙等待循环,以节省CPU资源。 - **5.3 Double-Checked Locking单例模式** - 一种确保线程安全的单例模式实现方式。 - **5.4 另一种异常陷阱-连续的关键接口调用** - 处理...
而`jstack`则可以帮助开发者查看线程堆栈信息,找出可能存在的死锁或阻塞问题。 Arthas的CPU监测功能则通过`trace`和`monitor`命令实现。`trace`可以追踪指定方法的调用,记录方法执行时间,从而找出CPU消耗高的...
通过`jstack`命令可以获取线程的详细信息,找出死锁、线程挂起等问题。 - **线程池监控**:对于使用线程池的应用,监控线程池的大小、任务队列长度以及拒绝策略,可以避免资源过度消耗。 3. **CPU使用率** - **...
如果垃圾收集过于频繁或者耗时过长,CPU占用率会显著升高。通过调整JVM参数,如增大新生代或老年代大小,选择合适的垃圾收集器(如G1、ZGC或Shenandoah),以及设置合理的内存分配策略,可以优化垃圾收集的性能。 *...
- **CPU耗时分析**:找出消耗CPU最多的代码段。 - **内存分析**:检查是否存在内存泄漏,以及对象生命周期是否正常。 - **锁竞争**:分析线程竞争状态,优化同步机制。 7. **JVM内存溢出** - **堆溢出**:过多...
3. **线程耗时分析**:统计各线程执行时间,找出消耗CPU最多的线程。 4. **锁竞争分析**:分析线程对锁的争用情况,识别潜在的性能瓶颈。 5. **线程活动度分析**:显示线程的活跃程度,帮助定位长期处于非活动状态...
- jmap、jhat、jstack:命令行工具,用于获取堆信息、堆转储、线程堆栈快照等。 4. **JVM瓶颈分析** - CPU瓶颈:过高CPU占用可能源于过多的计算或者无休止的垃圾回收。通过分析方法耗时,找出热点代码进行优化。 ...
- **线程分析**:你可以查看应用中的所有线程状态,包括运行、等待、阻塞等,并且能够对死锁进行检测。这有助于找出可能导致应用卡顿或响应慢的线程问题。 - **CPU使用率监测**:VisualVM可以实时展示CPU的使用情况...
4. **线程状态**:展示所有运行中的线程,包括它们的状态(如运行、等待、阻塞等),便于分析死锁和线程竞争问题。 5. **类加载信息**:统计已加载的类数量和大小,帮助分析类加载相关的性能问题。 VisualVM不仅...
2. **业务异常**:如服务运行一段时间后自动退出、服务间调用耗时过长、多线程并发处理时出现问题、线程死锁等。 #### 三、如何定位问题 解决问题的第一步是准确定位问题所在。以下是一些常用的定位手段,可以按照...
TMDA能够帮助开发者快速定位阻塞、死锁或者过度CPU消耗的问题,这对于优化多线程应用的性能尤为关键。 TMDA主要包含以下几个关键特性: 1. **线程分析**:TMDA可以显示所有线程的详细信息,包括线程ID、线程状态...
它能展示所有运行中的线程状态,包括阻塞、等待、运行等,帮助开发者定位死锁、线程资源竞争等问题。 4. **CPU剖析** 对于性能瓶颈的查找,VisualVM提供了CPU剖析功能。它能够详细记录每个方法的CPU消耗时间,帮助...
2. **锁定分析**:它能识别出哪些线程正在持有锁,以及这些锁是否造成了其他线程的阻塞,从而找出可能的死锁或等待链。 3. **内存分析**:虽然IBM Thread and Monitor Dump Analyzer主要是针对线程的,但也能提供...
3. **内存管理**:Jtop可以帮助分析内存分配和垃圾回收的情况,包括新生代、老年代的内存使用,以及GC事件的频率和耗时,这对于优化内存配置和减少不必要的内存泄漏至关重要。 4. **JVM参数调整**:通过Jtop,用户...
使用Java自带的JConsole、JProfiler或者VisualVM可以监控CPU使用情况,找出耗时的操作。 3. **线程分析**:线程争用、死锁和不恰当的线程管理会导致性能下降。JStack可以帮助开发者查看线程状态,识别并解决问题。 ...