1. pgrep 查询进程的工具
pgrep 是通过程序的名字来查询进程的工具,一般是用来判断程序是否正在运行。在服务器的配置和管理中,这个工具常被应用,简单明了
用法: pgrep 参数选项 程序名
eg: pgrep java #查询出JAVA进程的进程号
常用参数:
-l 列出程序名和进程ID
-o 进程起始的ID
-n 进程终止的ID
2. 汇总某个进程下所有的线程数
方法一 :ls /proc/20967/task/|wc -l : 20967是进程号
方法二 : ps -eLf | grep 20967 |wc -l
ps:该方法对于排查JAVA各种容器(eg:tomcat)由于创建过多线程,导致cpu耗费大量的资源进行上线文切换非常有帮助。
我们可以写一个脚本,当线程数>阀值,则进行jstack dunp
3. TOP命令看线程资源使用情况
第一步:输入TOP命令
第二步: 输入 shift+h ,打开线程模式,查看目前最耗系统资源的线程是哪些
可以再按 1用CPU模式看各个CPU资源的使用情况 按O查看帮助
4 top+jstack
使用top命令看线程资源使用情况后,可以得到这些线程的pid,然后把这些线程号转换成16进制,
jstack -l pid(java进程号) :把java线程快照给dump下来.可以用来排查死锁,以及耗费系统资源线程当前的运行情况
eg: jstack -l pid >jstack_dump.log #将当前JVM线程快照dump到jstack_dump.log文件中
grep jstack_dump.log 16进制号 #这样可以看看当前这些耗费资源的线程的内存情况
5. jstack 打印当前线程堆栈情况
命令格式: jstack [-option] jvm_pid
参数: -l 打印关于锁的堆栈信息(long listing. Prints additional information about locks)
-m 混合打印模式,可打印C++和JAVA的堆栈信息
-h 打印帮助信息
6.查看运行时gc情况命令:
$JAVA_HOME/bin/jstat -gcutil `pgrep java` 1000 10 (后三个参数是PID,扫描间隔时间单位毫秒,扫描次数)
$JAVA_HOME/bin/jstat -gc `pgrep java` 1000 10
7.对于网络问题的定位
:
可以通过netstat命令来查看某个时间段的网络重传率。
通过netstat -l enX -sp tcp
收集发送的TCP包数和retransmit的包数,间隔一定时间过后
再次收集这两个数值,分别相减后相除,可得出在此采样时间内的TCP重传率
- 大小: 25.1 KB
- 大小: 29.7 KB
分享到:
相关推荐
Java线上故障排查是一项复杂而关键的任务,需要系统地收集和分析信息,以便快速定位并解决问题。文档中提到的各个知识点将帮助我们深入了解如何在Java环境中有效进行线上故障排查。 首先,文档提到了几种常见的排查...
在处理Java线上故障时,工程师需要具备一系列的技能来快速定位并解决生产环境中的问题。本文档围绕Java线上故障排查提供了详尽的方案和知识点,覆盖了从问题定位到解决方案的多个方面。 首先,了解Java线上常见问题...
JAVA 线上故障排查完整套路,从 CPU、磁盘、内存、网络、GC 一条龙! 本文档将详细介绍 Java 线上...本文档提供了一个完整的 Java 线上故障排查套路,涵盖了 CPU、磁盘、内存、网络和 GC 等多个方面的故障排查方法。
大厂高手骆俊武出品的《漫谈线上问题排查》电子书
Java线上故障排查是每个Java开发者或运维人员必备的技能之一,尤其在生产环境中,快速定位并解决问题至关重要。本文将深入探讨Java线上故障排查方案,帮助你掌握一系列实用的方法和技术。 一、日志分析 1. 日志级别...
JAVA线上问题排查和工具 内容详细 结合实际工作 贴合实际
本篇文章将探讨一个常见的问题——"线上应用故障排查之一:高CPU占用"。高CPU占用可能导致系统响应变慢,影响用户体验,甚至可能导致服务崩溃。解决这个问题需要深入理解应用程序的运行机制以及系统资源的管理。 ...
本文主要讨论了四种常见的线上故障类型:CPU问题、频繁GC、上下文切换过多以及磁盘问题,并提供了相应的排查工具和方法。 首先,CPU异常是较易察觉的故障类型。当CPU使用率过高时,通常需要通过`jstack`分析线程...
### 线上问题排查知识点 #### 一、查找 JDK 安装路径及验证方法 在 Linux 系统中,为了高效地排查线上 Java 应用的问题,首先需要明确 Java Development Kit (JDK) 的安装位置。这可以通过以下两种方式实现: 1. ...
EPON_EoC EoC EoC双向网改造导致电视播放异常故障排查.pdf EoC头端无法管理故障排查.pdf EoC终端注册不上故障排查.pdf EoC终端配置下发不生效故障排查.pdf EoC网络PPPoE拨号上网故障... 802.1x与EAD故障排查.pdf
Linux性能观测是系统管理员、架构师和开发人员需要掌握的重要技能,尤其在多任务操作系统环境中,理解Linux性能观测的各种指标和概念可以帮助我们更好地管理和优化系统性能。以下是对提供的文件内容进行知识点的详细...
线上问题排查是开发和运维工作中的一个重要组成部分,其目的是为了快速定位和解决问题,保证系统的稳定运行。在排查问题的过程中,使用合适的方法和工具至关重要,它们可以帮助我们更高效地进行问题分析和定位。下面...
线上故障定位分析是IT运维中的重要环节,当系统出现异常时,快速准确地定位问题能够大大减少业务中断的时间,提高系统的稳定性和用户满意度。本文将详细介绍一套线上故障排查的全面方案,涵盖CPU、磁盘、内存和网络...
在这个案例中,主要涉及的是线上服务的内存管理与问题排查,特别是针对Java应用程序的内存报警。以下是相关的知识点: 1. **内存报警**:当服务器的内存使用率超过一定阈值时,系统会发送报警,提示可能存在内存...
Arthas是一款功能强大且灵活的在线问题排查工具,它可以帮助开发者快速定位和解决在线问题。本文将详细介绍Arthas在线问题排查思路,包括常见的排查场景、改进策略和排查思路。 常见的排查场景 在实际开发中,我们...
计算机技术、IT咨询、人工智能AI理论介绍,学习参考资料计算机技术、IT咨询、人工智能AI理论介绍,学习参考资料计算机技术、IT咨询、人工智能AI理论介绍,学习参考资料计算机技术、IT咨询、人工智能AI理论介绍,学习...
除了线程dump,**堆内存分析**也是线上故障排查的重要手段,尤其在处理内存泄漏、性能瓶颈等问题时。JVM提供了多种工具来辅助进行堆内存分析,如JVisualVM、MAT(Memory Analyzer Tool)等,它们可以帮助开发者可视...
7. 维护与优化:除了故障排查外,对室分系统的定期维护和优化也是一项重要工作,以确保其性能稳定并适应网络变化。 8. 文档记录:在排查和处理流程中,详细记录故障情况、处理方法和结果是必要的,这对于后期的故障...