`
BucketLi
  • 浏览: 195054 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
博客专栏
5a76a659-f8e6-3bf3-b39a-8ae8f7a0f9d9
Percolator与分布...
浏览量:5674
社区版块
存档分类
最新评论

排查机器load高原因

 
阅读更多
有1个机器上load比较高,需要排查下是什么原因造成的,这边记录下排查过程。

1. top 先看下机器总体状况,其中cpu sy 占用大概到90%,us,wa等指标都很低,说明系统中存在大量的线程切换。

2. 然后top中看到一个java进程占用cpu 100%以上,基本上定位到该进程可能存在问题。

3. ps -Lf pid  查看该java进程的各线程资源占用比,发现有两个线程占用cpu比较明显,将这两个线程线程号转成16进制备用

4. jstack pid > stack 将该java进程的线程栈dump出来,grep 上一个步骤准备好的线程号,找到对应代码

5. 最后发现是java进程使用的disruptor的WaitStrategy选择不是很合理,修改后发布,一些归于平静
分享到:
评论

相关推荐

    DataLoad v4.2gziolHH.

    - 免安装:这个版本的DataLoad是一个可执行的zip文件,用户解压后即可直接运行,无需经过传统的安装步骤,方便在多台机器上快速部署。 2. **DataLoad v4.2的新特性**: - 性能优化:每个版本的迭代都会带来性能上...

    Spark跨集群bulk load(6-2)

    最后,实施跨集群bulk load时,还需要考虑安全性、监控和日志记录,以确保数据的安全传输和故障排查。在实际操作中,可能需要根据具体的业务需求和集群环境,灵活选择和调整策略,以达到最佳的效果。

    Load runner 8.1中文教程

    【Load Runner 8.1中文教程】是一份深入解析HP LoadRunner 8.1版本的综合性教程,旨在帮助用户掌握这一强大的性能测试工具。LoadRunner是业界广泛使用的应用性能测试软件,尤其在企业级系统中,它能模拟大量并发用户...

    机器学习flask部署.zip

    同时,设置日志记录,方便后期排查问题。 7. **测试与优化**:对API进行功能和性能测试,确保其正常运行,并根据需要进行优化,如提升响应速度、减少内存占用等。 8. **部署**:将应用部署到服务器或云平台,如AWS...

    系统黄金指标之延迟(Latency)指标的故障诊断1

    3. **排查问题:**对于少量机器出现问题的情况,运维人员会登录这些机器查看相关日志,结合系统性指标(如CPU、Load)进行深入分析。这有助于定位问题,例如内存溢出、进程阻塞或硬件故障。 延迟问题的诊断是一个从...

    在编写一个机器学习项目时,需要安装和使用 TensorFlow 库进行模型训练

    ImportError: DLL load failed: The specified module could not be found. ``` #### 解决方案 针对上述问题,可以按照以下步骤逐一排查并解决问题: 1. **检查安装版本**: - 首先确认安装的 TensorFlow 版本...

    AIX高级系统管理培训教材.pptx

    【LPAR(逻辑分区)】是AIX系统中的一个重要特性,允许在同一物理机器上运行多个独立的操作系统实例。DLPAR(动态逻辑分区)允许在不停机的情况下动态调整资源,如CPU和内存。CuOD(按需CPU)是一种资源管理技术,...

    AWS 云上Linux实例优化.pptx

    3. **负载均衡器(Load Balancers)**:NLB(Network Load Balancer)、ALB(Application Load Balancer)等可以分散流量,确保高可用性和容错性。 4. **存储优化**:根据需求选择合适的存储类型,如SSD支持的EBS...

    mips汇编指令学习

    使用工具如GDB(GNU调试器)或MIPS模拟器(如SPIM)可以帮助调试和分析MIPS汇编代码,这对于学习过程中的错误排查和性能优化至关重要。 以上只是MIPS汇编指令学习的基础,深入研究还需要对每个指令的详细行为、...

    html 转pdf并翻译.zip

    这个工具可能包含一个用户界面,方便非程序员进行...同时,如果遇到问题,debug.log和loadtime.txt可以提供故障排查的线索。如果你对Python编程和自动化处理有兴趣,研究这个工具的内部实现也是一个很好的学习机会。

    携程第四代架构之软负载SLB实践之路.pdf

    携程面临的问题主要是面向机器的架构,单机上运行多个应用,导致应用与人员的耦合度过高,运维复杂。为了解决这些问题,携程引入了软负载均衡器Nginx,实现了应用运维的解耦,降低了系统的复杂度。 设计一个业务...

    解决电脑重启问题

    具体操作为,在BIOS界面中找到“Load Default Setup”选项并执行,这一步骤可以清除所有非默认设置,让系统回到初始状态。 #### 3. APM/NT Legacy Node没有开启 **问题现象**:某些情况下,若APM/NT Legacy Node未...

    cv2所需要的dll文件

    在使用OpenCV(也称为opencv-python)这个强大的计算机视觉库时,有时会遇到"importDLL load error"这样的错误,提示缺少必要的dll文件。这通常是因为系统中缺失了OpenCV运行所需的动态链接库(DLL),这些文件是...

    查看CPU和内存的实验

    2. **LOAD** / **STORE**:加载指令用于将内存中的数据复制到寄存器,存储指令则反之。这在查看内存内容时非常有用。 3. **READ** / **WRITE**:某些架构可能有专门的读写指令,用于与外设如内存进行数据交换。 4. *...

    opencv-python (CV2) 所需要的DLL文件

    在Python编程环境中,OpenCV(通常称为cv2)是一个广泛使用的计算机视觉库,它提供了丰富的图像处理和机器学习功能。然而,在安装和使用OpenCV时,有时会遇到一个常见的问题,即“DLL load failed while importing ...

    精选8道Dubbo面试题!.zip

    - **ConsistentHash LoadBalance**:一致性哈希,相同参数的请求总是发到同一台机器上,适用于有状态的服务。 5. **Dubbo的容错机制有哪些?** - **Failsafe**:失败安全,出现异常时直接忽略。 - **Failfast**...

    Apache+Tomcat+Linux集群和负载均衡

    4. **错误排查**: 仔细检查配置文件中的每一项设置,特别是路径、端口等信息。出现问题时,查看日志文件可以帮助快速定位问题所在。 通过以上步骤,我们可以成功搭建一套基于Apache+Tomcat+Linux的负载均衡集群环境...

    小米REC界面读取型号 序列号 处理器 版本号的小工具

    总的来说,这个小工具是针对小米手机用户的一款实用软件,它使得在REC模式下获取设备关键信息变得简单和快捷,对于进行系统维护、刷机或故障排查等操作提供了便利。同时,由于其支持官方和第三方REC,适用范围更广泛...

    project_01.rar

    在实践中,你可能会遇到更多的问题,例如错误排查、性能优化等,但只要持续学习和实践,这些问题都将迎刃而解。希望这个项目_01的源码能帮助你更好地理解OpenCV与VS2015的结合使用,从而开启你的机器视觉之旅。

Global site tag (gtag.js) - Google Analytics