昨天收到服务器报警,负载非常高,最高的时候都到了35了。今天把查询过程总结一下
先明确几个概念:
1、系统负载System load :系统CPU繁忙程度的度量,即还有多少个进程等待CPU的调度
2、平均负载load average :一段时间内的平均负载,这个一段时间一般取1分钟、5分钟、15分钟
查看命令如下:
命令1 :top
查看上图可以看出
当前时间 13:26:08
系统已运行的时间 288 days, 20:56
当前在线用户 1 user
1分钟的平均负载是 32.7 5分钟平均负载是33.28 15分钟的平均负载是33.75
命令2:uptime
也可以看出1分钟的平均负载是 0.67 5分钟平均负载是0.77 15分钟的平均负载是0.81
当前时间 10:12:58
系统已运行的时间 289 days, 17:43
当前在线用户 1 user
命令3 cat /proc/loadavg
除了前3个数字表示平均负载外,后面的1个分数,分母表示系统进程总数,分子表示正在运行的进程数;最后一个数字表示最近运行的进程ID
命令4 w
用来查看登录者的信息及他们的行为
同样可以看到类似的内容
Load则表示系统的繁忙程度
单核
Load<1:没有等待
Load==1:系统已无额外的资源跑更多的进程了
Load>1:进程都堵着等待资源
注:
需要警惕的
Load < 0.7时:系统很闲,要考虑多部署一些服务
0.7 < Load < 1时:系统状态不错
Load == 1时:系统马上要处理不多来了,赶紧找一下原因
Load > 5时:系统已经非常繁忙了
不同Load值说明的问题
1)1分钟Load>5,5分钟Load<1,15分钟Load<1
短期内繁忙,中长期空闲,初步判断是一个抖动或者是拥塞前兆
2)1分钟Load>5,5分钟Load>1,15分钟Load<1
短期内繁忙,中期内紧张,很可能是一个拥塞的开始
3)1分钟Load>5,5分钟Load>5,15分钟Load>5
短中长期都繁忙,系统正在拥塞
4)1分钟Load<1,5分钟Load>1,15分钟Load>5
短期内空闲,中长期繁忙,不用紧张,系统拥塞正在好转
查看cpu核心的命令
grep 'model name' /proc/cpuinfo | wc -l
8就是说明是8核心
CPU是8核,load<8是不会有问题的
好了,上面是一些简单的基础介绍
说一下昨天找问题的过程
第一步 收到报警,说负载已经到了32.
这个时候马上到相关的服务器上查看,使用的是TOP命令
结果如下:
发现是python相关的应用在大量吃CPU
这个时候再使用
ps -ef | grep 'python'
然后找到相应的pid,就能定位到是哪个程序造成的问题了。后面的事情就是对程序内部的问题进行分析了
也可以直接用
ps -ef | grep '9966'来查找到相应的程序
相关推荐
### Linux下的负载均衡使用与配置详解 在现代网络环境中,为了提高服务器的稳定性和网络带宽的利用率,负载均衡技术成为了一个重要的组成部分。本篇文章将详细介绍如何在Linux系统下通过双网卡绑定技术来实现负载...
### 详解Linux中Load_average负载 在Linux系统中,了解`Load average`(负载平均)的概念对于系统管理和性能监控至关重要。本文将详细解释Linux系统中的负载平均值,并探讨其背后的意义以及如何根据这些值来判断...
总结来说,本文提出的`tiquinfo`和`getInfo`工具,结合MySQL数据库,为Linux系统提供了实时、高效、可扩展的性能监控解决方案。这对于系统开发、运维人员理解系统行为,优化资源分配,以及预防和解决性能问题具有...
总结,通过以上步骤,我们可以成功地在 Linux 上安装并配置 Apache、Tomcat 和 mod_jk,实现负载均衡。这不仅可以提高系统的可用性,还能有效利用多台服务器的资源,降低单点故障的风险。在实际应用中,根据服务器...
总结来说,基于Linux的高可用性负载均衡集群技术为企业提供了强大的服务支撑,有效解决了大规模访问、高并发请求和硬件投入等问题。采用开源软件如Nginx和Keepalived,不仅可以降低成本,还能确保7x24小时的稳定运行...
总结来说,排查Linux服务器高负载问题需综合运用各种命令和工具,从多个角度出发,包括系统行为历史、资源监控、服务状态、文件系统健康、内核与网络以及应用日志分析。通过对这些方面的深入理解和检查,我们能够...
总结来说,这篇研究论文探讨了在Linux服务器环境下,如何通过改进多网口负载均衡算法来提升网络服务的性能。具体地,它提出了一种基于自适应负载均衡的动态接收算法,并利用netfilter技术实现了这一算法,从而有效地...
总结来说,基于LVS技术的Linux服务器负载均衡研究旨在构建一个高可扩展、高可用的操作平台,通过智能调度策略,提升校园网服务器应对并发访问的能力,降低成本,充分利用现有资源,确保服务的稳定性和效率。...
### Linux系统问题排查知识点 #### 一、概述 在Linux系统运维过程中,系统问题排查是一项基本而重要的工作。本文档将详细介绍Linux系统中常见的问题排查方法,包括CPU问题、内存问题、网络问题以及磁盘问题等。...
#### 十、Linux运维面试总结 - **面试技巧**: - 强调项目经验和解决问题的能力。 - 准备针对特定技术领域的深度问题。 - **常见面试题目**: - Linux命令行操作。 - 系统故障排查。 - 网络协议和安全基础知识。...
最后,Linux运维面试总结部分提供了面试技巧总结和面试题目总结,帮助求职者做好面试准备,顺利通过面试,获得满意的工作机会。 整套系列书籍内容丰富,从基础到深入,既适合Linux初学者,也适合有一定基础希望继续...
通过上述总结可以看出,《Linux的高级路由与流量控制(教程)》覆盖了Linux网络管理中的众多高级主题,不仅适合于网络管理员和技术人员阅读学习,也对想要深入了解Linux网络架构的开发者具有很高的参考价值。
Linux下的高并发系统内核优化和Nginx负载均衡机制及常见问题也是Linux运维人员需要掌握的知识。最后,Linux运维职业规划和面试总结为希望从事Linux运维工作的人士提供了职业规划和面试技巧的建议。 以上内容不仅为...
### Linux双网卡聚合与负载均衡详解 #### 一、引言 在现代网络环境中,为了提高网络连接的稳定性和带宽,Linux系统提供了一种称为“双网卡聚合”的技术,即通过软件的方式将多张物理网卡绑定成一个逻辑上的单一...
Linux运维工程师面试常见问题涉及了广泛的领域,包括操作系统基础知识、命令使用、服务器配置与管理,以及个人技能评估。以下是对这些关键知识点的详细说明: **一、Linux操作系统基础知识** 1. **Linux版本问题**...
- **注意事项**:虽然多网卡负载均衡可以显著提高网络性能,但也存在一些潜在问题,例如复杂性增加、配置难度大等。 #### 十、Netfilter与IPRoute——给数据包作标记 - **概念**:Netfilter是Linux内核的一部分,...
此外,Linux Virtual Server(LVS)是一种开源的负载均衡解决方案,能够在Linux系统上实现高性能的负载均衡和故障转移。 在具体实施Tomcat集群时,首先,用户的请求会经过DNS解析,到达NAT分配器。NAT分配器依据...
四层负载均衡主要依据TCP/UDP协议中的目标地址和端口来决定流量的分配,例如LVS(Linux Virtual Server)和F5这类产品。这种类型的负载均衡通常具有较高的性能,适用于多种网络协议,但对于URL级别的个性化负载不太...
### Linux 下 Apache+Tomcat 基于集群负载均衡 Session 复制 #### 一、概述 在现代 Web 应用开发中,为了提高服务的可用性和响应速度,常常会采用集群技术。其中,Apache 和 Tomcat 组合是常用的方案之一。本篇...