我们在搞性能测试的时候,对后台服务器的CPU利用率监控是一个常用的手段。服务器的CPU利用率高,则表明服务器很繁忙。如果前台响应时间越来越大,而后台CPU利用率始终上不去,说明在某个地方有瓶颈了,系统需要调优。这个是即使不懂技术的人都容易理解的事情。
上面理解对吗?我个人觉得不十分准确。这个要看后台你测试的进程是什么类型的。如果是计算密集型的进程,当前端压力越来越大的时候,很容易把CPU利用率打上去。但是如果是I/O网络密集型的进程,即使客户端的请求越来越多,但是服务器CPU不一定能上去,这个是你要测试的进程的自然属性决定的。比较常见的就是,大文件频繁读写的cpu开销远小于小文件频繁读写的开销。因为在I/O吞吐量一定时,小文件的读写更加频繁,需要更多的cpu来处理I/O的中断。
在Linux/Unix下,CPU利用率分为用户态,系统态和空闲态,分别表示CPU处于用户态执行的时间,系统内核执行的时间,和空闲系统进程执行的时间。平时所说的CPU利用率是指:CPU执行非系统空闲进程的时间 / CPU总的执行时间。
在Linux的内核中,有一个全局变量:Jiffies。 Jiffies代表时间。它的单位随硬件平台的不同而不同。系统里定义了一个常数HZ,代表每秒种最小时间间隔的数目。这样jiffies的单位就是1/HZ。Intel平台jiffies的单位是1/100秒,这就是系统所能分辨的最小时间间隔了。每个CPU时间片,Jiffies都要加1。 CPU的利用率就是用执行用户态+系统态的Jiffies除以总的Jifffies来表示。
在Linux系统中,可以用/proc/stat文件来计算cpu的利用率(详细的解释可参考:http://www.linuxhowtos.org/System/procstat.htm)。这个文件包含了所有CPU活动的信息,该文件中的所有值都是从系统启动开始累计到当前时刻。
如:
- [sailorhzr@builder ~]$ cat /proc/stat
- cpu 432661 13295 86656 422145968 171474 233 5346
- cpu0 123075 2462 23494 105543694 16586 0 4615
- cpu1 111917 4124 23858 105503820 69697 123 371
- cpu2 103164 3554 21530 105521167 64032 106 334
- cpu3 94504 3153 17772 105577285 21158 4 24
- intr 1065711094 1057275779 92 0 6 6 0 4 0 3527 0 0 0 70 0 20 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 7376958 0 0 0 0 0 0 0 1054602 0 0 0 0 0 0 0 30 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
- ctxt 19067887
- btime 1139187531
- processes 270014
- procs_running 1
- procs_blocked 0
输出解释
CPU 以及CPU0、CPU1、CPU2、CPU3每行的每个参数意思(以第一行为例)为:
参数 | 解释 |
user (432661) nice (13295) system (86656) idle (422145968) iowait (171474) irq (233) softirq (5346) |
从系统启动开始累计到当前时刻,用户态的CPU时间(单位:jiffies) ,不包含 nice值为负进程。1jiffies=0.01秒 从系统启动开始累计到当前时刻,nice值为负的进程所占用的CPU时间(单位:jiffies) 从系统启动开始累计到当前时刻,核心时间(单位:jiffies) 从系统启动开始累计到当前时刻,除硬盘IO等待时间以外其它等待时间(单位:jiffies) 从系统启动开始累计到当前时刻,硬盘IO等待时间(单位:jiffies) , 从系统启动开始累计到当前时刻,硬中断时间(单位:jiffies) 从系统启动开始累计到当前时刻,软中断时间(单位:jiffies) |
CPU时间=user+system+nice+idle+iowait+irq+softirq
“intr”这行给出中断的信息,第一个为自系统启动以来,发生的所有的中断的次数;然后每个数对应一个特定的中断自系统启动以来所发生的次数。
“ctxt”给出了自系统启动以来CPU发生的上下文交换的次数。
“btime”给出了从系统启动到现在为止的时间,单位为秒。
“processes (total_forks) 自系统启动以来所创建的任务的个数目。
“procs_running”:当前运行队列的任务的数目。
“procs_blocked”:当前被阻塞的任务的数目。
那么CPU利用率可以使用以下两个方法。先取两个采样点,然后计算其差值:
- cpu usage=(idle2-idle1)/(cpu2-cpu1)*100
- cpu usage=[(user_2 +sys_2+nice_2) - (user_1 + sys_1+nice_1)]/(total_2 - total_1)*100
以下用分别用bash和perl做的一个cpu利用率的计算:
本人注:以下代码则采用公式为:
- total_0USER[0]+NICE[0]+SYSTEM[0]+IDLE[0]+IOWAIT[0]+IRQ[0]+SOFTIRQ[0]
- total_1=USER[1]+NICE[1]+SYSTEM[1]+IDLE[1]+IOWAIT[1]+IRQ[1]+SOFTIRQ[1]
- cpu usage=(IDLE[0]-IDLE[1]) / (total_0-total_1) * 100
###bash 代码
- CODE:#!/bin/sh
- ##echo user nice system idle iowait irq softirq
- CPULOG_1=$(cat /proc/stat | grep 'cpu ' | awk '{print $2" "$3" "$4" "$5" "$6" "$7" "$8}')
- SYS_IDLE_1=$(echo $CPULOG_1 | awk '{print $4}')
- Total_1=$(echo $CPULOG_1 | awk '{print $1+$2+$3+$4+$5+$6+$7}')
- sleep 5
- CPULOG_2=$(cat /proc/stat | grep 'cpu ' | awk '{print $2" "$3" "$4" "$5" "$6" "$7" "$8}')
- SYS_IDLE_2=$(echo $CPULOG_2 | awk '{print $4}')
- Total_2=$(echo $CPULOG_2 | awk '{print $1+$2+$3+$4+$5+$6+$7}')
- SYS_IDLE=`expr $SYS_IDLE_2 - $SYS_IDLE_1`
- Total=`expr $Total_2 - $Total_1`
- SYS_USAGE=`expr $SYS_IDLE/$Total*100 |bc -l`
- SYS_Rate=`expr 100-$SYS_USAGE |bc -l`
- Disp_SYS_Rate=`expr "scale=3; $SYS_Rate/1" |bc`
- echo $Disp_SYS_Rate%
###perl 代码
- #!/usr/bin/perl
- use warnings;
- $SLEEPTIME=5;
- if (-e "/tmp/stat") {
- unlink "/tmp/stat";
- }
- open (JIFF_TMP, ">>/tmp/stat") || die "Can't open /proc/stat file!\n";
- open (JIFF, "/proc/stat") || die "Can't open /proc/stat file!\n";
- @jiff_0=<JIFF>;
- print JIFF_TMP $jiff_0[0] ;
- close (JIFF);
- sleep $SLEEPTIME;
- open (JIFF, "/proc/stat") || die "Can't open /proc/stat file!\n";
- @jiff_1=<JIFF>;
- print JIFF_TMP $jiff_1[0];
- close (JIFF);
- close (JIFF_TMP);
- @USER=`awk '{print \$2}' "/tmp/stat"`;
- @NICE=`awk '{print \$3}' "/tmp/stat"`;
- @SYSTEM=`awk '{print \$4}' "/tmp/stat"`;
- @IDLE=`awk '{print \$5}' "/tmp/stat"`;
- @IOWAIT=`awk '{print \$6}' "/tmp/stat"`;
- @IRQ=`awk '{print \$7}' "/tmp/stat"`;
- @SOFTIRQ=`awk '{print \$8}' "/tmp/stat"`;
- $JIFF_0=$USER[0]+$NICE[0]+$SYSTEM[0]+$IDLE[0]+$IOWAIT[0]+$IRQ[0]+$SOFTIRQ[0];
- $JIFF_1=$USER[1]+$NICE[1]+$SYSTEM[1]+$IDLE[1]+$IOWAIT[1]+$IRQ[1]+$SOFTIRQ[1];
- $SYS_IDLE=($IDLE[0]-$IDLE[1]) / ($JIFF_0-$JIFF_1) * 100;
- $SYS_USAGE=100 - $SYS_IDLE;
- printf ("The CPU usage is %1.2f%%\n",$SYS_USAGE);
相关推荐
Linux下的CPU利用率计算原理详解.docx Linux操作系统中内存buffer和cache的区别.docx Linux服务器环境搭建(设置).pdf linux简明维护手册.pdf Linux系统命令及其使用详解.doc Linux系统性能监控工具.doc Linux系统...
### Linux监控CPU脚本知识点详解 #### 一、脚本概述 在Linux系统管理与运维过程中,监控CPU使用情况是一项非常重要的任务。合理的CPU监控能够帮助我们及时发现系统的瓶颈问题,进而采取相应的优化措施,保证服务...
本文将深入探讨Load Average的工作原理,并解析其计算方式,帮助你更好地理解和利用这一信息。 **1. Load Average的基本概念** Load Average是指在特定时间间隔内,系统处于活动状态(包括运行和等待CPU资源)的...
这种机制可以使得不同的进程占用不同的 CPU 核心,从而提高系统的整体性能和资源利用率。 配置 Cgroup 中的 CPU 资源隔离机制需要在 /etc/cgconfig.conf 文件中进行配置。例如,我们可以在文件中添加以下内容: ```...
这一步骤非常重要,因为它能够有效地管理物理内存和虚拟内存,提高内存利用率和安全性。 #### 四、总结 通过对Linux内核在80x86平台上的启动过程进行分析,我们可以更加深入地理解Linux内核的工作原理及其高效性和...
### Linux内存分页机制原理详解 #### 一、引言 在现代操作系统中,内存管理是确保系统稳定性和性能的关键技术之一。Linux作为一款广泛使用的开源操作系统,其内存管理机制非常成熟且高效。本文旨在深入解析Linux...
在案例研究中,作者通过模拟持续高CPU利用率的情况,展示了如何使用`vmstat`来诊断问题所在,并提出解决方案。 ##### 4.3 案例研究:调度器过载 调度器过载是指由于过多的进程竞争有限的CPU资源而造成的性能问题。...
同时,了解ARM的多核处理、冯诺依曼和哈佛架构等特性,有助于优化软件性能和资源利用率。 六、开发环境与调试工具 有效的开发环境和调试工具是提高开发效率的关键。例如,使用交叉编译器在宿主机上构建适用于目标...
- **效率**:通过页面置换算法等技术减少不必要的内存访问,提高CPU利用率。 **3. 虚拟内存的基本原理** - **虚拟地址空间**:每个进程都有一个独立的虚拟地址空间,其中包含代码段、数据段和堆栈等。 - **页面与...
- **中断**:设备完成任务后向CPU发送中断信号,CPU暂停当前任务处理中断,提高CPU利用率。 - **DMA**:数据由DMA控制器直接在设备和内存间传输,无需CPU介入,提高传输速度。 总结,本章主要讨论了Linux操作系统...
- 减少对CPU的中断频率,提高CPU利用率。 - 增强CPU和I/O设备之间的并行性,提高系统整体性能。 #### 十二、Linux中的用户类型 Linux中的用户可以分为两种类型: - **超级用户(Root)**:拥有最高权限,可以...
如果一切正常,你应该能够看到关于目标主机的一些基本信息,例如CPU利用率、内存使用情况等。 #### 七、总结 通过上述步骤,我们不仅学习了如何在Linux系统中安装和配置`rstatd`服务,还了解了其基本的工作原理。`...
同时,Linux支持多线程,即一个进程可以包含多个执行流,共享同一地址空间,提高资源利用率和程序并发性。 进程调度是Linux内核中的重要功能,它的主要任务是决定哪个进程应当获得CPU的执行权。Linux采用多种调度...
- **资源利用率**:相比其他操作系统,Linux对硬件资源的需求相对较低。 - **广泛的应用范围**:Linux不仅可以用于桌面电脑,还可以应用于各种嵌入式设备,如智能手机(Android即基于Linux)、PDA等。 ##### 1.2 ...
- **虚拟内存**:为每个进程分配一个独立的地址空间,提高内存利用率。 - **分页机制**:将物理内存分成固定大小的页,提高内存访问效率。 - **缓存机制**:利用高速缓存减少磁盘访问次数,加快数据读写速度。 ####...
Linux Shell 监控脚本是一种自动化工具,用于实时监控系统的健康状态,包括CPU利用率、内存使用、硬盘空间以及登录用户数量等关键指标。当这些指标超过预设的警戒值时,脚本会通过邮件发送告警通知,帮助管理员及时...
- **提高系统资源利用率**:多个程序同时运行,使得CPU和其他硬件资源的利用率得到提升。 - **增加吞吐量**:单位时间内完成的任务数量增多,提高了系统的吞吐量。 - **提高系统的响应速度**:在多用户系统中,每...
这种机制提高了硬件资源的利用率,同时简化了中断管理。 #### 三、Linux的软中断机制 除了硬件中断外,Linux还提供了软中断机制。软中断是软件模拟的中断,它用于处理那些不必立即响应的任务,从而避免占用过多的...
**Linux任务管理器htop详解** `htop`是一款强大的、彩色图形化的进程管理工具,它是Linux系统下经典的`top`命令的一个增强版本。在Linux环境中,`htop`提供了更为直观且用户友好的界面,使得监控系统资源、管理进程...