`
erichi101
  • 浏览: 11318 次
文章分类
社区版块
存档分类
最新评论

CPU Usage vs Load

阅读更多

 

CPU利用率:显示的是程序在运行期间实时占用的CPU百分比

CPU负载:显示的是一段时间内正在使用和等待使用CPU的平均任务数。CPU利用率高,并不意味着负载就一定大。举例来说:如果我有一个程序它需要一直使用cpu的运算功能,那么此时cpu的使用率可能达到100%,但是cpu的工作负载则是趋近于“1”,因为cpu仅负责一个工作嘛!如果同时执行这样的程序两个呢?cpu的使用率还是100%,但是工作负载则变成2了。所以也就是说,当cpu的工作负载越大,代表cpu必须要在不同的工作之间进行频繁的工作切换。

 

通过下面的几个部分的了解,可以一步一步的找出Load Average在压力测试中真正的作用。

CPU时间片

       为了提高程序执行效率,大家在很多应用中都采用了多线程模式,这样可以将原来的序列化执行变为并行执行,任务的分解以及并行执行能够极大地提高程序的运行效率。但这都是代码级别的表现,而硬件是如何支持的呢?那就要靠CPU的时间片模式来说明这一切。程序的任何指令的执行往往都会要竞争CPU这个最宝贵的资源,不论你的程序分成了多少个线程去执行不同的任务,他们都必须排队等待获取这个资源来计算和处理命令。先看看单CPU的情况。下面两图描述了时间片模式和非时间片模式下的线程执行的情况:


 1 非时间片线程执行情况


 2 非时间片线程执行情况

       在图一中可以看到,任何线程如果都排队等待CPU资源的获取,那么所谓的多线程就没有任何实际意义。图二中的CPU Manager只是我虚拟的一个角色,由它来分配和管理CPU的使用状况,此时多线程将会在运行过程中都有机会得到CPU资源,也真正实现了在单CPU的情况下实现多线程并行处理。

       CPU的情况只是单CPU的扩展,当所有的CPU都满负荷运作的时候,就会对每一个CPU采用时间片的方式来提高效率。

       Linux的内核处理过程中,每一个进程默认会有一个固定的时间片来执行命令(默认为1/100秒),这段时间内进程被分配到CPU,然后独占使用。如果使用完,同时未到时间片的规定时间,那么就主动放弃CPU的占用,如果到时间片尚未完成工作,那么CPU的使用权也会被收回,进程将会被中断挂起等待下一个时间片。

 

CPU利用率和Load Average的区别

       压力测试不仅需要对业务场景的并发用户等压力参数作模拟,同时也需要在压力测试过程中随时关注机器的性能情况,来确保压力测试的有效性。当服务器长期处于一种超负荷的情况下运行,所能接收的压力并不是我们所认为的可接受的压力。就好比项目经理在给一个人估工作量的时候,每天都让这个人工作12个小时,那么所制定的项目计划就不是一个合理的计划,那个人迟早会垮掉,而影响整体的项目进度。

CPU利用率在过去常常被我们这些外行认为是判断机器是否已经到了满负荷的一个标准,看到50%-60%的使用率就认为机器就已经压到了临界了。CPU利用率,顾名思义就是对于CPU的使用状况,这是对一个时间段内CPU使用状况的统计,通过这个指标可以看出在某一个时间段内CPU被占用的情况,如果被占用时间很高,那么就需要考虑CPU是否已经处于超负荷运作,长期超负荷运作对于机器本身来说是一种损害,因此必须将CPU的利用率控制在一定的比例下,以保证机器的正常运作。

Load AverageCPULoad,它所包含的信息不是CPU的使用率状况,而是在一段时间内CPU正在处理以及等待CPU处理的进程数之和的统计信息,也就是CPU使用队列的长度的统计信息。为什么要统计这个信息,这个信息的对于压力测试的影响究竟是怎么样的,那就通过一个类比来解释CPU利用率和Load Average的区别以及对于压力测试的指导意义。

我们将CPU就类比为电话亭,每一个进程都是一个需要打电话的人。现在一共有4个电话亭(就好比我们的机器有4核),有10个人需要打电话。现在使用电话的规则是管理员会按照顺序给每一个人轮流分配1分钟的使用电话时间,如果使用者在1分钟内使用完毕,那么可以立刻将电话使用权返还给管理员,如果到了1分钟电话使用者还没有使用完毕,那么需要重新排队,等待再次分配使用。


 3 电话使用场景

       上图中对于使用电话的用户又作了一次分类,1min的代表这些使用者占用电话时间小于等于1min2min表示使用者占用电话时间小于等于2min,以此类推。根据电话使用规则,1min的用户只需要得到一次分配即可完成通话,而其他两类用户需要排队两次到三次。

       电话的利用率 = sum (active use cpu time)/period

 

每一个分配到电话的使用者使用电话时间的总和去除以统计的时间段。这里需要注意的是是使用电话的时间总和(sum(active use cpu time)),这与占用时间的总和(sum(occupy cpu time))是有区别的。(例如一个用户得到了一分钟的使用权,在10秒钟内打了电话,然后去查询号码本花了20秒钟,再用剩下的30秒打了另一个电话,那么占用了电话1分钟,实际只是使用了40秒)

电话的Average Load体现的是在某一统计时间段内,所有使用电话的人加上等待电话分配的人一个平均统计。

电话利用率的统计能够反映的是电话被使用的情况,当电话长期处于被使用而没有的到足够的时间休息间歇,那么对于电话硬件来说是一种超负荷的运作,需要调整使用频度。而电话Average Load却从另一个角度来展现对于电话使用状态的描述,Average Load越高说明对于电话资源的竞争越激烈,电话资源比较短缺。对于资源的申请和维护其实也是需要很大的成本,所以在这种高Average Load的情况下电话资源的长期“热竞争”也是对于硬件的一种损害。

低利用率的情况下是否会有高Load Average的情况产生呢?理解占有时间和使用时间就可以知道,当分配时间片以后,是否使用完全取决于使用者,因此完全可能出现低利用率高Load Average的情况。由此来看,仅仅从CPU的使用率来判断CPU是否处于一种超负荷的工作状态还是不够的,必须结合Load Average来全局的看CPU的使用情况和申请情况。

所以回过头来再看测试部对于Load Average的要求,在我们机器为8CPU的情况下,控制在10 Load左右,也就是每一个CPU正在处理一个请求,同时还有2个在等待处理。看了看网上很多人的介绍一般来说Load简单的计算就是2* CPU个数减去1-2左右(这个只是网上看来的,未必是一个标准)。

 

 补充几点:

1.对于CPU利用率和CPU Load Average的结果来判断性能问题。首先低CPU利用率不表明CPU不是瓶颈,竞争CPU的队列长期保持较长也是CPU超负荷的一种表现。对于应用来说可能会去花时间在I/O,Socket等方面,那么可以考虑是否后这些硬件的速度影响了整体的效率。

这里最好的样板范例就是我在测试中发现的一个现象:我们的项目在当前在处理过程中,为了提高处理效率,将控制策略以及计数信息都放置在Memcached Cache里面,当我将Memcached Cache配置扩容一倍以后,CPU的利用率以及Load都有所下降,其实也就是在处理任务的过程中,等待Socket的返回对于CPU的竞争也产生了影响。

 

2未来多CPU编程的重要性。现在服务器的CPU都是多CPU了,我们的服务器处理能力已经不再按照Moore定律来发展。

就我上面提到的电话亭场景来看,对于三种不同时间需求的用户来说,采用不同的分配顺序,我们可看到的Load Average就会有不同。

 

假设我们统计Load的时间段为2分钟,如果将电话分配的顺序按照:1min的用户,2min的用户,3min的用户来分配,那么我们的Load Average将会最低,采用其他顺序将会有不同的结果。所以未来的多CPU编程可以更好的提高CPU的利用率,让程序跑的更快。

 

 

分享到:
评论

相关推荐

    一个小巧精致的CPU监视器

    - 在`GetCPUUsage`方法中,通过调用`RegQueryValueEx`函数查询`KERNEL\CPUUsage`键值,得到的结果即为当前的CPU使用率。 #### 3. 数据处理与图形展示 - **数据处理**: - 定时器每100毫秒触发一次,更新CPU使用...

    监视 CPU 使用情况的例子

    the CPUUsage as 10 boxes (1 box of course, represents 10%). This example also uses the SetWindowPos API function to set the form to the TOPMOST position making it visible at all times. You could...

    asp.net监测CPU占用率-点线图展示

    string cpuUsageStr = cpuUsage.ToString("N2") + "%"; // 更新页面元素,如Label或图表控件 CpuUsageLabel.Text = cpuUsageStr; } } ``` 这里,`IsPostBack`检查确保在首次加载页面时执行该逻辑,而不是每次...

    精彩编程与编程技巧-一个小巧精致的CPU监视器...

    - `CPUUsage`类中的`GetCPUUsage()`方法实现了从注册表中读取CPU使用率的具体逻辑。通过调用`RegOpenKey`和`RegQueryValueEx`函数来打开和查询注册表键值。 - 在获取到CPU使用率后,使用`PictureBox`的绘图功能来...

    freertos下的cpu占用率统计.zip

    "freertos下的cpu占用率统计.zip"文件提供了一种在FreeRTOS环境下统计CPU占用率的方法,这种方法具有可移植性,不仅适用于FreeRTOS,也适用于其他RTOS。 首先,理解CPU占用率的定义:它是指在一段时间内,CPU执行...

    Java获取计算机CPU、内存等信息

    System.out.println("当前CPU使用率: " + cpuLoad + "%"); } } ``` `getSystemCpuLoad()`方法返回的是一个double类型的值,表示CPU负载,范围在0.0到1.0之间,对应0%到100%的CPU使用率。需要注意的是,这个值是...

    android-cpu-net-ram.rar_android_android 界面_android Ram_cpu_cpu

    - 对于更复杂的CPU监控,可以使用第三方库,如`cpuusage`或`android-cpu-usage`,它们封装了获取和解析CPU数据的过程。 3. **网络状态获取** - Android提供了`ConnectivityManager`类来检查网络连接状态,如移动...

    Windows 操作系统的 CPU 使用率:获取 Windows 操作系统的 CPU 负载-matlab开发

    cpuUsage = str2double(split(content, ' ')[4]); delete('stdout.txt'); end end ``` 上述MATLAB函数首先尝试使用WMIC命令,如果成功则读取结果并转换为CPU使用率;如果失败,它会调用VBS脚本并处理返回的CPU...

    Highcharts动态曲线图(使用jna监视cpu使用率)

    double cpuUsage = cpuUsageLib.getCPUUsage(); ``` 这里假设`DllTest.dll`有一个名为`getCPUUsage`的函数,返回CPU的使用率。将`getRandomValue`替换为调用这个函数,你就能实时获取并更新图表数据了。 总结起来...

    ModernGadgets_1.6.3.rmskin

    - Line graph displays CPU temperature**, per-thread CPU usage, RAM usage, and Page file usage - Optional average CPU usage graph display - Opens task manager on double-click - Able to be scaled to ...

    JAVA面试问题,继续

    CPU 负载(Load Average)和 CPU 利用率(CPU Usage)是两个不同的概念。CPU 负载指的是系统当前正在运行和等待运行的进程数之和,而 CPU 利用率则是当前正在运行的进程实时占用 CPU 的百分比。 Linux 指令应用 ...

    C#获取CPU、硬盘、网卡信息

    public class CpuUsage { public static void Main() { ManagementObjectSearcher searcher = new ManagementObjectSearcher("SELECT * FROM Win32_Processor"); foreach (ManagementObject obj in searcher.Get...

    【Maclean Liu技术分享】开Oracle调优鹰眼,深入理解AWR性能报告 第二讲 正式版 20130

    - **CPU Usage**:CPU使用率是衡量CPU繁忙程度的重要指标。它包括用户模式下的CPU使用率和系统模式下的CPU使用率之和。 - **Busy Time**:忙碌时间是指CPU真正执行任务的时间。可以通过Elapsed Time * NUM_CPUS * ...

    Linux性能指标含义及参考范围

    ### Average Load(平均负载) 平均负载是指一段时间内系统的平均任务队列长度,它反映了系统的繁忙程度。一个常见的计算方法是将最近1分钟、5分钟和15分钟内的平均负载分别展示。例如,如果系统中有两个CPU,且...

    CPU-Temperature-and-Usage-Datalog:在一个说明性图表中可视化CPU负载和温度的历史记录

    在一个说明性图表中可视化CPU负载和温度的历史记录。 文件系统 : │ control.db --> Database : │ID│RoomID│TemperatureC│Datetime │ │ Flask_Data_fetching.py --> Server py : in: <IP> ; <IP>/...

    Sentinel Go让微服务稳如磐石.pptx

    Sentinel Go 引入了系统自适应保护,根据系统负载(CPU usage和load)调整入口流量,确保系统稳定运行。这种机制基于TCP的BBR算法,通过动态探测系统预估容量并自适应调整流控阈值。 ### 扩展能力 Sentinel Go 不仅...

    chillout:通过非阻塞异步循环减少CPU使用率,并在心理上加快JavaScript的运行速度

    chillout.js 通过非阻塞异步循环减少CPU使用率,并在心理上加快速度,以改善JavaScript的用户体验。目录等到的for 比较表贡献执照 概述与通常的“物理上缩短处理时间”的加速方式不同,chillout.js通过减少CPU使用率...

    nagios被监控端安装.txt

    主机资源监控(CPU load、disk usage、system logs),也包括Windows主机(使用NSClient++ plugin) 数据库监控 (Mysql、Oracle) 可以指定自己编写的Plugin通过网络收集数据来监控任何情况(温度、警告……) ...

    15 分钟无门槛构建服务器性能监控系统

    CPUUsage则可以观察到CPU的使用率和各种进程对CPU资源的占用情况;系统load值与进程图能够展示系统负载情况和进程数量,帮助管理者及时发现异常。 模板变量在七牛云的监控系统中起到了重要的过滤作用。通过设置不同...

Global site tag (gtag.js) - Google Analytics