`

[Binospace] Linux系统性能分析的实践方法

阅读更多
任何系统的性能分析以及分布式负载平衡策略的执行,需要首先了解当前系统的资源使用情况。
从资源角度进行划分,可以把资源分为如下4类:
1)处理器资源,CPU
2)内存资源,Memory,从广义概念上讲,这还包括Swap\Cache\Buffer等
3)磁盘资源,Disk
4) 网络资源,Network IO,从广义概念上讲,还要考虑上层网络交换机的带宽和交换机之间的带宽。
 
1、CPU分析
CPU分析常用的工具top。
 
 
2、内存分析
内存分析最常用的工具有free、vmstat等。
一般内存的分析要分成两个层次来进行:
1)系统层面上。free可以查看当前系统的内存使用状况,用来分析机器的内存整体使用状况。
Linux内核为了获取更好的性能,总会尽可能地使用空余内存作为系统Cache,从上图可以看到有23G的系统Cache,对于读多写少的应用而言,这个数据是正常的。
vmstat是一个可以实时查看当前CPU、内存、swap使用的情况,该命令是系统监控与分析的一个常用工具。
  • procs:标识了当前有多少进程正在等待执行,由此来判断是否因为资源紧张而造成进程的流程运行。r标示了有多少个进程等待获得CPU访问权限,b代表了有多少个进程处于Sleep状态。一般而言,r b都为0,如果出现b>0的情况,往往是CPU资源不足的一个信号,此时,或许有大量的IO吞吐的应用在执行,或者运行的process消耗了太多的CPU时间片。
  • memory: 标识了系统的内存使用状况。具体数值与free命令类似。
  • swap:标识了系统的swap的使用的情况,si代表了当前有多少数据从swap区域被置换到内存区域,so代表有多少数据从内存区域被换入到swap。如果系统出现频繁的出现swap换入换出的状况,会影响到系统的性能。
  • io:标识了磁盘的读写的活跃情况。bi每秒读block的个数,bo每秒写block的个数,上图中,可以看到当前系统会有较多的写磁盘操作。
  • System:in代表每秒系统中断的个数,包括来自于System Clock的中断;cs代表系统上下文切换的次数。
  • CPU:us代表用于处理用户态任务的百分比,sy kernel相关的任务占用的百分比,id 空闲状态的百分比,wa:等待IO的百分比。根据经验,id低于40%表示当前系统处于比较繁忙的状态,wa如果较大往往会造成procs中r的值升高。
另外,vmstat -m 会打印slab信息,在Linux Kernel2.2版本引进了slab allocation的分配方式,从而可以更快速的掌握当前系统的内存分配状况。所有的应用程序内存的使用,最终都会映射成对应Cache下的slab空间,因此,通过可以分析出当前系统的内存开辟的分布情况。
 
跟进一步,我们来看一下在Linux Kernel中内存的原理。在内核中,内存是按照Pages进行组织的,内存分为三类:
1)Read Pages,这部分内存是从disk读取出来的,且在内存中没有做任何修改的数据,常见的形式,如:以Read形式打开的文件、执行的Binary、或者加载的Library等。Linux会尽可能按照需要把数据导入内存,因此,在大部分情况下我们使用free命令看到的Cache部分的内存总会比较大。当内存开始变得短缺时,内核会开始从Cache的数据进行淘汰。
2)Dirty Pages,Kernel修改的内存的数据,并需要写回磁盘的数据。系统进程pdflush就是执行该操作。一旦系统的内存变得短缺,系统进程kswapd会写这些page到磁盘。
3)Anonymous Pages,还有一部分的数据,并没有与一个文件或者设备相对应,但是它存在于一个进程内部。例如:我们在程序中使用的Map结构存储的应用的数据之类的。在内存紧张的时候,kswapd进程会将这些内存写入swap区域,以保证系统的内存空间。
 
 
高级一点的内存分析工具有:
pcat、memdump、htop。
pcat可以dump出某个process的内存镜像。在某些特殊的情况下,我们无法分析应用的性能的瓶颈的时候,可以使用该工具。配合strings,可以查看进程里都有那些数据,这可以在一定程度上降低被hang住的程序丢失数据的影响。注意pcat基本会打印全部的内存镜像,所以生成的文件较大。
memdump会打印出系统整个内存镜像。
htop是一个类似与top,但功能更加强大的工具,可以实现对各种系统参数的分析。
 
 
优化策略与补充:
1)对于性能要求比较高,同时机器物理内存足够使用的情况下,建议关闭swap分区。如果有ssd的情况下,可以使用ssd空间挂载swap分区。
2)对于JAVA进程,除了使用以上介绍的工具进行profiling之外,还要注意GC的影响,目前根据使用的情况来看,如果使用CMS老生代垃圾回收器,对于IO压力比较高的应用来,不要把CMSInitiatingOccupancyFraction的值设置超过70,一般来看设置在50~60之间比较合适。
 
3、磁盘分析
目前常用磁盘分析工具有:iostat、iotop、lsof、sar
iostat分析当前系统的整体的读写吞吐。
iotop可以定位io吞吐比较大的进程。
lsof可以查看某个pid下操作的文件。
使用iostat分析随机读还是随机写应用
使用/sbin/hdparm -t /dev/sda测试磁盘/dev/sda的读速度
优化策略:
1)分离系统盘成为独立的volumn。这样做,避免因为应用程序的误操作,造成系统盘的IO过重从而导致系统不可用。上次我们线上Hadoop出现的一次故障,就是因为Hadoop的用户日志数据与系统的根目录属于同一个volumn(有关概念可参考http://en.wikipedia.org/wiki/Logical_Volume_Manager_%28Linux%29),由于用户的maptask频繁写log,造成系统盘的io util长时间处于100%,从而造成节点响应速度变慢。
2) 如果是搭建具有容错特性的系统,尽可能使用单盘Raid0。这样设置的好处是在磁盘故障时造成的影响较小,而且容易监控。
 
目前,很多系统都是用SSD来提升系统的性能,作为ssd来说,它的物理特性决定了在高速的同时,有更高出现故障的风险,因此,合理的监控可以有利于系统的维护。
 
诊断标准:
 ssd_badblock -d /dev/$ssd_id  bad_block的概率超过0.006%就认为有问题,
 ssd_bitflip -d /dev/$item 出现unrecoverable的个数大于0,认为出现了问题。
 
 
4、网络分析
常用工具:
netstat获取网络使用的信息,这里
nload:获得上行(ongoing)和下行(incoming)的实时网络数据,包含从nload收集到目前为止出现的Max、Min、Average、Current、以及累计的流量。
这个工具适用于获取当前节点的网络流量状况,并由此判断节点的网络负载压力。
如果是网卡是千兆容量,1000Mbps,实际上,如果发现Curr的值超过1000M或者Max超过1000M,或者Avg的值在750M以上,此时配合其它节点ping操作确认该影响。下图就是借助多窗口管理器tmux同时查看nload和ping的状态。
 
以端口提供的服务,需要跟踪端口上相关连接的状态,例如,我们通过ThriftServer对外提供服务,出现了很多的CLOSE_WAIT状态的连接,经过分析,是由于客户端没有正常关闭对应的handler造成的。如果不及时关闭该链接,会造成因为端口上的连接数过多引起的访问故障。
 
另外,网络状况需要配合使用ethtool、/sbin/ifconfig 来查看网卡传输数据的情况,尤其查看丢包、错误包的情况,避免因为硬件问题造成的网络服务质量下降的现象。
 
 
通过以上的分析,可以确认是否因为网络流量拥塞造成的应用服务性能下降,因为如果网卡长时间处于饱和状态运行,虽然网络协议栈可以保证数据传输的可靠性,但是以Network-IO Intensive的应用就会出现瓶颈,例如Hadoop作业、需要高吞吐的数据库等。目前,这种问题的优化方案是:
1)在应用层面增加数据压缩,降低网络传输的开销。(例如hadoop/hbase 使用lzo压缩)
2)在网络架构上,可以通过网卡bonding。绑定两个千兆网卡,可以增加到2000Mbps的流量,会在很大程度上缓解压力。
3)尝试使用异步模式。根据有些应用的特征,事件驱动模型和异步策略可以实现IO复用,在一定程度上控制网络传输的效率,缓解负载的压力。Linux asynchronous I/O可以参考http://www.ibm.com/developerworks/linux/library/l-async/
 
总结:系统性能分析的实践方法是一个涉及多个领域的知识积累,下图表示了一个系统分析的Trace方法。

文章的脚注信息由WordPress的wp-posturl插件自动生成

分享到:
评论

相关推荐

    独子棋demo.rar

    独子棋demo.rar

    云安全联盟软件定义边界SDP标准规范2.0202239页.pdf

    云安全联盟软件定义边界SDP标准规范2.0202239页.pdf

    Uniapp开发的微商个人相册多端小程序源码

    Uniapp开发的微商个人相册多端小程序源码。使用 HBuilder X 导入本地项目,修改小程序AppID,以及Uni-app应用标识,调试发布即可。 小程序源码特点: 1、首页进行相册展示,采用分页 2、列表页面以文字形式进行分类,管理员可进行添加,修改和排序 3、每个列表下有多个相册,管理员可进行添加,修改和排序 4、每个相册有多张图片,有小图和大图模式进行切换 5、相册中可以长按图片进行选择删除和设为封面 6、相册可以进行分享 7、我的页面有管理员登录,联系客服等功能

    【FPGA硬件设计】基于FPGA的144通道可切换电压源系统设计:硬件架构与上位机软件实现(论文复现或解答,含详细代码及解释)

    内容概要:本文详细介绍了基于FPGA的144输出通道可切换电压源系统的设计与实现,涵盖系统总体架构、FPGA硬件设计、上位机软件设计以及系统集成方案。系统由上位机控制软件(PC端)、FPGA控制核心和高压输出模块(144通道)三部分组成。FPGA硬件设计部分详细描述了Verilog代码实现,包括PWM生成模块、UART通信模块和温度监控模块。硬件设计说明中提及了FPGA选型、PWM生成方式、通信接口、高压输出模块和保护电路的设计要点。上位机软件采用Python编写,实现了设备连接、命令发送、序列控制等功能,并提供了一个图形用户界面(GUI)用于方便的操作和配置。 适合人群:具备一定硬件设计和编程基础的电子工程师、FPGA开发者及科研人员。 使用场景及目标:①适用于需要精确控制多通道电压输出的实验环境或工业应用场景;②帮助用户理解和掌握FPGA在复杂控制系统中的应用,包括PWM控制、UART通信及多通道信号处理;③为研究人员提供一个可扩展的平台,用于测试和验证不同的电压源控制算法和策略。 阅读建议:由于涉及硬件和软件两方面的内容,建议读者先熟悉FPGA基础知识和Verilog语言,同时具备一定的Python编程经验。在阅读过程中,应结合硬件电路图和代码注释,逐步理解系统的各个组成部分及其相互关系。此外,实际动手搭建和调试该系统将有助于加深对整个设计的理解。

    上市公司-人工智能-词频总和明细.xlsx

    地级市政府通过制定相关政策来推动数字经济的发展和数字政府的建设。这些政策可能包括鼓励企业数字化转型、促进数字技术创新、加强数字基础设施建设、优化数字政务服务等方面的内容。政策制定的频率和力度,可以在一定程度上反映政府对数字领域的关注度。 在地级市政府数字关注度的背景下,词频分析成为了一种有效的工具,用以衡量政府文件和宣传资料中涉及数字技术和数字化转型相关词汇的频次,进而揭示政府对这一领域的关注程度和重视方向。 数据名称:地级市-政府数字关注度、词频

    Android平台上基于多尺度多角度模板匹配的图像识别技术及其在不同ARM架构的应用

    内容概要:本文详细探讨了在Android平台上进行图像模板匹配的技术挑战和解决方案,特别是在处理不同尺寸和旋转角度的目标物时的方法。文中介绍了使用OpenCV构建图像金字塔、处理旋转模板以及利用NEON指令集优化性能的具体实现。此外,文章还讨论了在armeabi-v7a和arm64-v8a这两种主要ARM架构下的优化技巧,如内存对齐、SIMD指令优化、RenderScript并行处理等。作者分享了许多实践经验,包括如何避免常见的性能瓶颈和兼容性问题。 适合人群:有一定Android开发经验,尤其是熟悉OpenCV和NDK编程的中级及以上开发者。 使用场景及目标:适用于需要在移动设备上进行高效图像识别的应用开发,如实时视频流中的物体检测、游戏内的道具识别等。目标是提高模板匹配的速度和准确性,同时确保在不同硬件配置下的稳定性和兼容性。 其他说明:文章提供了丰富的代码片段和实际案例,帮助读者更好地理解和应用所介绍的技术。特别强调了在不同ARM架构下的优化策略,为开发者提供了宝贵的参考资料。

    电力系统中基于改进粒子群算法的微电网多目标优化调度研究

    内容概要:本文探讨了一种改进的粒子群优化(PSO)算法在微电网多目标优化调度中的应用。传统PSO在解决此类复杂问题时常陷入局部最优解,而改进版通过引入动态惯性因子和自适应变异操作,显著提升了算法性能。文中详细介绍了这两种改进措施的具体实现方法及其对算法收敛性和解质量的影响。此外,还展示了该算法在实际微电网调度任务中的表现,特别是在权衡经济成本与环境效益方面的能力。 适合人群:从事电力系统优化、智能电网研究的专业人士以及对进化算法感兴趣的学者和技术人员。 使用场景及目标:适用于需要进行高效能源管理的场合,如分布式发电系统的规划与运行。主要目的是寻找既能降低成本又能减少环境污染的最佳调度方案。 其他说明:文中提供了大量伪代码片段帮助读者理解具体的技术细节,并强调了参数调节对于最终结果的重要性。同时指出,该方法不仅限于微电网领域,还可以扩展应用于其他类型的优化问题。

    Delphi 12.3控件之TeeChart Offline Keygen.7z

    Delphi 12.3控件之TeeChart Offline Keygen.7z

    MATLAB在光学领域屈光度计算中的数据处理与应用

    内容概要:本文详细介绍了如何利用MATLAB进行屈光度计算及其数据处理方法。首先解释了屈光度的基本概念和计算公式,接着展示了如何通过MATLAB代码读取、清理和转换焦距数据为屈光度,并进行了必要的单位转换。针对可能出现的异常值和噪声,文中提供了有效的数据清洗手段。此外,还探讨了如何对屈光度数据进行统计分析以及可视化呈现,如绘制趋势图和散点图等。最后,提到了将MATLAB代码转化为C++代码以便集成到硬件系统的高级应用。 适合人群:从事光学研究、眼科医疗设备开发的技术人员,以及对MATLAB有兴趣的学习者。 使用场景及目标:适用于需要精确处理和分析光学数据的研究机构或企业,旨在提高屈光度计算的效率和准确性,确保数据质量的同时优化实验结果。 其他说明:文中不仅涵盖了基本的操作步骤,还包括了许多实用的小贴士和技术细节,有助于读者更好地理解和掌握相关内容。同时强调了单位一致性的重要性,提醒开发者注意潜在的问题。

    349421c2-4955-4132-b4da-808a3a171bfe.pdf

    349421c2-4955-4132-b4da-808a3a171bfe.pdf

    1744300906657718_download.jsp

    1744300906657718_download.jsp

    【简历全景认知5】简历通关指南:揭秘企业筛选简历的三重门系统

    【内容概要】 本文详细解析了企业筛选简历的“三重门”系统,包括ATS系统初筛、HR复核和业务部门终极评估三个阶段。首先,ATS系统作为关键词匹配引擎,强调了关键词的重要性及其优化方法;其次,HR在6秒内通过“薄片判断”评估简历的职业连贯性、成就量化和岗位匹配度;最后,业务部门则侧重于技术能力和文化适配性的综合评估。文章还揭示了各环节中的心理学原理和认知偏差,并提供了针对性的优化建议。 【适合人群】 正在求职或有求职打算的职场人士,尤其是希望提升简历通过率的求职者。 【使用场景及目标】 ①帮助求职者理解企业筛选简历的具体流程; ②提供简历优化的具体方法,如关键词优化、成就量化、案例准备等; ③指导求职者如何根据不同阶段的评审特点调整简历内容。 【其他说明】 文章结合了最新的招聘趋势研究报告和心理学理论,强调简历不仅是通过筛选的工具,更是展示个人能力和价值的平台。求职者应充分利用这些心理规律,打造更具吸引力的简历,为后续面试做好铺垫。

    PFC2D5.0二维岩石单轴压缩模拟:颗粒流代码解析与能量裂隙分析

    内容概要:本文详细介绍了使用PFC2D5.0进行二维岩石单轴压缩模拟的具体方法和代码实现。首先,通过设定模型的基本参数如颗粒生成、粘结设置、加载控制等,构建了一个完整的岩石样品模型。接着,深入探讨了加载过程中应力应变曲线的变化规律以及能量分析的方法,包括弹性应变能、动能和耗散能的监测。此外,还提供了裂隙统计的技术手段,能够精确捕捉岩石内部裂隙的发展情况。最后,强调了参数调整对模拟效果的影响,并给出了优化建议。 适合人群:从事岩土工程、地质力学研究的专业人士和技术爱好者。 使用场景及目标:适用于需要深入了解岩石力学特性的研究人员,帮助他们掌握PFC2D软件的应用技巧,提升科研能力。同时,也为相关领域的学生提供了一套实用的学习资料。 其他说明:文中提供的代码可以直接应用于PFC2D5.0环境,便于用户快速上手并进行实验验证。通过对不同参数的调整,可以模拟多种类型的岩石破坏行为,为实际工程项目提供理论支持。

    Fluent激光焊接数值模拟:基于UDF的锥形高斯热源建模与优化

    内容概要:本文详细介绍了如何使用Fluent进行激光焊接的数值模拟,重点讲解了锥形高斯热源的建模方法。文章首先解释了锥形高斯热源的特点及其与普通高斯热源的区别,然后给出了具体的UDF代码实现,包括热源强度的计算、热流衰减的控制以及热源移动的实现。此外,还讨论了网格划分、材料参数设置、常见错误排查和优化技巧等方面的内容。通过实例和操作视频,帮助读者快速掌握激光焊接数值模拟的方法和技术要点。 适合人群:具有一定CFD基础并希望深入学习激光焊接数值模拟的研究人员和工程师。 使用场景及目标:适用于需要精确模拟激光焊接过程的研究项目或工业应用,旨在提高模拟精度,减少试验成本,优化焊接工艺参数。 其他说明:文中提供了大量实用的操作技巧和注意事项,如网格划分建议、材料参数选择、UDF代码调试等,有助于解决实际操作中可能遇到的问题。同时,附带的操作视频和GitHub上的完整案例包也为初学者提供了宝贵的学习资源。

    序列化.md

    序列化.md

    ResumePlatformFront 笔试面试全攻略与资源宝典

    "ResumePlatformFront 笔试面试全攻略与资源宝典"——一站式前端求职解决方案!精选高频笔试真题解析、大厂面试经验分享、实战项目模板及技能进阶指南,助你系统攻克前端求职难关。从简历优化到Offer谈判,覆盖求职全流程,配套免费资源库持续更新。无论应届生还是进阶开发者,这里都是你斩获心仪Offer的强力后盾!

    weixin205微信小程序线上教育商城ssm(文档+源码)_kaic

    weixin205微信小程序线上教育商城ssm(文档+源码)_kaic

    岩土工程中COMSOL实现岩石损伤热水力耦合模型及其应用

    内容概要:本文详细介绍了如何利用COMSOL软件构建岩石损伤与温度、渗流耦合的多物理场模型。首先解释了温度变化引起岩石膨胀/收缩以及渗流压力改变裂纹发展的物理机制,并通过PDE方程组进行描述。接着展示了具体的实现方法,如定义损伤变量、设置导热系数和渗透率随损伤变化的关系,以及引入温度修正的Mohr-Coulomb准则。文中还讨论了求解器配置技巧,强调了非线性收敛问题的解决方案。此外,作者分享了一些实际建模过程中遇到的问题及解决经验,如参数选择不当导致的模型发散等。 适合人群:从事岩土工程、地质工程及相关领域的研究人员和技术人员,特别是对多物理场耦合仿真感兴趣的学者。 使用场景及目标:适用于需要深入理解岩石在温度、渗流和应力共同作用下的损伤演化规律的研究项目。目标是帮助读者掌握COMSOL中多物理场耦合模型的建立方法,提高数值模拟的准确性。 其他说明:文章不仅提供了理论背景,还包括大量实用的代码片段和调试建议,有助于读者更好地理解和应用所学知识。

    2023-04-06-项目笔记 - 第四百六十四阶段 - 4.4.2.462全局变量的作用域-462 -2025.04-10

    2023-04-06-项目笔记-第四百六十四阶段-课前小分享_小分享1.坚持提交gitee 小分享2.作业中提交代码 小分享3.写代码注意代码风格 4.3.1变量的使用 4.4变量的作用域与生命周期 4.4.1局部变量的作用域 4.4.2全局变量的作用域 4.4.2.1全局变量的作用域_1 4.4.2.462局变量的作用域_462- 2025-04-10

    电机控制领域中基于滑膜观测器的PMSM无传感器FOC控制Simulink仿真

    内容概要:本文详细介绍了基于滑膜观测器的永磁同步电机(PMSM)无传感器控制技术及其在MATLAB/Simulink中的仿真实现。首先阐述了PMSM的特点及其在现代工业中的重要地位,接着重点讲解了转子磁场定向矢量控制(FOC)的工作原理,特别是电流环的设计和电压解耦的作用。然后深入探讨了一阶滑膜观测器的实现方法,展示了如何通过电机的电压和电流信号估计转子位置和速度。最后,通过搭建完整的Simulink仿真模型并运行仿真,评估了控制策略的性能,并提供了配套的英文文献以供进一步研究。 适合人群:从事电机控制系统设计的研发工程师和技术爱好者,尤其是对无传感器控制技术和滑膜观测器感兴趣的读者。 使用场景及目标:适用于希望深入了解PMSM无传感器控制技术的工程师,旨在帮助他们掌握滑膜观测器的设计和实现,提高系统的可靠性和降低成本。同时,也为后续的实际应用和优化提供了理论依据和技术支持。 其他说明:文中提供的代码片段和仿真模型有助于读者更好地理解和实践相关技术,而配套的英文文献则为深入研究提供了宝贵的参考资料。

Global site tag (gtag.js) - Google Analytics