原文地址
http://my.oschina.net/vieky/blog/98155
监控项 说明 监控值
Load_one One minute load average
每分钟的系统平均负载
load_one=0.0
Load_five Five minute load average
每5分钟的系统平均负载
load_five=0.0
Load_fifteen Fifteen minute load average
每15分钟的系统平均负载
load_fifteen=0.0
mem_total Total amount of memory displayed in KBs
物理内存总量(KBs显示)
mem_total=2075288.0
mem_cached Amount of cached memory
缓存内存大小
mem_cached=470732.0
mem_free Amount of available memory
空闲内存大小
mem_free=1128860.0
mem_buffers Amount of buffered memory
内核缓存的内存总量
mem_buffers=353264.0
swap_total Total amount of swap space displayed in KBs
交换分区总量(KBs显示)
swap_total=8289532.0
swap_free Amount of available swap memory
空闲交换分区大小
swap_free=8289532.0
mem_shared Amount of shared memory
共享内存大小
mem_shared=0.0
proc_run Total number of running processes
运行的进程总数
proc_run=0.0
proc_total Total number of processes
进程总数
proc_total=65.0
cpu_idle Percentage of time that the CPU or CPUs were idle and the system did not
have an outstanding disk I/O request
空闲CPU百分比
cpu_idle=99.6
cpu_aidle Percent of time since boot idle CPU
启动的空闲CPU百分比
cpu_aidle=99.8
cpu_user Percentage of CPU utilization that occurred while executing at the user level
用户空间占用CPU百分比
cpu_user=0.2
cpu_nice Percentage of CPU utilization that occurred while executing at the user level with nice priority
用户进程空间内改变过优先级的进程占用CPU百分比
cpu_nice=0.0
cpu_system Percentage of CPU utilization that occurred while executing at the
system level
内核空间占用CPU百分比
cpu_system=0.1
cpu_num Total number of CPUs
CPU线程总数
cpu_num=2.0
cpu_speed CPU Speed in terms of MHz
CPU速度(MHz)
cpu_speed=2993.0
cpu_wio Percentage of time that the CPU or CPUs were idle during which the
system had an outstanding disk I/O request
Cpu空闲时的最大I/O请求
cpu_wio=0.2
part_max_used Maximum percent used for all partitions part_max_used=21.2
disk_total Total available disk space
磁盘总大小
disk_total=133.991
disk_free Total free disk space
剩余磁盘空间
disk_free=124.707
boottime The last time that the system was started
系统启动时间
boottime=1285905983.0
pkts_in Packets in per second
每秒进来的包
pkts_in=10.5
pkts_out Packets out per second
每秒出去的包
pkts_out=2.85
bytes_in Number of bytes in per second
每秒进来字节数
bytes_in=769.35
bytes_out Number of bytes out per second
每秒出去字节数
bytes_out=3674.02
machine_type System architecture
系统版本(X86或64)
machine_type=x86
os_name 系统名字 os_name=Linux
os_release 系统版本 os_release=2.6.18-164.el5PAE
gexec gexec available gexec=OFF
disk_free_rootfs Disk space available on WARN: ‘ disk_free_rootfs
分享到:
相关推荐
Ganglia分布式集群监控系统安装手册 - 千秋大业奋当先 - 博客频道
Ganglia是一款强大的系统状态监控软件,主要用于监测各种性能指标,包括CPU利用率、内存使用、硬盘I/O、网络流量等,以帮助用户了解系统的工作状态并优化资源分配,提升整体性能。Ganglia的核心组件包括两个守护进程...
Ganglia的灵活性允许用户自定义监控项和报警阈值,以实现定制化的监控解决方案。 在数据采集方面,Ganglia支持多种度量标准,包括CPU利用率、内存使用情况、磁盘空间、网络带宽等。通过这些数据,管理员可以迅速...
Ganglia的配置文件灵活且可定制,允许根据实际需求调整监控项和报警策略。 总的来说,Ganglia作为一个强大的集群资源监控工具,通过其高效的数据收集和展示机制,为管理员提供了宝贵的洞察力,有助于维护集群的稳定...
Ganglia系统监控完整版 pdf 清晰
除了Ganglia默认提供的监控指标外,还可以通过C或Python等方式进行扩展,以满足特定的需求。例如,可以通过编写Python脚本来收集额外的性能数据,并将其发送给`gmond`,从而在`gweb`中展示出来。这种扩展方法可以...
在Gmond的配置文件(通常为`gmond.conf`)中,你可以添加`python_module`指令来加载这些脚本,然后通过`metric`指令定义你要监控的变量和它们的采集周期。 安装和配置完成后,Ganglia将开始收集这些扩展提供的额外...
8. **验证和测试**:通过Web界面检查监控数据是否正常显示,调整监控项和频率以满足需求。 总的来说,Ganglia是一个强大的工具,对于管理和维护大规模集群的健康状况至关重要。通过合理部署和配置,用户可以实时...
基于Ganglia的集群监控软件设计与实现 本资源摘要信息主要介绍了基于Ganglia的集群监控软件的设计与实现,涵盖了集群监控软件的概念、相关技术介绍、系统设计、实现细节等方面的知识点。 集群监控软件的概念 集群...
4. **监控数据**:Ganglia可以收集的指标包括CPU利用率、内存使用、网络带宽、磁盘I/O、系统负载、进程计数等,可以根据需求自定义监控项。 5. **安全与优化**:为了安全起见,应限制Gmond只接受来自信任节点的数据...
Ganglia是一款强大的集群级监控工具,专门设计用于收集、聚合和展示分布式计算环境中各节点的性能数据。它能够提供详尽的系统资源监控,包括CPU利用率、内存使用情况、磁盘I/O以及网络流量等关键指标,帮助管理员...
分布式监控系统Ganglia的详细中文文档。Ganglia是UC Berkeley发起的一个开源集群监视项目,设计用于测量数以千计的节点。Ganglia的核心包含gmond、gmetad以及一个Web前端。主要是用来监控系统性能,如:cpu 、mem、...
【标题】:“大学毕业论文---基于ganglia的集群监控软件的设计与实现.doc” 【描述】:“大学毕业论文---基于ganglia的集群监控软件的设计与实现.doc”是计算机科学与技术专业的一篇毕业论文,由作者汪雨生在2014年...
在实际操作中,你可能需要配置Ganglia的监控项以覆盖Hadoop的关键指标,比如HDFS的块复制状态、DataNode的健康状态、JobTracker的任务进度等。同时,设置Nagios的阈值和警报规则也很重要,以确保在性能下降或故障...
大数据平台监控是确保系统稳定性和高效运行的关键,Ganglia 和 Nagios 是两种广泛使用的开源监控工具,它们在监控大数据环境方面有着各自的优势。本文将详细介绍如何在大数据平台上结合使用Ganglia和Nagios进行监控...
【基于Ganglia的集群监控软件的设计与实现】 在当今的计算机领域,集群监控系统扮演着至关重要的角色,尤其在大型数据中心和高性能计算环境中。Ganglia是一款开源的分布式监控系统,专门用于实时监控分布式计算集群...
《Ganglia监控Hadoop 2.2详解》 Ganglia是一款开源的分布式监控系统,广泛用于监控大型计算集群的资源使用情况,包括CPU、内存、网络等关键指标。在Hadoop这样的大数据处理框架中,Ganglia的集成显得尤为重要,因为...
Ganglia是一个被广泛使用的高性能计算系统监控工具,尤其适合于大型集群和网格环境,它以可扩展性、分层设计、数据表示标准化和可视化等特点,被众多高校应用于校园网格的监控中。 Ganglia监控系统核心包含两个守护...
**分布式监控系统集成:Ganglia与Nagios** 在现代IT环境中,高效且全面的系统监控至关重要,尤其是在云应用平台中。Ganglia和Nagios是两个广泛使用的开源监控工具,它们各自具备独特的优势,但当两者结合时,可以...