Ganglia 是UC Berkeley(加州大学伯克利分校)发起的一个开源监视项目,它的运行消耗非常少的系统资源,官方称目前已有2000节点的cluster。可以访问http://monitor.millennium.berkeley.edu/查看他们的集群监控情况,下图是ganglia监控界面:
gmond(Ganglia Monitor Daemon):运行在每个需要监控的节点上,通过UDP协议收集和发送数据(如处理器速度、内存使用量等)
gmetad(Ganglia Metadata Daemon):通过tcp协议从cluster抓取数据,并保持倒rrdtoo的数据库。
下列是官方网站的ganglia结构图,在ClusterA、B、C中gmond进程将数据发送(单播或者多播)到某个或者多个gmond上(如果是单播就发生到确定的gmond上,如果是多播则每个gmond都可以接受cluster数据),gmetad.conf中配置了要监控的cluster(一个data_source配置就是一个cluster),gmetad进程将从配置的cluster抓取监控数据,并保持倒rrdtool数据库。
cluster内数据发送有两种方式:单播和多播:
单播要求配置cluster中收集数据的节点,这样所以gmond都发送数据到这台机器,然后gmetad从这台机器抓取监控数据。
多播配置一个广播地址(必须是D类),每台机器都发送数据到其它gmond进程,每个gmond进程都接受其它进程的数据,在gmetad中可以配置cluster内任何一个或者多个gmond(如果配置多个,其中一起机器挂掉会使用第二台)抓取监控数据。
参考:
http://yaoweibin2008.blog.163.com/blog/static/11031392008763256465/
http://www.msg.ucsf.edu/local/ganglia/ganglia_docs/introduction.html
ganglia系列—定制ganglia
http://blog.pengyao.org/ganglia_3/
单播,广播和多播
http://blog.csdn.net/tigerjb/article/details/6632532
http://hushanshan27.blog.51cto.com/871910/192197
http://hi.baidu.com/whs08/blog/item/c24916cd175605540eb345fd.html
http://blog.sina.com.cn/s/blog_52118c2f0100b7p6.html
-- end --
- 大小: 103.5 KB
- 大小: 54.4 KB
分享到:
相关推荐
大数据平台监控是确保系统稳定性和高效运行的关键,Ganglia 和 Nagios 是两种广泛使用的开源监控工具,它们在监控大数据环境方面有着各自的优势。本文将详细介绍如何在大数据平台上结合使用Ganglia和Nagios进行监控...
Ganglia是一款开源的、跨平台的分布式监控系统,它能够实时监控网络中的各种计算资源,包括CPU使用率、内存消耗、磁盘I/O以及网络流量等关键性能指标。本书的详细内容涵盖了Ganglia的安装、配置、使用及优化,旨在...
Ganglia是一款开源的分布式监控系统,用于集群和网格环境,可以实时监控系统的性能和状态。这个压缩包文件包含了Ganglia集群监控的组件、依赖包以及安装部署的详细说明,帮助用户在自己的环境中实现全面的监控功能。...
Nagios是一款强大的开源监控系统,被广泛应用于网络、服务器和应用程序的实时监控。其核心功能在于检测各种IT基础设施的状态,包括但不限于服务器、网络设备、服务(如HTTP、SMTP等)以及操作系统性能。本实战指南将...
本篇文档详细介绍了基于Ganglia和Nagios这两种开源监控软件,构建在Hadoop开源云计算平台上的智能监控系统,并结合移动飞信软件实现云计算平台的实时监控。 在深入理解云计算监控技术的过程中,首先要明确监控的...
Ganglia是一个开源的分布式监控系统,专门设计用于监控大型集群的计算资源,如CPU使用率、内存使用、网络流量等。它由三个主要组件构成:gmond、gmetad和ganglia-web。在Linux集群上配置Ganglia监控系统并监控Solr的...
基于Ganglia的集群监控软件的实现细节包括了Ganglia的安装配置、Gmond 监控程序的配置、Gmetad 节点程序的配置和Ganglia Web 前端的配置等步骤。 本资源摘要信息对基于Ganglia的集群监控软件的设计与实现进行了详细...
1. **分布式监控**:Ganglia的核心特性,它允许管理员监视大规模集群的性能,包括服务器、应用程序以及网络设备。 2. **数据收集与聚合**:Ganglia通过定期收集每个节点的数据,并在中心节点上进行聚合,生成可读的...
Ganglia是一款开源的分布式监控系统,主要用于实时监控Linux和Unix集群的资源使用情况,包括CPU、内存、磁盘I/O、网络流量等关键性能指标。Ganglia-3.7.2是其在2015年发布的一个稳定版本,它提供了强大的数据收集、...
Ganglia是一款开源的分布式监控系统,用于集群和网格环境,可以实时监控网络中的大量主机和应用程序的性能数据。在Linux环境中,Ganglia通过收集并聚合来自各个节点的CPU使用率、内存使用情况、磁盘I/O、网络流量等...
Ganglia是一款开源的分布式监控系统,用于集群和网格环境,可以实时收集并展示系统性能数据,如CPU使用率、内存使用情况、网络流量等。它依赖于CGI库(CGILIB)来处理HTTP请求并生成动态网页。在本文中,我们将详细...
2.4 Gmond监控程序:Gmond是Ganglia的监控代理,安装在每个集群节点上,负责收集本地性能数据并发送给其他节点。 2.5 Gmetad节点程序:Gmetad负责聚合来自各个Gmond节点的数据,并构建全局视图。 2.6 Ganglia Web...
【Ganglia】和【Nagios】是两种流行的开源监控工具,广泛应用于数据中心和集群环境,以确保高效管理和故障预防。Ganglia专注于收集和可视化性能数据,而Nagios则侧重于警报和通知机制。 Ganglia是一个分布式监控...
Ganglia是一款开源的分布式监控系统,用于集群和网格环境,可以实时监控网络中的大量主机和应用程序的状态数据。Ganglia-3.1.7是该系统的特定版本,提供了改进的功能和修复了一些已知问题。在本文中,我们将深入探讨...
Ganglia是开源软件,具有特定的版权信息和贡献者列表,这些信息通常在文档的末尾找到。 总的来说,Ganglia提供了一套全面的解决方案,用于监控大规模计算环境的健康状况和性能,通过其组件的协同工作,确保了数据...
Ganglia是一款强大的开源机群监控系统,专为监控分布式计算环境中的硬件资源而设计,如CPU使用率、内存消耗、网络带宽以及磁盘I/O等关键性能指标。这款软件能够提供实时的集群监控视图,帮助管理员了解整个系统的...
Ganglia是一个开源的分布式监控系统,它可以收集并显示Linux和Unix集群的系统性能数据。 在Linux系统中,`apt`是Debian和Ubuntu等发行版的包管理器,用于安装、升级和管理软件。使用`apt`安装Ganglia,首先需要更新...
8. **监控指标**:Ganglia可以监控的指标非常广泛,包括操作系统级别的资源利用率、网络性能、硬件健康状态,甚至应用程序级别的特定指标。这使得Ganglia成为运维团队监控复杂IT环境的理想工具。 9. **故障检测与...
Ganglia是一款开源的分布式监控系统,专为大规模集群环境设计,能够实时监控系统的性能指标,包括CPU使用率、内存使用情况、网络带宽、磁盘I/O等。在标题“ganglia-3.7.2-rpm.20210515.rar”中,我们可以看到这是...
Ganglia是一个用于监控高性能计算集群(HPC)的开源系统。它能够收集、分析并展示集群中各节点的资源利用情况,如CPU使用率、内存使用量、磁盘空间等。Ganglia的设计目标是提供一个可扩展且灵活的解决方案,适用于...