`

Ganglia & Nagios

阅读更多

      Ganglia对OBS进行指标的监控。 Nagios对OBS出现的故障进行告警上报。

 ====Ganglia====

      Ganglia是一个开源集群监视项目,设计用于测量数以千计的节点。

 

      Ganglia的核心包含gmond、gmetad以及一个Web前端。主要是用来监控系统性能,如:cpu 、mem、硬盘利用率, I/O负载、网络流量情况等,通过曲线很容易见到每个节点的工作状态,对合理调整、分配系统资源,提高系统整体性能起到重要作用。

 

       每台计算机都运行一个收集和发送度量数据的名为 gmond 的守护进程。接收所有度量数据的主机可以显示这些数据并且可以将这些数据的精简表单传递到层次结构中。正因为有这种层次结构模式,才使得 Ganglia 可以实现良好的扩展。gmond 带来的系统负载非常少,这使得它成为在集群中各台计算机上运行的一段代码,而不会影响用户性能。所有这些数据多次收集会影响节点性能。网络中的 “抖动”发生在大量小消息同时出现时,可以通过将节点时钟保持一致,来避免这个问题。

 

        gmetad可以部署在集群内任一台节点或者通过网络连接到集群的独立主机,它通过单播路由的方式与gmond通信,收集区域内节点的状态信息,并以XML数据的形式,保存在数据库中。

 

        由RRDTool工具处理数据,并生成相应的的图形显示,以Web方式直观的提供给客户端。

 

 ====Nagios====

        Nagios是一款开源的免费网络监视工具,能有效监控Windows、Linux和Unix的主机状态,交换机路由器等网络设置,打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知。

 

        Nagios是一个监视系统运行状态和网络信息的监视系统。Nagios能监视所指定的本地或远程主机以及服务,同时提供异常通知功能等。Nagios可运行在Linux/Unix平台之上,同时提供一个可选的基于浏览器的WEB界面以方便系统管理人员查看网络状态,各种系统问题,以及日志等等。

        Nagios 可以监控的功能有:

        1、监控网络服务(SMTP、POP3、HTTP、NNTP、PING等);

        2、监控主机资源(处理器负荷、磁盘利用率等);

        3、简单地插件设计使得用户可以方便地扩展自己服务的检测方法;

        4、并行服务检查机制;

        5、具备定义网络分层结构的能力,用"parent"主机定义来表达网络主机间的关系,这种关系可被用来发现和明晰主机宕机或不可达状态;

        6、当服务或主机问题产生与解决时将告警发送给联系人(通过EMail、短信、用户定义方式);

        7、可以定义一些处理程序,使之能够在服务或者主机发生故障时起到预防作用;

        8、自动的日志滚动功能;

        9、可以支持并实现对主机的冗余监控;

        10、可选的WEB界面用于查看当前的网络状态、通知和故障历史、日志文件等; 

 

        Nagios所需要的运行条件是机器必须可以运行Linux(或是Unix变种)并且有C语言编译器。你必须正确地配置TCP/IP协议栈以使大多数的服务检测可以通过网络得以进行。

 

 

 

分享到:
评论

相关推荐

    ganglia+nagios集成分布式监控系统

    **分布式监控系统集成:Ganglia与Nagios** 在现代IT环境中,高效且全面的系统监控至关重要,尤其是在云应用平台中。Ganglia和Nagios是两个广泛使用的开源监控工具,它们各自具备独特的优势,但当两者结合时,可以...

    大数据平台监控Ganglia加Nagios

    大数据平台监控是确保系统稳定性和高效运行的关键,Ganglia 和 Nagios 是两种广泛使用的开源监控工具,它们在监控大数据环境方面有着各自的优势。本文将详细介绍如何在大数据平台上结合使用Ganglia和Nagios进行监控...

    基于Ganglia和Nagios的云计算平台智能监控系统.pdf

    本篇文档详细介绍了基于Ganglia和Nagios这两种开源监控软件,构建在Hadoop开源云计算平台上的智能监控系统,并结合移动飞信软件实现云计算平台的实时监控。 在深入理解云计算监控技术的过程中,首先要明确监控的...

    Ganglia集成Nagios组合监视企业集群并设置邮件报警

    Ganglia作为一款最常用的Linux环境中的监控软件,它擅长的的是从...通过将Ganglia和Nagios组 合起来,把Ganglia采集的数据作为Nagios的数据源,然后利用Nagios来发送预警通知,可以完美的实现一整套监控管理的系统。

    Ganglia+和+Nagios

    Ganglia+和+NagiosGanglia+和+Nagios

    Ganglia搭建

    Ganglia作为一款最常用的Linux环境中的监控软件,它擅长的的是从...通过将Ganglia和Nagios组 合起来,把Ganglia采集的数据作为Nagios的数据源,然后利用Nagios来发送预警通知,可以完美的实现一整套监控管理的系统。

    ganglia+hadoop+hbase nagios 学习参考链接

    Ganglia、Hadoop和HBase都是大数据领域的重要组件,而Nagios则是一种广泛使用的系统监控工具。这篇博文链接提供的资源聚焦于如何将这些技术结合使用,并进行有效的监控。 Ganglia是一个分布式监控系统,能够收集并...

    基于CentOs的ganglia监控配置

    整合Ganglia与Nagios时,需要确保Ganglia的集群名称与gmetad配置文件中的data_source名称一致,以便Nagios可以识别并正确地从Ganglia获取数据。 本文档还涉及了文件路径的配置,例如nginx、php、rrdtool的安装路径...

    开源监控利器nagios实战

    3. **第三方工具**:如Cacti、Ganglia、Nagvis等,可以与Nagios集成,提供更直观的监控视图。 ### 七、高级功能与扩展 1. **分布式监控**:通过Nagios NRDP(Nagios Remote Data Processor)实现多节点的分布式...

    ganglia监控软件的笔记

    与Cacti、Nagios、Zabbix等其他监控工具相比,Ganglia更专注于收集和跟踪度量数据,尤其适合用于集群的性能监控、分析和优化。它的优点包括但不限于: - **高效的性能数据收集**:Ganglia采用了多播通信机制,能够...

    Hadoop集群监控工具-Nagios3.4.3详细配置与安装

    Nagios是一款强大的IT运维监控工具,主要用于监测网络服务、主机状态以及各种系统资源,如CPU负载、磁盘空间和网络连接等。它具备实时报警功能,可以通过邮件或短信及时通知管理员潜在的问题,确保系统的稳定运行。...

    nagios-3.1.0.tar

    5. **Ganglia**:结合Ganglia,可以实现大规模集群的性能监控。 **Nagios与其他监控工具的比较:** 与Zabbix、Icinga等其他监控系统相比,Nagios的特点在于其轻量级、易于配置和高度可扩展。然而,对于需要复杂...

    ganglia集群资源监控工具

    此外,Ganglia还可以与第三方工具集成,如Nagios,实现报警功能,当某些关键指标超过预设阈值时,自动触发警告通知。 在部署Ganglia时,首先需要在所有集群节点上安装Gmond,并配置相应的XML输出和集群定义。然后在...

    monitoring with ganglia

    此外,Ganglia可以与其他监控工具(如Nagios、Zabbix)集成,提供更全面的监控解决方案。 7. 实战应用: 书中会介绍如何在实际环境中部署和优化Ganglia,包括解决网络延迟问题、性能调优、故障排查等。通过案例研究...

    大数据技术体系.pdf

    Kafka、StormMQ、ZeroMQ、RabbitMQ 查询分析:Hive、Impala、Pig、Presto、Phoenix、SparkSQL、Drill、Flink、Kylin、Druid 分布式协调服务:Zookeeper 集群管理与监控:Ambari、Ganglia、Nagios、Cloudera Manager ...

    手把手实现企业级开源监控软件cacti+nagios+ntop整合(图解)

    做一名运维工程师,监控恐怕是日常...呵呵) 而且开源软件也有着非常优秀的表现,其中著名的有cacti,nagios,ntop,Ganglia,等等..而cacti+nagios+ntop的结合应用,能为企业做到更细微的保证。下面笔者先逐一介绍下:

    云计算平台管理的三大利器Nagios、Ganglia和Splunk

    综合利用Nagios、Ganglia和Splunk搭建起的云计算平台监控体系,具备错误报警、性能调优、问题追踪和自动生成运维报表的功能。有了这套系统,就可轻松管理Hadoop/HBase云计算平台。云计算早已不是停留在概念阶段了,...

Global site tag (gtag.js) - Google Analytics