`

Nagios 简介及其二次开发

 
阅读更多

  Nagios简介

 

Nagios是十分受欢迎的、开源且免费的计算机及网络系统监控软件。Nagios是“Nagios Aint Gonna Insist On Sainthood”的缩写。它最早是在1999年以“NetSaint”发布。Nagios主要应用在LinuxUnix平台环境下的监控,但通过插件,也可以监控MS Windows系统的主机。NagiosLinuxCon 2010 Poll并选为最受欢迎的IT运维工具。它被Infoworld2009年评为最佳开源软件,同时也是该年度的SourceForge社区的系统管理工具最佳选择。Nagios也被很多知名企业所采用,包括AOLDHLAt&t,欧莱雅,德州仪器,Siemens COM CZ,时代华纳有线,Yahoo等。

 

Nagios的特征包括:

l    监控网络服务(SMTPPOP3HTTPNNTPPING等);

l    监控主机资源(处理器负荷、磁盘利用率等);

l    并行服务检查机制;

l    具备定义网络分层结构的能力,用"parent"主机定义来表达网络主机间的关系,这种关系可被用来发现和明晰主机宕机或不可达状态,提供设备组网拓扑展示能力;

l    当服务或主机问题产生与解决时将告警发送给联系人(通过EMail、短信、用户定义方式);

l    具备定义事件句柄功能,它可以在主机或服务的事件发生时获取更多问题定位;

l    简单地插件设计使得用户可以方便地扩展自己服务的检测方法;

l    自动的日志轮转;

l    可以支持并实现对主机的冗余监控;

l    可选的WEB界面用于查看当前的网络状态、通知和故障历史、日志文件等;

 

 

     二次开发

Nagios的功能是监控服务和主机,但是他自身并不包括这部分功能,所有的监控、检测功能都是通过各种插件来完成的。启动 Nagios后,它会周期性的自动调用插件去检测服务器状态,同时 Nagios 会维持一个队列,所有插件返回来的状态信息都进入队列,Nagios每次都从队首开始读取信息,并进行处理后,把状态结果通过 web 显示出来。

 

Nagios Plug-in机制

Nagios Daemon通过加载一些官方的或其它自开发的插件(Plug-in),能够实现对诸如服务器、网络、应用甚至房间温度和湿度等的监控。Nagios Core作为Nagios Daemon的核心,负责对这些插件的结果进行处理(诸如统计、转储、人工或自动响应处理等)。因此Nagios Core即为Nagios的事件池的核心。在Nagios Core内部,它为每一种加载的插件都会分配独立的工作缓冲区(即以objecttype作为区分),以存放相应插件所产生的事件信息。每一个独立运行的Nagios Daemon可以有自己的名称以便集群Nagios环境下的相互区别,即从更大的层面来区分这些工作缓冲区。

Nagios插件通常是通过命令行方式监控主机或服务工作状态的脚本,由Nagios进行按需调用,并把执行结果返回给NagiosNagios正是根据这些返回值来判断是否采取某种行动(如运行事件句柄(event handlers),发送通知等)。下图展示了插件相对于Nagios进程和被监控对象间的关系:

 

为了管理插件,Nagios 每次在查询一个服务的状态时,产生一个子进程,并且它使用来自该命令的输出和退出代码来确定具体的状态。

下面提供了一个 Python 示例脚本,用于检查 UNIX® 平均负载。它假定 2.0 以上的级别表示警告状态,而 5.0 以上的级别表示危险状态。这些值都采用了硬编码的方式,并且始终使用最近一分钟的平均负载。

 

 

Nagios Add-on机制

Nagios支持以Add-on方式扩展监控信息处理能力。Nagios采集到的监控信息都被看做事件,事件接收者对感兴趣的事件注册,事件发生时Nagios的事件机制会将事件发送到事件接收者。NagiosAdd-on就是事件接收者。Add-on通过将自身注册到感兴趣的事件上,可以实时的从Nagios接收到事件,并作出相应处理。

Nagios Add-on工作原理图:

 

Nagios监控效果: 

 

 

分享到:
评论

相关推荐

    Nagios通过飞信发送告警短信配制方法

    飞信平台还提供了开放的API接口,供开发者进行二次开发和集成。 3. 飞信与Linux结合的必要条件和配置步骤: 为了让Nagios能够通过飞信发送告警短信,首先需要确保Linux系统能够上网。由于Nagios发送告警的方式是...

    服务器管理监控系统.docx编程资料

    ### 服务器管理监控系统...通过采用像Zabbix这样的成熟监控解决方案,并结合适当的二次开发工作,可以有效提高系统的稳定性和可用性。随着技术的发展,未来还将出现更多先进的监控技术和工具,为运维工作带来更多便利。

    Percona-Monitoring-Plugins-1.1.7

    Percona Monitoring Plugins是一款由Percona公司开发的高级监控工具集合,旨在为MySQL及其相关技术提供企业级的监控能力。该版本(1.1.7)发布于2016年12月9日,提供了针对多种监控系统的插件和支持,包括Nagios、...

    淘宝开源监控工具

    - **源码分析**:tsar-master是tsar的源代码仓库,包含了项目的全部源码和相关文档,开发者可以深入了解其内部实现,甚至进行二次开发。 - **贡献与社区**:开源意味着开发者可以参与进来,提交bug修复、新功能...

    研发中心软件性能测试报告模板

    ### 知识点生成 #### 一、性能测试报告概览 ...通过以上知识点的梳理, 不仅可以清晰地了解如何撰写一份完整的软件性能测试报告, 还可以了解到性能测试的关键要素和步骤, 从而为软件开发和质量保障提供有力的支持。

    Monitorix:Monitorix是免费的,开源的,轻量级的系统监视工具

    2. **开源**:源代码开放,用户可以根据需要自定义监控项,或者进行二次开发。 3. **多平台支持**:不仅适用于Linux,还支持多种Unix变种,如FreeBSD、OpenBSD等。 4. **实时监测**:持续收集数据并实时更新显示,...

    最新Linux系统运维面试题(共四十页附答案)

    - **需求**: 每天的6点到12点之间,每隔2小时执行一次 `/usr/bin/httpd.sh` 脚本。 - **命令**: ```bash 0 6-12/2 * 11 * /usr/bin/httpd.sh ``` - **解释**: `0 6-12/2 * 11 *` 中的各个字段分别代表分钟、小时...

Global site tag (gtag.js) - Google Analytics