Nagios 简介:
是一个开源软件,可以监控网络设备网络流量、Linux/windows主机状态,甚至可以监控打印机;
它可以运行在Linux上;
基于浏览器的web界面方便运维人员查看监控项目的状态;
支持web界面配置、管理操作;
支持短信、邮件通知;
可以自定义脚本实现自定义化监控;
Nagios官网 http://www.nagios.org
1、服务端的安装
Centos6默认的yum源里没有nagios相关的rpm包,但是我们可以安装一个epel的扩展源:
rpm -ivh http://www.aminglinux.com/bbs/data/attachment/forum/month_1211/epel-release-6-7.noarch.rpm
yum install -y httpd nagios nagios-plugins nagios-plugins-all nrpe nagios-plugins-nrpe
设置登录nagios后台的用户和密码:htpasswd -c /etc/nagios/passwd nagiosadmin
nagios -v /etc/nagios/nagios.cfg 检测配置文件
启动服务:service httpd start; service nagios start
浏览器访问: http://ip/nagios
2、客户端的安装
在客户端机器上 rpm -ivh http://www.aminglinux.com/bbs/data/attachment/forum/month_1211/epel-release-6-7.noarch.rpm
yum install -y nagios-plugins nagios-plugins-all nrpe nagios-plugins-nrpe
vim /etc/nagios/nrpe.cfg 找到“allowed_hosts=127.0.0.1” 改为 “allowed_hosts=127.0.0.1,192.168.11.129” 后面的ip为服务端ip; 找到” dont_blame_nrpe=0” 改为 “dont_blame_nrpe=1”
启动客户端 /etc/init.d/nrpe start
3、监控中心(192.168.11.128)添加被监控主机(192.168.11.129)
cd /etc/nagios/conf.d/
vim 192.168.11.129.cfg
define host{
use linux-server
host_name 192.168.11.129
alias 11.129
address 192.168.11.129
}
define service{
use generic-service
host_name 192.168.11.129
service_description check_ping
check_command check_ping!100.0,20%!200.0,50%
max_check_attempts 5 ;当nagios检测到问题时,一共尝试检测5次都有问题才会告警,如果该数 值为1,那么检测到问题立即告警
normal_check_interval 1 ;重新检测的时间间隔,单位是分钟,默认是3分钟
}
define service{
use generic-service
host_name 192.168.11.129
service_description check_http
check_command check_http
max_check_attempts 1
normal_check_interval 1
}
define service{
use generic-service
host_name 192.168.11.129
service_description check_ssh
check_command check_ssh
max_check_attempts 1
normal_check_interval 1
notification_interval 60 ;在服务出现异常后,故障一直没有解决,nagios再次对使用者发出通知的时间。单位是分钟。如果你认为,所有的事件只需要一次通知就够了,可以把这里的选项设为0。
}
4、 配置文件的简单说明
我们定义的配置文件中一共监控了三个service:ssh, ping, http 这三个项目是使用本地的nagios工具去连接远程机器,也就是说即使客户端没有安装nagios-plugins以及nrpe也是可以监控到的。其他的一些service诸如负载、磁盘使用等是需要服务端通过nrpe去连接到远程主机获得信息,所以需要远程主机安装nrpe服务以及相应的执行脚本(nagios-plugins)
max_check_attempts 5 #当nagios检测到问题时,一共尝试检测5次都有问题才会告警,如果该数值为1,那么检测到问题立即告警
normal_check_interval 1#重新检测的时间间隔,单位是分钟,默认是3分钟
notification_interval 60 #在服务出现异常后,故障一直没有解决,nagios再次对使用者发出通知的时间。单位是分钟。如果你认为,所有的事件只需要一次通知就够了,可以把这里的选项设为0。
以上服务不依赖于客户端nrpe服务,我们可以想象,我们在自己电脑上可以使用ping或者telnet探测远程任何一台机器是否存活、是否开启某个端口或服务。 而当我们想要检测客户端上的某个具体服务的情况时,就需要借助于nrpe了,比如想知道客户端机器的负责或磁盘使用情况。
5、继续添加监控服务
服务端vim /etc/nagios/objects/commands.cfg
增加:define command{
command_name check_nrpe
command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$
}
继续编辑 vim /etc/nagios/conf.d/192.168.11.129.cfg
增加如下内容:define service{
use generic-service
host_name 192.168.11.129
service_description check_load
check_command check_nrpe!check_load
max_check_attempts 5
normal_check_interval 1
}
define service{
use generic-service
host_name 192.168.11.129
service_description check_disk_hda1
check_command check_nrpe!check_hda1
max_check_attempts 5
normal_check_interval 1
}
define service{
use generic-service
host_name 192.168.11.129
service_description check_disk_hda2
check_command check_nrpe!check_hda2
max_check_attempts 5
normal_check_interval 1
}
说明: check_nrpe!check_load :这里的check_nrpe就是在commands.cfg刚刚定义的,check_load是远程主机上的一个检测脚本
在远程主机上vim /etc/nagios/nrpe.cfg 搜索check_load,这行就是在服务端上要执行的脚本了,我们可以手动执行这个脚本
把check_hda1更改一下:/dev/hda1 改为 /dev/sda1
再加一行command[check_hda2]=/usr/lib/nagios/plugins/check_disk -w 20% -c 10% -p /dev/sda2
客户端上重启一下nrpe服务: service nrpe restart
服务端也重启一下nagios服务: service nagios restart
6、告警配置
vim /etc/nagios/objects/contacts.cfg //增加:
- define contact{
- contact_name 123
- use generic-contact
- alias aming
- email 87877@139.cim
- }
关于我们定义的service可以在这里定义告警策略:vim /etc/nagios/objects/templates.cfg// 搜索generic-service
7、 几个重要参数说明
notifications_enabled : 是否开启提醒功能。1为开启,0为禁用。一般,这个选项会在主配置文件(nagios.cfg)中定义,效果相同。
notification_interval: 之前刚介绍过,表示重复发送提醒信息的最短间隔时间。默认间隔时间是60分钟。如果这个值设置为0,将不会发送重复提醒。
notification_period: 发送提醒的时间段。非常重要的主机(服务)我定义为7×24,一般的主机(服务)就定义为上班时间。如果不在定义的时间段内,无论什么问题发生,都不会发送提醒。
notification_options: 这个参数定义了发送提醒包括的情况:d = 状态为DOWN, u = 状态为UNREACHABLE , r = 状态恢复为OK , f = flapping。,n=不发送提醒。
相关推荐
### Nagios监控系统搭建详细步骤 #### 一、前言 Nagios是一款开源的计算机软件,用于监视系统网络服务及主机的运行状态,并在发生故障时通知管理员。本文将详细介绍如何搭建Nagios监控系统,包括安装Apache、PHP、...
Nagios是一款强大的网络监控系统,它能够对网络服务、主机和各种应用程序进行实时...请参考提供的“简单nagios搭建说明.docx”文件,该文档应包含详细的步骤和可能遇到的问题解决方案,以帮助你顺利完成Nagios的搭建。
### 最详细的Nagios搭建及使用教程 #### 环境准备 在开始Nagios的搭建之前,我们需要准备两台CentOS 6.7版本的服务器,并确保这些服务器上安装了必要的软件和依赖。 ##### 1. 概要说明 - **服务器配置**:两台...
Nagios是一款强大的网络监视工具,它主要用于监测网络上的服务状态和主机运行情况。Nagios的核心特性在于其灵活性和可扩展性,它通过插件机制来执行各种监控任务,而不是内置这些功能。这意味着用户可以根据自己的...
在本教程中,我们将详细介绍如何搭建和配置Nagios,包括Nagios英文版和中文版的安装步骤。 **一、Nagios系统需求** 在开始安装Nagios之前,确保你的系统满足以下基本要求: 1. 一个运行Linux的操作系统,如Ubuntu、...
Nagios是一款开源的免费网络监视工具,能有效监控Windows、Linux和Unix的主机状态,交换机路由 器等网络设置,打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在 状态恢复后发出正常...
综上所述,Nagios的安装与配置过程虽然相对繁琐,但按照以上步骤操作,可以较为顺利地搭建起一个功能完善的监控平台。通过Nagios的使用,可以大大提高网络维护工作的效率和质量,有效预防和解决网络故障。
【Nagios初步搭建文档】 Nagios是一款广泛使用的开源网络和系统监控工具,由Ethan Galstad开发,最初名为NetSaint。它被设计用于监控Linux和Unix系统,以及Windows主机、网络设备如交换机和路由器,甚至包括打印机...
Nagios 监控软件搭建部署 Nagios 是一款功能强大、灵活性强的开源网络及服务监控工具,能够有效地监控 Windows、Linux 和 UNIX 等系统的主机各种状态信息、交换机、路由器等网络设备、主机端口及 URL 服务等。 ...
### nagios的搭建配置 #### 一、准备阶段 **1. 实验环境** 本教程构建了一个由三台主机组成的实验环境,旨在演示如何通过nagios实现有效的远程监控。 - **监控机**:安装了nagios核心软件,负责处理监控数据并...
本文将以Nagios为例,介绍搭建监控服务器的最佳实践,以及如何使用系统自带的监控命令如vmstat、iostat、sar等,提高监控的效率和质量。 ### 一、Nagios监控服务器的搭建 Nagios是一款开源的系统和服务监控程序,...
该文档包含Nagios搭建所需组件,nagios-3.5.0、nagios-cn-3.2.3.tar.gz、nagios-plugins-1.4.14.tar.gz、nginx-1.5.3.tar.gz、nrpe-2.12.tar.gz、pnp-0.4.13.tar.gz、rrdtool-1.4.8.tar.gz [注]:软件包已经过测试,...
企业级Nagios监控运维实战指南:搭建经验、日常监控处理与资源优化攻略,基于企业级Nagios监控运维实践:搭建经验总结、资源监控与运维优化指南,企业级nagios监控运维工使用经验。 包含:从搭建naigos后的使用经验...
第一章 关于Linux的历史(N) 第二章 图形界面还是命令窗口(N) 第三章 Linux操作系统的安装 第四章 初步进入linux世界 第五章 Linux系统的远程登录 第六章 Linux文件与目录...第二十四章 使用nagios搭建监控服务器
Nagios是一款广泛使用的开源网络监控系统,它能够监控网络服务、主机以及各种系统资源,及时发现并通知系统管理员可能...通过以上步骤和知识,我们可以成功搭建起一个Nagios监控服务器,实现对网络和系统的有效监控。
本文将详细介绍如何在Linux环境中配置和安装Nagios,包括搭建LAMP环境、下载安装Nagios及其插件,以及进行必要的配置。 一、搭建LAMP环境 LAMP是指Linux、Apache、MySQL和PHP的组合,是运行Nagios所需的基础环境。...
### Linux下Nginx+Nagios监控平台搭建详解 随着Linux服务器稳定性和可用性的不断提高,企业对于线上服务的要求也越来越高。为了确保业务连续性及服务质量,很多企业都会部署专门的监控系统来实时监测服务状态,并在...
### Nagios 安装及配置详解 #### 一、引言 Nagios是一款功能强大的开源网络监控系统,主要用于监控主机、...通过本文的学习,读者应该能够成功地搭建一个基本的Nagios监控环境,并根据实际需要扩展更多的监控功能。
#### 三、环境搭建 ##### 3.1 环境安装 执行以下命令安装所需的依赖库: ```bash # yum install -y gcc glibc glibc-common gd gd-devel xinetd openssl-devel httpd php ``` 这些依赖项包括编译工具(`gcc`)、图形...