【基本介绍】
nagios的客户端nrpe自带了check_procs可以监控进程的数量(nrpe2.13带有这个脚本,早期版本不确定)
【基本参数】
[root@local libexec]# ./check_procs -h
check_procs v1.4.15 (nagios-plugins 1.4.15)
Checks all processes and generates WARNING or CRITICAL states if the specified
metric is outside the required threshold ranges. The metric defaults to number
of processes. Search filters can be applied to limit the processes to check.
Usage:
check_procs -w <range> -c <range> [-m metric] [-s state] [-p ppid]
[-u user] [-r rss] [-z vsz] [-P %cpu] [-a argument-array]
[-C command] [-t timeout] [-v]
Options:
-h, --help
Print detailed help screen
-V, --version
Print version information
-w, --warning=RANGE
Generate warning state if metric is outside this range
-c, --critical=RANGE
Generate critical state if metric is outside this range
-m, --metric=TYPE
Check thresholds against metric. Valid types:
PROCS - number of processes (default)
VSZ - virtual memory size
RSS - resident set memory size
CPU - percentage CPU
ELAPSED - time elapsed in seconds
-t, --timeout=INTEGER
Seconds before connection times out (default: 10)
-v, --verbose
Extra information. Up to 3 verbosity levels
Filters:
-s, --state=STATUSFLAGS
Only scan for processes that have, in the output of `ps`, one or
more of the status flags you specify (for example R, Z, S, RS,
RSZDT, plus others based on the output of your 'ps' command).
-p, --ppid=PPID
Only scan for children of the parent process ID indicated.
-z, --vsz=VSZ
Only scan for processes with VSZ higher than indicated.
-r, --rss=RSS
Only scan for processes with RSS higher than indicated.
-P, --pcpu=PCPU
Only scan for processes with PCPU higher than indicated.
-u, --user=USER
Only scan for processes with user name or ID indicated.
-a, --argument-array=STRING
Only scan for processes with args that contain STRING.
--ereg-argument-array=STRING
Only scan for processes with args that contain the regex STRING.
-C, --command=COMMAND
Only scan for exact matches of COMMAND (without path).
RANGEs are specified 'min:max' or 'min:' or ':max' (or 'max'). If
specified 'max:min', a warning status will be generated if the
count is inside the specified range
This plugin checks the number of currently running processes and
generates WARNING or CRITICAL states if the process count is outside
the specified threshold ranges. The process count can be filtered by
process owner, parent process PID, current state (e.g., 'Z'), or may
be the total number of running processes
Examples:
check_procs -w 2:2 -c 2:1024 -C portsentry
Warning if not two processes with command name portsentry.
Critical if < 2 or > 1024 processes
check_procs -w 10 -a '/usr/local/bin/perl' -u root
Warning alert if > 10 processes with command arguments containing
'/usr/local/bin/perl' and owned by root
check_procs -w 50000 -c 100000 --metric=VSZ
Alert if VSZ of any processes over 50K or 100K
check_procs -w 10 -c 20 --metric=CPU
Alert if CPU of any processes over 10%% or 20%%
Send email to nagios-users@lists.sourceforge.net if you have questions
regarding use of this software. To submit patches or suggest improvements,
send email to nagiosplug-devel@lists.sourceforge.net
【简单例子】
创建监控警告:进程名是salt-minion数量在1以外的
[root@locallibexec]# ./check_procs -w 1:1 -C salt-minion
PROCS OK: 1 process with command name 'salt-minion
【一些总结】
1.如果判断进程名
用扩展信息模式,就可以指定进程名字,进程状态等信息
[root@local libexec]# ./check_procs -vv -w 1:1 -C salt-minion
CMD: /bin/ps axwo 'stat uid pid ppid vsz rss pcpu comm args'
Matched: uid=0 vsz=361980 rss=26648 pid=27079 ppid=1 pcpu=0.00 stat=Sl etime= prog=salt-minion args=/usr/bin/python2.6 /usr/bin/salt-minion -d
PROCS OK: 1 process with command name 'salt-minion'
[root@local libexec]# /bin/ps axwo 'stat uid pid ppid vsz rss pcpu comm args' | grep salt-minion
S+ 0 3628 3505 6056 576 0.0 grep grep salt-minion
Sl 0 27079 1 361980 26648 0.0 salt-minion /usr/bin/python2.6 /usr/bin/salt-minion -d
【参考】
http://bangbangsoundslikemachinery.blogspot.tw/2011/09/nagios-plugin-checkprocs-incorrectly.html
分享到:
相关推荐
对于进程监控,Nagios可以通过插件`check_procs`来实现。这个插件可以检查指定进程是否存在,或者进程的数量是否在预期范围内。在配置文件中,我们需要指定要监控的进程名,以及期望的进程数量。例如,我们可以设置...
8. `check_procs`:跟踪系统进程,确保关键服务正在运行。 安装和使用nagios-plugins-1.4.9通常涉及以下步骤: 1. 解压缩文件:使用`tar -zxvf nagios-plugins-1.4.9.tar.gz`命令解压。 2. 进入解压后的目录:`cd ...
- check_procs:监控进程数量,确保关键服务正常运行。 - check_netstat:分析网络连接状态,检测异常连接。 - check_ntp:确保NTP时钟同步,防止时间漂移导致的问题。 5. 自定义插件开发 用户可以基于Nagios...
7. `check_procs`:检查运行中的进程数量,防止恶意进程或服务异常。 8. `check_users`:统计当前在线用户数量,防止过多并发登录。 安装nagios-plugins-1.5的步骤通常包括: 1. 解压文件:使用`tar -zxvf nagios-...
5. **check_procs**:监控进程数量,确保关键服务正常运行。 6. **check_load**:检查系统的CPU负载,避免过载。 7. **check_mem**:监测内存使用情况,避免内存耗尽。 安装和配置nagios-plugins-2.1.1时,首先需要...
为了监控keepalived进程,我们可以创建一个专门的Nagios插件,如`check_procs`,检查特定进程的数量。在NRPE配置文件中,添加一条命令定义,让Nagios服务器可以通过NRPE执行这个插件。例如: ```ini command[check_...
`check_procs`检查系统进程数量,可以设置进程计数的阈值等。 总的来说,"nagios-plugins-2.2.1"为Nagios提供了丰富的监控功能,帮助系统管理员确保网络服务的稳定性和可靠性。通过合理配置和使用这些插件,可以...
2. 主要插件:Nagios-plugins-2.0包含了许多预置的插件,如check_disk用于检查磁盘空间,check_http用于监测HTTP服务,check_ping用于ICMP ping测试,check_procs用于监控进程数量,check_ntp_time用于验证NTP服务器...
2. **check_procs**:监控指定进程的数量,确保关键服务正常运行。 3. **check_load**:监控系统的负载平均值,过高负载可能表示系统过载。 4. **check_memory**:检查系统的物理内存和交换空间使用情况。 5. **...
7. **check_procs**:跟踪活动进程数量,识别异常进程。 8. **check_snmp**:通过SNMP协议监控网络设备的状态。 **三、插件工作原理** 当Nagios核心需要检查某个服务时,它会调用相应的插件,并传递参数。插件执行...
常见的插件有check_ping(检查网络可达性)、check_disk(检查磁盘空间)、check_procs(检查进程数量)等。用户可根据需求编写自定义插件。 **五、告警与通知** Nagios可以根据设定的阈值和通知策略,在检测到...
2. 插件支持:Nagios通过插件来检测具体的服务和资源,例如,nmap用于网络扫描,check_disk用于检查磁盘空间,check_procs用于监控进程状态。这些插件极大地拓展了Nagios的功能。 3. 故障预警:Nagios不仅报告当前...
例如,使用`check_disk`插件检查远程主机的磁盘空间,或者使用`check_procs`监控特定进程的数量。 6. **安全注意事项** 由于NRPE涉及到远程执行命令,因此必须严格限制可执行的命令列表,并确保只允许信任的Nagios...