转载自: http://fengzhige.blog.51cto.com/3691377/1034485
在linux系统中,几乎所有运行的服务都会产生相对就的日志(log),所运行的程序在出错时都会有错误提示,即使没有任何提示也可以通过“echo $”来查看运行是否成功。使用zabbix已经有一段时间了,整理一下遇到过的问题和解决的方法以。
zabbix的日志存放在/tmp下,服务器端对应的日志是zabbix_server.log,被监控端对应的日志是zabbix_agentd.log.
一,zabbix服务是否已经开启成功
- 查看系统是否已经有zabbix进程正在运行
- # ps aux |grep zabbix
- 查看系统是否已监听zabbix server和zabbix agent所使用的10050、10051端口
- # netstat -nplut |grep zabbix
- 如果没有,则开启:#/etc/init.d/zabbix_server_ctl start
- #/etc/init.d/zabbix_agent_ctl start
特别需要注意的是:每次修改完配置文件之后都需要重新启动对应的zabbix server或者zabbix agentd。
部分运行脚本在做restart时无法关闭zabbix导致服务无法重新启动,可用kill的命令把zabbix相关的进程杀掉再启动。
二、zabbix_server.log出现的提示
2009:20121023:193549.354 Sending list of active checks to [192.168.30.3] failed: host [CentOS-3] not found
这是因为zabbix_agentd.conf配置文件中的Hostname与web中的主机名对应。
三,网页中了出现的错误
1,
Get value from agent failed: cannot connect to [[192.168.30.2]:10050]: [111] Connection refused
|
192.168.30.2是我的zabbix server服务器,本身也有监控自己本身的agent功能。出现这种错误是因为忘记在zabbix服务器开户zabbix_agentd。在Last 20 issues中也有提示
解决方法:开启zabbix_agentd即可。
2,
Get value from agent failed: cannot connect to [[192.168.30.3]:10050]: [113] No route to host
|
看提示“No route to host”,与网络连接有关。排除的方法如下:
a)查看192.168.30.3这台机器是否已开机
b)在zabbix server端向这台机器ping,看网络是否通
c)用telnet 登录10050和10051端口,看该主机是否允许这两个端口通讯
d)查看iptables防火墙规则是否拦截10050、10051端口
3,
网页中不停地有以下红色提示:
zabbix server is not running: the information displayed may not be current.
zabbix server is running | No.
查看/tmp/zabbix_server.log和/tmp/zabbix_agent.log无任何异常。看zabbix_server和zabbix_agent进程、端口都正常……几翻google以后并尝试,终于得到了解决!
http://www.zabbix.com/forum/showthread.php?t=23878&page=3 这里面有说到zabbix受selinux的影响而已有这种错误提示。
http://www.zabbix.com/forum/showthread.php?t=25321 这里面说到了修改hostname为IP的做法。
我具体的做法是:
①查看selinux产生的log,确实有错误提示:
#tail -f /var/log/audit/audit.log
type=AVC msg=audit(1351863204.990:32): avc: denied { name_connect } for pid=1575 comm="httpd" dest=10051 scontext=system_u:system_r:httpd_t:s0 tcontext=system_u:object_r:port_t:s0 tclass=tcp_socket
type=SYSCALL msg=audit(1351863204.990:32): arch=40000003 syscall=102 success=no exit=-13 a0=3 a1=bfd494b0 a2=b76b0ad8 a3=d items=0 ppid=1434 pid=1575 auid=4294967295 uid=48 gid=48 euid=48 suid=48 fsuid=48 egid=48 sgid=48 fsgid=48 tty=(none) ses=4294967295 comm="httpd" exe="/usr/sbin/httpd" subj=system_u:system_r:httpd_t:s0 key=(null)
②然后让selinux允许它通过
- setsebool -P httpd_can_network_connect on
③编辑zabbix.conf.php文件,把$ZBX_SERVER的值改为本机的IP地址
$ZBX_SERVER = '192.168.30.2'; #######用IP代替hostname
④OK
用户自定义脚本监控:
a)
有时候用户自定义的脚本运行的时间可能比较长,如超过10秒的20秒的。这时在执行zabbix_agentd -p 或者zabbix_agentd -t时就可能出现“Alarm clock”,从而得不到想要的结果。这是因为zabbix agentd配置文件中定义Timeout时间默认为3秒,脚本运行取结果的时间超过了3秒就会出现这种情况。
解决方法:编辑配置文件/etc/zabbix/zabbix_agentd.conf,找到"Timeout"把它定义为30秒或小于30秒。
b)
对a中的情况还需要注意对zabbix服务器端的配置,如我自己定义的脚本
- UserParameter=ping.avgtime,ping 192.168.30.2 -c 10 -w 29 |grep 'avg' |awk -F "/" '{print $5}'
- 对192.168.30.2 ping 10取平均值,-w参数是对ping限定时间为29秒
这个脚本运行的大概时间为10秒左右,此时在agent端虽然可以用zabbix_agentd -t得到结果,但是在zabbix服务器端日志会不断的出现
1762:20121023:191941.360 resuming Zabbix agent checks on host [Zabbix server]: connection restored
1761:20121023:191952.149 Zabbix agent item [ping.avgtime] on host [CentOS-3] failed: first network error, wait for 15 seconds
1762:20121023:192010.610 Zabbix agent item [ping.avgtime] on host [CentOS-3] failed: another network error, wait for 15 seconds
1762:20121023:192028.628 Zabbix agent item [ping.avgtime] on host [CentOS-3] failed: another network error, wait for 15 seconds
这样的错误日志,并且在web端也没有画出图来。
解决方法:
①编辑zabbix服务器端的配置文件/etc/zabbix/zabbix_server.conf找到"Timeout"把它定义为30秒或小于30秒。
②如果还有类似提示则应该是zabbix服务器的内存设置得太小了,加大服务器内存便可。
1: http://www.jincon.com/archives/169/
2: http://fengzhige.blog.51cto.com/3691377/1034485
相关推荐
### zabbix-server is not running 解决方法 #### 一、问题背景 在部署Zabbix监控系统的过程中,可能会遇到“zabbix-server is not running”的错误提示。这种情况通常发生在虚拟机重启之后,原本正常运行的Zabbix...
在 Zabbix 系统中,前端页面显示 “zabbix server is not running: the information displayed may not be current”,这是一个常见的问题。这种情况可能是由于多种原因引起的,例如 Server 端性能问题、Web 端与 ...
Zabbix 运维监控平台解决方案 Zabbix 是一个企业级的开源分布式监控解决方案,提供了基于 WEB 界面的分布式系统监视和网络监视功能。该解决方案具备常见的商业监控软件所具备的功能,包括主机性能监控、网络设备...
Zabbix运维监控平台解决方案.pdf
Zabbix运维监控平台是一款强大的企业级开源分布式监控解决方案,它为各类组织提供了全面的系统、网络及应用监控功能。Zabbix能够24小时不间断地监控网站,确保在出现故障时,如服务器CPU负载过高、磁盘空间告急、...
根据日志报错排查 cat /var/log/zabbix/zabbix...登陆报错解决 zabbix server is running | No. 解决方法1 setsebool -P httpd_can_network_connect on selinux 允许它通过httpd服务 关闭selinux 永久关闭vi /e
Zabbix 调用脚本超时解决方案 在 Zabbix 中,调用脚本超时是一个常见的问题。当脚本执行时间超过 30 秒时,Zabbix 将获取该脚本执行的结果。这是由于 Zabbix 的内部源码限制了脚本执行的时间最多不超过 30秒。因此...
Zabbix 运维监控平台项目解决方案 一、背景 在企业级别的IT基础设施中,服务器、网络设备、数据库等硬件和软件的稳定运行是至关重要的。然而,随着企业的规模和复杂度的增加,IT基础设施的监控和管理变得越来越复杂...
Zabbix 常见问题解决方案 Zabbix 是一款功能强大且灵活的监控工具,但是在实际使用中,总会遇到一些问题。下面我们将对 Zabbix 常见问题进行解决,并对解决方案进行详细的解释。 问题一:查看 zabbix_server.log,...
Zabbix运维监控平台是一款广泛使用的开源监控解决方案,适用于企业的IT基础设施监控。该平台的设计旨在确保系统的稳定性和高效运行,通过实时监测和预警机制,帮助企业预防可能出现的各类故障,减少服务中断带来的...
Zabbix运维监控平台是一款强大的企业级开源分布式监控解决方案,它为系统管理员提供了全面的系统、网络和应用监控功能。以下是对Zabbix运维监控平台的详细解释: 一、背景 随着互联网技术的发展,网站和业务系统的...
本文将详细介绍一种基于Zabbix的混合云环境监控系统解决方案,旨在提供全面、高效且经济的监控策略。 **背景和原因** 随着企业对IT基础设施的需求增加,混合云环境变得越来越普遍。然而,这种环境的多样性使得监控...
Zabbix 是一个功能强大且灵活的监控解决方案,本文将详细介绍如何使用 Zabbix 配置 SNMP 硬件监控方案。 硬件监控 硬件监控是计算机系统中最重要的一部分,对于硬件的监控可以确保系统的稳定运行。常用的监控手段...
Zabbix是一款开源的企业级监控解决方案,它能够对网络性能、服务器状态、应用程序等多个层面进行实时监控和报警。本文将深入探讨Zabbix的核心功能、部署流程、开发与应用实践,旨在帮助读者全面理解并掌握Zabbix在...
Zabbix 是一个企业级的监控解决方案,提供了强大的监控和自动化功能。以下是 Zabbix 6.0 中文手册的知识点总结: 1. 简介:Zabbix 是一个基于 Web 的网络监控系统,可以监控各种网络设备和服务器,提供实时的监控和...