`
jwfdp
  • 浏览: 46809 次
  • 性别: Icon_minigender_1
  • 来自: 成都
社区版块
存档分类
最新评论

zabbix流程研究

 
阅读更多

1、常见监控:

 

主机的性能监控、网络设备性能监控、数据库性能监控、FTP等通用协议监控、多种告警方式、详细的报表图表绘制;(监控细节需注意的事项下面会详细描述)

 

 

 

2、Zabbix监控数据流程

 

ZabbixC/S架构的监控产品,他有2种工作模式(主动和被动)

 

141933492.png

 

 

如上图,主动模式适用在特殊场景。如云主机等,因为server端由于某种原因不能探测到agent端的端口问题(kfgzt现在就是主动模式)。这种情况需要事先写清楚

 

 

 

3、采集数据的频率问题

 

采集数据的方式等下具体描述,频率问题应该充分考虑到需求。通常一些数据的频率为60秒,提交需求的时候应当把频率给交代清楚。另外被动模式可以设定时间段来采集数据(如12点到20点频率为200秒,20点到12点的频率为100秒)。

 

 

 

报警流程

 

1、报警流程

 

141954880.png

 

 

首先报警的先决条件是触发器,他存在于项目(采集数据)中。然后当触发器被触发后会有2个分支,他会产生一个事件,存放在web中可以用来查看。然后另外一个分支就是产生动作,动作中定义了报警的方式等等。

 

 

 

2、分级报警

 

Zabbix是享受分级报警的。用步骤来划分(10个步骤)。

 

大概可以理解为报警先报1然后2然后3,中间可以有步骤的时间间隔。这样可以做到如果报到1级别的时候没人操作就往上级报。

 

 

 

3、报警方式

 

a) 短信(提短信需求的时候,尽量选择关键字来报警,字数限制问题显示不全)

 

b) 邮件

 

 

 

 

 

采集数据的问题

 

如果官方给的模板上没相应的采集数据的项目及触发器,那么就需要手动添加了

 

1、zabbix采集数据的反应形式

 

a) 数字形式,

 

b) 0 1 2 .. 脚本传递出来的参数,触发器可以判断

 

c) 字符串触发器可以判断

 

2、采集数据的方式

 

a) 命令行形式,可以直接拉取到的。如 cat /proc/meminfo | grep "MemTotal" |awk '{print $2}'

 

b) 运行脚本形式,通过脚本传递出 0 1 2 3 4等参数:如判断某个文件是否发生了改变,脚本中判断,因为zabbix不具备这样的判断功能。所以让这个脚本传递出来参数,如未改变就返回0改变就返回1,然后zabbix是可以抓取到的,然后触发器设定抓取到01就发生某种操作。

 

c) 通过crontab任务把一些总体数据打到1个文件中。然后cat grep参数出来。(这样可以节省将一些问题中的数据集中采集,分别拉取)

 

 

 

3、触发器的判断类型(其实很多函数,只做稍微列举)

 

a) 次数或时间段内的数据大于等于小于多少

 

b) 对字符串判断(判断一样或不一样。)

 

 

 

 

 

例子

 

1、采集方式:命令行直接采集数据的形式

 

需求:需获取到mysqlprocesslist除去Sleep之外的连接数,对此做统计。

 

分析:统计这样的数据,只需要一条shell命令即可搞定,所以无需脚本。

 

结果:/usr/local/mysql_percona5.5.25/bin/mysql -uccmsckdata -pdatayun_123! -sNe "show full processlist" | egrep -v "Sleep|Id|show full processlist" | wc -l

 

这样 就可以采集到mysql的连接数了。

 

然后提交issue的时候,需要把主动还是被动模式、采集数据的时间间隔、报警联系人、方式、短信报警内容提交给运维组即可。

 

 

 

2、采集方式:脚本形式,通过传递 0 1 2 3 4等参数

 

需求:判断1个文件是否在当天是否生成及是否为空,做出相应的报警

 

分析:这类不能通过1个命令直接获取出结果。并且用脚本需要在逻辑中进行判断等操作。

 

结果:由于zabbix是可以运行脚本的,但是脚本运行完出来字符串的形式并不能在web界面中直接的观察结果,所以可以参考如下脚本:

 

#!/bin/bash

 

#

 

source /etc/profile

 

 

 

FILE="/data/opsscripts/resin_log/data/customer.data"

 

FTIME=`stat /data/opsscripts/resin_log/data/customer.data | grep "^Modify" |awk '{print $2}'`

 

DATE=`date +%F`

 

 

 

if [ -s $FILE ]

 

then

 

if [ $FTIME = $DATE ]

 

then

 

echo 0

 

else

 

echo 1

 

fi

 

else

 

echo 2

 

fi

 

 

 

# 0 检查ok

 

# 1 文件存在但日期不一样

 

# 2 文件不存在

 

 

 

142015916.png

 

切记提交脚本的时候请把相应的逻辑写在脚本后边,以便进行触发器的添加。

 

 

 

3、采集方式:通过crontab任务把一些总体数据打到1个文件中。然后cat grep参数出来。

 

需求:需要对系统中内存的各项指标进行测取并监控

 

分析:cat /proc/meminfo 可以取得内存的完整指标,但是用命令行去拉取未免有些麻烦(仅此作为参考的例子,难免有些不规范)

 

结果:做了一个crontab任务,每一分钟就cat /proc/meminfo然后覆盖到1个文件中。然后在用命令行的形式去cat/grep这个文件。然后获取相应的值。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

好了。大致上就这些吧,大致想了一些,如果有不全的地方请大家指出来。我直接加上来

分享到:
评论

相关推荐

    zabbix-PDF_reports

    在IT管理领域,Zabbix是一款广泛应用的开源网络监控系统,能够实时监控各种网络参数并提供报警服务。...通过深入研究这些材料,你可以更好地理解和实践Zabbix的报告功能,从而优化你的网络监控和管理流程。

    zabbix server与agent源码分析.rar

    本文将基于"zabbix server与agent源码分析.rar"中的资料,对Zabbix Server和Agent的C语言源码进行深入探讨,以期帮助读者理解其内部工作流程,特别是对Agent部分的详细解析。 1. Zabbix Server源码分析 Zabbix ...

    Zabbix高级技术研究.pptx

    4. **Zabbix API**:开发者可以利用Zabbix API构建自动化工具,如pyzabbix,用于集成DevOps流程,实现自动化配置和管理。 **二、故障与警告** 故障检测是Zabbix的核心功能之一,它能够及时发现并报告潜在的问题。...

    zabbix源码

    Zabbix是一款广泛使用的开源网络...总之,通过深入研究Zabbix的源码,不仅可以提升对监控系统的理解,还能为定制化开发和故障排查提供有力支持。对于想要深入了解Zabbix的IT专业人士,源码阅读是一项非常有价值的实践。

    zabbix网页端源码

    Zabbix是一款开源的企业级监控解决方案,它能够监控各种网络参数以及...通过对Zabbix网页端源码的深入学习和研究,不仅可以理解其工作原理,还可以定制化自己的监控系统,提高监控效率,为企业的IT运维带来极大的便利。

    zabbix1.8源代码

    3. **数据处理流程**:查看数据采集、存储和展示的代码,理解Zabbix如何处理监控数据。 4. **触发器和报警机制**:学习触发器定义和报警发送的实现,这有助于自定义监控规则和报警策略。 5. **API实现**:深入理解...

    zabbix源码分析

    3. **Server处理流程** Zabbix Server接收并处理Agent发送的数据,进行异常检测、触发器评估,并将结果存储到数据库中。源码分析需关注数据处理算法、触发器逻辑以及与数据库的交互。 4. **数据库设计** Zabbix...

    zabbix3.4手册1

    《Zabbix 3.4 手册》是针对IT监控工具Zabbix 3.4版本的一份详尽指南,旨在帮助用户理解和掌握该版本的各项功能和操作流程。Zabbix是一款开源的企业级监控解决方案,能够监控各种网络参数以及IT基础设施的健康状况,...

    基于Zabbix的铁路动车组WiFi运营服务监控系统应用研究.pdf

    基于Zabbix的铁路动车组WiFi运营服务监控系统应用研究 摘要: 本文提出了一种基于Zabbix的铁路动车组WiFi运营服务监控系统应用研究,以掌握铁路动车组WiFi运营服务系统实时运行状态,提高系统运维效率,缩短售后...

    Python-为pubuim使用的Zabbix报警脚本

    首先,我们要理解Zabbix报警机制的基本工作流程。当Zabbix检测到监控项(如服务器CPU使用率、磁盘空间等)超过预设阈值时,会触发报警。报警可以通过多种方式发送,如邮件、短信、推送通知等。Python脚本可以作为...

    qiuzhiquan:本网站采用Django框架,基于LNMP架构搭建,采用Zabbix进行主机运行状态监控

    本文将深入探讨该项目的技术栈、开发流程以及如何利用Zabbix进行主机运行状态监控,帮助读者理解Web开发的实战过程。 一、项目技术栈解析 1. Django框架:Django是Python领域内广泛应用的Web开发框架,以其MVT...

    研究报告:DevOps.pdf

    2. **运维工具链**:介绍了各种用于自动化配置、监控、部署和故障排查的工具,如Ansible、Puppet、Chef等自动化配置工具,以及Nagios、Zabbix等监控系统。这些工具在VMware环境中的应用能提升运维效率,降低错误率。...

    大数据时代自动化运维管理发展对策研究.pdf

    因此,研究并发展大数据时代自动化运维管理的对策显得尤为重要。 一、自动化运维管理的基础 自动化运维管理依赖于各类基础监控工具及日志监控分析工具,这些工具对系统、网络、硬件、应用、服务、环境进行统一监控...

    IT运维服务工具产品整体框架图.docx

    工具组的成立,标志着中国在IT服务管理工具领域的研究和应用进入了一个新的阶段,旨在通过共享资源、协同创新,促进国产IT服务管理工具的发展。 整体框架图通常会涵盖运维服务的各个方面,包括但不限于以下几个关键...

    管理系统系列--运维管理发布系统.zip

    4. 监控:监控系统如Prometheus、Zabbix和ELK Stack用于实时收集和分析系统性能数据,预警异常情况,帮助运维人员及时发现并解决问题。 5. 故障恢复:通过备份策略和灾难恢复计划,运维管理发布系统能确保在系统...

    基于Python的服务器运维可视化研究与应用.zip

    本研究深入探讨了如何利用Python进行服务器运维的可视化,并将其应用到实际工作中,以提高运维效率和决策能力。 Python作为一门强大的编程语言,因其简洁的语法和丰富的库支持,成为运维自动化和数据可视化的理想...

    自动化运维加速无人车产品化.pdf

    图森未来作为一家专注于L4级别无人驾驶重卡解决方案的企业,其在自动化运维方面进行了深入研究,以应对无人驾驶研发过程中的复杂性、速度、稳定性和安全性挑战。 1. **无人驾驶研发流程** 无人驾驶的研发涉及多个...

    测试环境数据库性能监控实践.pdf

    这个流程可能包括查看历史数据,分析性能趋势,以及对特定时间段的异常情况进行深入研究。 数据库性能诊断需求通常源于生产环境中出现的性能问题。诊断流程通常包括定期的任务执行,如非自然时间的同步报表输出,以...

    wato-源码.rar

    通过深入研究"Wato-源码.zip",开发者不仅可以学习到上述各个领域的知识,还可以了解如何在一个实际的项目中整合这些技术,提升自己的技能。同时,参与开源项目有助于理解和遵循良好的编程实践,对个人和团队的成长...

Global site tag (gtag.js) - Google Analytics