某运维人员问:
就监控来说,nagios,zabbix,cacti都有自己的优越性,你觉得选择其中哪一个好。
考虑全面
解答:
gaoyaohuachina的个人建议:
三点建议:
1、能适合企业需求就行,以上三者雷同度90%,无特殊需求都可以满足。
2、选择自己能够掌控的,例如各种监控业务你都能搞得定的。
3、已经有的能满足需求就尽量用着,例如nagios+cacti就很棒了,还可以配合ganglia。
软件描述:
nagios功能超强大,没的说,老大哥级别,报警功能非常棒,依赖报警,集群功能,无所不能。
cacti图形显示历史趋势很强大,可配合nagios一起用,自己用也OK。
zabbix也算是后起之秀,但是没必要盲目推崇。看近期很多新手都在看着大家说好而盲目也安装配置,
这个东施效颦不靠谱,特别是nagios,cacti都掌握了,再去搞zabbix,纯属浪费时间。
其实监控软件还有很多很棒的呢,例如:munin,hyperic等。
核心思想:
能解决问题和需求的软件都是好软件。无目的横向研究雷同度很高的软件只能是浪费时间!无任何益处!
更没必要放弃会的,已经熟练的,去研究那些不会的,并且90%以上重复功能的软件。
除非需求特殊,例如:确实已经用的满足不了需求,或者老大逼着用。
学习其他的软件也是如此。切记盲目。
相关推荐
1.1 整体性原则:该原则强调了软件项目运维的整体性,要求软件项目运维人员具备全局观念和整体思维能力。 1.2 有效性原则:该原则强调了软件项目运维的有效性,要求软件项目运维人员具备实践性和效率意识。 1.3 ...
【软件平台运维技术方案——项目人员配备与人员管理】 在软件平台运维中,人员配备与人员管理是确保项目顺利进行的关键环节。一个完整的项目团队通常包括以下几类角色: 1. **项目管理组**:负责整体项目的规划、...
标题中的“简而轻的低侵入式在线构建、自动部署、日常运维、项目监控软件 更是一款原生 ops 软件”表明我们讨论的是一个轻量级且对系统影响小的DevOps工具,它涵盖了从代码构建到自动化部署再到日常运维和项目监控的...
大数据技术如Hadoop、Spark等,能高效地存储和处理这些数据,而大数据分析工具如Elasticsearch、Kibana和Logstash则提供了可视化的监控界面,帮助运维人员快速定位问题。 自感知监控是此方法的核心。它强调系统自身...
监控运维管理系统是现代企业IT管理的关键工具,尤其对于那些设备繁多、运维人员有限的企业来说,这类系统能够有效地提升设备运行效率,降低运营成本。监控运维管理系统通过集成化的监控方式,确保了各种IT设备和应用...
7. **管理制度**:运维人员需遵循特定的工作时间和考勤制度,以保证服务的连续性。违反规定可能会受到相应的处罚,以维持团队的纪律性和效率。 8. **文档清单**:文档管理是运维过程的重要组成部分,包括巡检记录、...
- **运维管理体系架构**:包括系统总体架构设计,监控采集层负责收集各类设备和应用的运行数据,数据处理层进行数据清洗和分析,运行展现层则将结果以直观的方式展示给运维人员。 - **技术路线**:采用Java语言和...
3. 磁盘和文件管理:运维人员需要监控服务器磁盘使用情况,清理不必要的文件,及时提出磁盘扩展需求,检查并管理服务器上的文档,防止非法软件和资料的存储。 4. 故障收集与处理:运维人员需建立服务器故障日志,...
一、运维人员组织方案 运维团队的组织架构包括运维组织结构介绍、成员职责定义和成员组织结构设计。运维组织结构应确保责任明确,协同高效。运维人员需涵盖技术专家、驻点工程师、管理人员等角色,确保问题能迅速...
"软件系统运维方案.doc"可能包含了系统架构图、运维流程图、配置参数表、故障处理手册等,这些文档可以帮助运维人员更好地理解和操作系统。 四、数据分析 "1.xls"可能是运维过程中的数据报表,例如系统性能指标的...
3. 信息安全保障:运维人员需严格遵守信息安全和保密规定,防止发生六级及以上信息安全事件。这包括数据保护、访问控制和安全审计等措施,以确保信息资产的安全。 4. 运行指标要求:主机系统(含存储)、应用系统和...
标题提到的“简而轻的低侵入式在线构建、自动部署、日常运维、项目运维监控软件”是一种高效能的运维解决方案,旨在简化IT运维流程,提高开发效率,减少人工干预,确保系统的稳定运行。这类软件的核心特点是其低侵入...
通过这样的平台,运维人员可以轻松地监控和管理各种系统资源,有效提升工作效率和服务质量。未来,还可以考虑引入更多的高级特性,如机器学习算法来预测性能趋势等,进一步增强系统的智能化水平。
该平台可以帮助开发者和运维人员实时监控系统的性能和状态,快速定位和解决问题,提高系统的可靠性和可维护性。 主要知识点: 1. 微服务架构概述:微服务架构是当前软件开发中的热门话题之一,它可以将复杂的软件...
此外,还包括用户现场技术人员值守,确保网络实时连通,监控网络性能,提供网络优化建议,并进行安全设备监控,预防安全事件。 4. 主机、存储系统运维服务:这部分涉及主机设备的运行状态监控、故障处理和性能优化...
基础运维人员需要密切关注监控系统的报警信息,并根据实际情况采取相应措施。 **3.2 应用运维(二线)** 保持7x24小时通讯畅通,以便在接到一线报警时能够迅速响应。除了常规的故障处理外,还需要定期向一线运维...
运维人员需要实时监控系统性能,如CPU、内存使用情况,磁盘空间,网络流量等。`top`、`iostat`、`vmstat`等命令提供了这些信息。当系统状态异常时,脚本可以发送邮件或短信报警,确保问题得到及时处理。 八、自动化...
在实际应用中,运维人员需要根据自身的服务器环境和需求选择合适的监控软件,同时,软件的安装、配置和优化也是一个重要的过程。这通常涉及到了解软件的工作原理、熟悉其配置选项,以及根据实际情况调整报警阈值和...
综上所述,《海量运维监控系统规划与部署》深入浅出地讲解了如何在大数据时代构建高效运维监控系统,对于IT运维人员来说,是一本极具价值的参考书籍。通过阅读和实践,读者可以提升运维管理水平,为企业的IT系统保驾...