众所周知, hadoop 是运行在分布式的集群环境下,同是是许多用户或者组共享的集群,因此任意时刻都会有很多用户来访问 NN 或者 JT ,对分布式文件系统或者 mapreduce 进行操作,使用集群下的机器来完成他们的存储和计算工作。当使用 hadoop 的用户越来越多时,就会使得集群运维人员很难客观去分析集群当前状况和趋势。比如 NN 的内存会不会在某天不知晓的情况下发生内存溢出,因此就需要用数据来得出 hadoop 当前的运行状况。
Chukwa 就是利用了集群中的几个进程输出的日志,如 NN,DN,JT,TT 等进程都会有 log 信息,因为这些进程的程序里面都调用 log4j 提供的接口来记录日志,而到底日志的物理存储是由 log4j.properties 的配置文件来配置的,可以写在本地文件,也可以写到数据库。 Chukwa 就是来控制这些日志的记录,由 chukwa 程序来接替这部分工作,完成日志记录和采集工作。 Chukwa 由以下几个组件组成: agent 收集各个进程的日志,并将收集的日志发送给 collector 。 Collector 收集 agent 发送为的数据,同时将这些数据保存到 hdfs 上, MR job 利用 mapreduce 来分析这些数据。 DumpTool 将结果下载保存到 mysql 数据库。 HICC 将数据展现出来。更多信息: http://incubator.apache.org/chukwa/
Ganglia 则更偏向于操作系统低层一点的监控,主要是收集集群中的各个机器的 CPU 使用情况,内存使用情况,磁盘 I0, 网络 IO ,磁盘容量等,更像是 windows 的任务管理器,只不过它是管理分布集群机器。类似的,它也由以下组件组成:数据采集组件,每隔一段时间采集一次数据,然后将数据发送给收集器,收集器收集好数据,再将数据保存到数据库,最后一个叫做 rrdtool 通过图形化来展现数据。更值的一提的是, ganglia 更加通用性,除了收集固定的机器性性外,它还提供了相关插件,可以插入到其他进程,如 JAVA 程序,然后可以收集起这些进程的相关信息。
更多信息: http://ganglia.info/
http://www.javabloger.com/article/j2ee-linux-ganglia-rrdtool-java-mysql-1.html
对于深入了解当前平台的状态以及集群中机器的运行情况, chukwa 和 ganglia 无疑是不错的工具,可以用来去得到相关的准确数据,用来知道当前的运行状态,为未来做决策,推断出当前的瓶颈,以及优化相关的应用程序等。
分享到:
相关推荐
ChukwaPoster.pdf、chukwa_presentation.pdf和chukwa_presentation_cca08.pdf这三份文档可能包含了关于Chukwa的更深入的介绍,如其架构细节、工作流程、最佳实践以及与其他Hadoop组件(如MapReduce、HBase)的集成...
通过Ganglia与Hadoop的整合,我们可以实现对大数据处理环境的深度监控,从而提高系统的稳定性和效率。在实际操作中,可能会遇到各种问题,如数据延迟、节点通信问题等,都需要根据具体情况进行调试和优化。文档...
在Hadoop集群中,有效地监控系统资源至关重要,Ganglia是一个强大的开源监控系统,能够提供实时的性能数据,包括CPU、I/O、MapReduce带宽等关键指标。本安装文档将指导你如何在基于CentOS 5.6的环境中安装Ganglia来...
Apache Chukwa是一款开源的数据收集系统,专门设计用于监控大规模分布式系统的状态,尤其与Hadoop生态系统紧密集成。作为Hadoop的扩展,Chukwa利用Hadoop的分布式文件系统(HDFS)和MapReduce框架,确保了高可扩展性...
Apache Chukwa 是一个专为监控大规模分布式系统而设计的开源数据收集系统,尤其是针对Hadoop环境。Hadoop本身是一个广泛应用于大数据处理的分布式存储和计算框架,而Chukwa则是在Hadoop之上构建的,旨在解决大规模...
而Apache Chukwa作为Hadoop的扩展,专为监控大型分布式系统而设计,特别是在Hadoop集群环境中,它扮演着至关重要的角色。 Chukwa的核心功能在于数据收集、存储和分析,以确保对大规模Hadoop集群的健康状况有深入的...
4. **配置**:在安装过程中,你需要配置Chukwa的相关配置文件,如`chukwa.conf`,确保与你的Hadoop集群配置相匹配。 5. **构建Chukwa**:从Chukwa的源代码仓库克隆或下载最新版本,然后使用Maven或其他构建工具进行...
《Hadoop系统搭建及项目实践》课件02Hadoop安装与配置管理.pdf《Hadoop系统搭建及项目实践》课件02Hadoop安装与配置管理.pdf《Hadoop系统搭建及项目实践》课件02Hadoop安装与配置管理.pdf《Hadoop系统搭建及项目实践...
文档"ganglia安装和监控Hadoop.doc"应该包含了详细的步骤指导,如安装Ganglia组件,配置Ganglia以监控Hadoop集群,以及如何将Nagios与Ganglia集成。在实际操作中,你可能需要配置Ganglia的监控项以覆盖Hadoop的关键...
### Chukwa:大规模监控系统与Hadoop的关系 在IT领域,尤其是大数据处理与分析方面,Hadoop无疑占据了举足轻重的地位。然而,随着分布式系统规模的不断扩展,其复杂性和潜在的故障模式也日益增加,这促使了对监控和...
4. Adapters:适配器允许Chukwa与各种不同的数据源集成,包括系统日志、应用日志、性能指标等。 5. Chukwa Data Store:存储收集到的数据,通常使用Hadoop的HBase作为主要的数据存储,提供高效、可扩展的查询能力。...
理清Hadoop1.x与Hadoop2.x区别,对比分析。 Hadoop是大数据惊世之作,必学的东西,需要知道: 它由哪些部分组成? 各自的作用是什么? 如果工作的?
在Hadoop生态系统中,`winutils.exe` 和 `hadoop.dll` 是两个关键的组件,主要用于Windows环境下运行Hadoop。由于Hadoop最初是为Linux设计的,因此在Windows上使用时需要这些特定的二进制文件来模拟某些Unix/Linux...
《Chukwa 0.5:开源大数据收集与监控系统》 Chukwa,作为一个Apache孵化器项目,是针对大规模分布式系统的数据收集、管理和分析工具。它最初由雅虎研究院开发,设计目标是处理PB级别的日志数据,为系统监控、故障...
Hadoop 2.0 生态系统第四章 管理与监控Ganglia
Hadoop2.x的安装过程与1.x相似,但有几个关键的区别: 1. **引入YARN**:Hadoop2.x引入了YARN(Yet Another Resource Negotiator),作为资源管理和任务调度的核心组件,取代了1.x中的JobTracker。 2. **配置文件的...
hadoop安装与配置 hadoop安装与配置 Hadoop的安装与配置可以分成几个主要步骤: 1. 安装Java 2. 下载Hadoop 3. 配置Hadoop 4. 格式化Hadoop文件系统 5. 启动Hadoop 以下是基于Linux系统的简化安装与配置步骤: 1. ...