`
MyEyeOfJava
  • 浏览: 1152856 次
  • 性别: Icon_minigender_1
  • 来自: 北京
博客专栏
7af2d6ca-4fe1-3e9a-be85-3f65f7120bd0
测试开发
浏览量:71196
533896eb-dd7b-3cde-b4d3-cc1ce02c1c14
晨记
浏览量:0
社区版块
存档分类
最新评论

[Hadoop]chukwa与ganglia的区别

 
阅读更多
众所周知, hadoop 是运行在分布式的集群环境下,同是是许多用户或者组共享的集群,因此任意时刻都会有很多用户来访问 NN 或者 JT ,对分布式文件系统或者 mapreduce 进行操作,使用集群下的机器来完成他们的存储和计算工作。当使用 hadoop 的用户越来越多时,就会使得集群运维人员很难客观去分析集群当前状况和趋势。比如 NN 的内存会不会在某天不知晓的情况下发生内存溢出,因此就需要用数据来得出 hadoop 当前的运行状况。

Chukwa 就是利用了集群中的几个进程输出的日志,如 NN,DN,JT,TT 等进程都会有 log 信息,因为这些进程的程序里面都调用 log4j 提供的接口来记录日志,而到底日志的物理存储是由 log4j.properties 的配置文件来配置的,可以写在本地文件,也可以写到数据库。 Chukwa 就是来控制这些日志的记录,由 chukwa 程序来接替这部分工作,完成日志记录和采集工作。 Chukwa 由以下几个组件组成: agent 收集各个进程的日志,并将收集的日志发送给 collector 。 Collector 收集 agent 发送为的数据,同时将这些数据保存到 hdfs 上, MR job 利用 mapreduce 来分析这些数据。 DumpTool 将结果下载保存到 mysql 数据库。 HICC 将数据展现出来。更多信息: http://incubator.apache.org/chukwa/



Ganglia 则更偏向于操作系统低层一点的监控,主要是收集集群中的各个机器的 CPU 使用情况,内存使用情况,磁盘 I0, 网络 IO ,磁盘容量等,更像是 windows 的任务管理器,只不过它是管理分布集群机器。类似的,它也由以下组件组成:数据采集组件,每隔一段时间采集一次数据,然后将数据发送给收集器,收集器收集好数据,再将数据保存到数据库,最后一个叫做 rrdtool 通过图形化来展现数据。更值的一提的是, ganglia 更加通用性,除了收集固定的机器性性外,它还提供了相关插件,可以插入到其他进程,如 JAVA 程序,然后可以收集起这些进程的相关信息。

更多信息: http://ganglia.info/

http://www.javabloger.com/article/j2ee-linux-ganglia-rrdtool-java-mysql-1.html



对于深入了解当前平台的状态以及集群中机器的运行情况, chukwa 和 ganglia 无疑是不错的工具,可以用来去得到相关的准确数据,用来知道当前的运行状态,为未来做决策,推断出当前的瓶颈,以及优化相关的应用程序等。
分享到:
评论

相关推荐

    Hadoop chukwa

    ChukwaPoster.pdf、chukwa_presentation.pdf和chukwa_presentation_cca08.pdf这三份文档可能包含了关于Chukwa的更深入的介绍,如其架构细节、工作流程、最佳实践以及与其他Hadoop组件(如MapReduce、HBase)的集成...

    (转经修改)ganglia监控HADOOP 2.2

    通过Ganglia与Hadoop的整合,我们可以实现对大数据处理环境的深度监控,从而提高系统的稳定性和效率。在实际操作中,可能会遇到各种问题,如数据延迟、节点通信问题等,都需要根据具体情况进行调试和优化。文档...

    HADOOP监控GANGLIA安装文档.docx

    在Hadoop集群中,有效地监控系统资源至关重要,Ganglia是一个强大的开源监控系统,能够提供实时的性能数据,包括CPU、I/O、MapReduce带宽等关键指标。本安装文档将指导你如何在基于CentOS 5.6的环境中安装Ganglia来...

    Hadoop状态分析系统Chukwa.docx

    Apache Chukwa是一款开源的数据收集系统,专门设计用于监控大规模分布式系统的状态,尤其与Hadoop生态系统紧密集成。作为Hadoop的扩展,Chukwa利用Hadoop的分布式文件系统(HDFS)和MapReduce框架,确保了高可扩展性...

    Hadoop状态分析系统Chukwa.pdf

    Apache Chukwa 是一个专为监控大规模分布式系统而设计的开源数据收集系统,尤其是针对Hadoop环境。Hadoop本身是一个广泛应用于大数据处理的分布式存储和计算框架,而Chukwa则是在Hadoop之上构建的,旨在解决大规模...

    Apache Hadoop---Chukwa.docx

    而Apache Chukwa作为Hadoop的扩展,专为监控大型分布式系统而设计,特别是在Hadoop集群环境中,它扮演着至关重要的角色。 Chukwa的核心功能在于数据收集、存储和分析,以确保对大规模Hadoop集群的健康状况有深入的...

    chukwa安装

    4. **配置**:在安装过程中,你需要配置Chukwa的相关配置文件,如`chukwa.conf`,确保与你的Hadoop集群配置相匹配。 5. **构建Chukwa**:从Chukwa的源代码仓库克隆或下载最新版本,然后使用Maven或其他构建工具进行...

    《Hadoop系统搭建及项目实践》课件02Hadoop安装与配置管理.pdf

    《Hadoop系统搭建及项目实践》课件02Hadoop安装与配置管理.pdf《Hadoop系统搭建及项目实践》课件02Hadoop安装与配置管理.pdf《Hadoop系统搭建及项目实践》课件02Hadoop安装与配置管理.pdf《Hadoop系统搭建及项目实践...

    ganglia+hadoop+hbase nagios 学习参考链接

    文档"ganglia安装和监控Hadoop.doc"应该包含了详细的步骤指导,如安装Ganglia组件,配置Ganglia以监控Hadoop集群,以及如何将Nagios与Ganglia集成。在实际操作中,你可能需要配置Ganglia的监控项以覆盖Hadoop的关键...

    chukwa_cca08

    ### Chukwa:大规模监控系统与Hadoop的关系 在IT领域,尤其是大数据处理与分析方面,Hadoop无疑占据了举足轻重的地位。然而,随着分布式系统规模的不断扩展,其复杂性和潜在的故障模式也日益增加,这促使了对监控和...

    chukwa-src-0.8.0.tar

    4. Adapters:适配器允许Chukwa与各种不同的数据源集成,包括系统日志、应用日志、性能指标等。 5. Chukwa Data Store:存储收集到的数据,通常使用Hadoop的HBase作为主要的数据存储,提供高效、可扩展的查询能力。...

    理清Hadoop1.x与Hadoop2.x区别

    理清Hadoop1.x与Hadoop2.x区别,对比分析。 Hadoop是大数据惊世之作,必学的东西,需要知道: 它由哪些部分组成? 各自的作用是什么? 如果工作的?

    适合hadoop2.9.* 以及 hadoop2.7.* 的winutils.exe_hadoop.dll 配置文件

    在Hadoop生态系统中,`winutils.exe` 和 `hadoop.dll` 是两个关键的组件,主要用于Windows环境下运行Hadoop。由于Hadoop最初是为Linux设计的,因此在Windows上使用时需要这些特定的二进制文件来模拟某些Unix/Linux...

    chukwa-incubating-src-0.5.0.tar.gz

    《Chukwa 0.5:开源大数据收集与监控系统》 Chukwa,作为一个Apache孵化器项目,是针对大规模分布式系统的数据收集、管理和分析工具。它最初由雅虎研究院开发,设计目标是处理PB级别的日志数据,为系统监控、故障...

    Hadoop 2.0 生态系统第四章 管理与监控Ganglia

    Hadoop 2.0 生态系统第四章 管理与监控Ganglia

    hadoop1.x与hadoop2.x配置异同

    Hadoop2.x的安装过程与1.x相似,但有几个关键的区别: 1. **引入YARN**:Hadoop2.x引入了YARN(Yet Another Resource Negotiator),作为资源管理和任务调度的核心组件,取代了1.x中的JobTracker。 2. **配置文件的...

    hadoop安装与配置 Hadoop的安装与配置可以分成几个主要步骤: 1. 安装Java 2. 下载Hadoop 3. 配

    hadoop安装与配置 hadoop安装与配置 Hadoop的安装与配置可以分成几个主要步骤: 1. 安装Java 2. 下载Hadoop 3. 配置Hadoop 4. 格式化Hadoop文件系统 5. 启动Hadoop 以下是基于Linux系统的简化安装与配置步骤: 1. ...

Global site tag (gtag.js) - Google Analytics