`

使用Ganglia监控Hadoop集群

 
阅读更多

0 环境

操作系统:CentOS 6.2 

hadoop版本:hadoop-1.0.1

集群中三台机器:

192.168.137.101        namenode

192.168.137.103        datanode1

192.168.137.104        datanode2 

1 安装Ganglia

1.1 添加EPEL软件仓库

CentOS官方软件仓库中没有Ganglia,而Ganglia依赖又太多,本人花了一天时间才把它的一个依赖项rrdtool安装好。后来放弃源码安装,改用yum。添加仓库的方法参考:http://www.linuxidc.com/Linux/2012-05/61350.htm 。需要注意的是,EPEL安装包的地址已经发生了变化,链接中的下载地址已经不适用,可以google一下最新的地址。还要注意匹配操作系统的版本。

1.2 Ganglia服务器端安装

Ganglia服务器端收集监控端信息,并提供访问接口,使用以下命令安装:

yum install ganglia ganglia-devel ganglia-gmetad ganglia-gmond ganglia-web ganglia-gmond-python

1.3 Ganglia客户端安装

$ yum install ganglia ganglia-gmond

2 配置Ganglia

2.1 监控端配置

$ vim /etc/ganglia/gmond.conf

将cluster选项中 name设置为gmetad中data_source指定的名称即可。

$ service gmond start

2.2 服务器端

$ sudo vim /etc/ganglia/gmetad.conf

data_source "hdfs" datanode1 datanode2

只需要更改 data_source一行,"hdfs"代表集群的名字,datanode1,datanode2,就是要监控的机器列表。默认端口8649。

启动服务

service gmetad start
chkconfig gmetad on

2.3服务器端Apache配置

vim /etc/httpd/conf.d/ganglia.conf

Alias /ganglia /usr/share/ganglia

<Location /ganglia>
Order deny,allow
# Deny from all
# Allow from 127.0.0.1
# Allow from ::1
Allow from all
# Allow from .example.com
</Location>

测试用的话可以做如上配置。
开启Apache
service httpd start
打开浏览器: http://serverip/ganglia。
如果出现错误:There was an error collecting ganglia data (127.0.0.1:8652): fsockopen error: Permission denied 
则需要关闭selinux:vi /etc/selinux/config,把SELINUX=enforcing改成SELINUX=disable;该方法需要重启机器。

可以使用命令setenforce 0来关闭selinux而不需要重启,刷新页面,即可访问!但此方法只是一权宜之计。要想永久修改selinux设置,还是要使用第一种方法。

3 配置Hadoop metrics

hadoop-1.0.1的配置文件为: hadoop-1.0.1/conf/hadoop-metrics2.properties。我安装的Ganglia为版本为3.1,找到配置文件中for Ganglia 3.1 support。将需要监控的项目前面注释去掉,*.servers的配置为 239.2.11.71:8649,这个地址是Ganglia的广播地址,是固定的。

# for Ganglia 3.1 support
*.sink.ganglia.class=org.apache.hadoop.metrics2.sink.ganglia.GangliaSink31

*.sink.ganglia.period=10

# default for supportsparse is false
*.sink.ganglia.supportsparse=true

*.sink.ganglia.slope=jvm.metrics.gcCount=zero,jvm.metrics.memHeapUsedM=both
*.sink.ganglia.dmax=jvm.metrics.threadsBlocked=70,jvm.metrics.memHeapUsedM=40

namenode.sink.ganglia.servers=239.2.11.71:8649

datanode.sink.ganglia.servers=239.2.11.71:8649

jobtracker.sink.ganglia.servers=239.2.11.71:8649

tasktracker.sink.ganglia.servers=239.2.11.71:8649

maptask.sink.ganglia.servers=239.2.11.71:8649

reducetask.sink.ganglia.servers=239.2.11.71:8649
分享到:
评论

相关推荐

    (转经修改)ganglia监控HADOOP 2.2

    《Ganglia监控Hadoop 2.2详解》 Ganglia是一款开源的分布式监控系统,广泛用于监控大型计算集群的资源使用情况,包括CPU、内存、网络等关键指标。在Hadoop这样的大数据处理框架中,Ganglia的集成显得尤为重要,因为...

    ganglia+hadoop+hbase nagios 学习参考链接

    文档"ganglia安装和监控Hadoop.doc"应该包含了详细的步骤指导,如安装Ganglia组件,配置Ganglia以监控Hadoop集群,以及如何将Nagios与Ganglia集成。在实际操作中,你可能需要配置Ganglia的监控项以覆盖Hadoop的关键...

    大数据技术分享 Hadoop集群监控与Hive高可用方案 共17页.pdf

    2. Ganglia监控方案 Ganglia是一个分布式监控系统,能够对Hadoop集群进行实时监控。Ganglia的优点是可以对集群总体状况和负载进行汇总,采用多播地址降低带宽占用,TCP采集数据稳定。缺点是配置稍复杂,需安装...

    大数据平台监控Ganglia加Nagios

    Ganglia 是一款分布式监控系统,它能够收集、聚合并可视化大量计算节点(如Hadoop集群)的性能数据。Ganglia的核心组件包括gmond(监控代理)和gmetad(数据聚合器)。gmond运行在每个监控节点上,收集诸如CPU使用率...

    搭建hadoop集群的全部配置文件

    在搭建Hadoop集群的过程中,配置文件起着至关重要的作用,它们定义了集群的运行方式、节点间通信方式以及数据存储和处理的策略。本压缩包包含的文件是全面的Hadoop集群配置集合,旨在帮助用户顺利构建和管理自己的...

    Hadoop集群监控与Hive高可用.pdf

    2. Ganglia监控工具 Ganglia是一种基于TCP协议的监控工具,具有集群总体状况和负载汇总、采用多播地址降低带宽占用、hadoop原生支持ganglia数据采集等优点。但是,配置稍复杂,需安装客户端,单台数据不如Cacti详细...

    安装hadoop集群

    ### Hadoop集群安装与配置详解 #### 一、引言 随着互联网技术的快速发展和企业数据量的激增,高效处理大规模数据的需求日益迫切。Hadoop作为一种开源的大数据处理框架,因其优秀的分布式处理能力和可扩展性,成为...

    Hadoop集群高可用与性能优化

    4. **监控与日志**:安装监控工具(如Ganglia、Ambari)和日志收集系统(如Flume、Logstash),实时了解集群状态,快速定位问题。 总结,Hadoop集群的高可用性和性能优化是一个持续的过程,需要综合考虑硬件配置、...

    Hadoop集群搭建总结

    - **监控与日志管理**:使用工具如Ganglia、Nagios监控集群健康状况,定期检查日志文件以预防潜在问题。 - **数据备份与恢复**:制定合理的数据备份策略,以便在出现故障时能够快速恢复服务。 #### 五、结论 ...

    Hadoop集群监控与Hive高可用.rar

    1. **监控指标**:监控Hadoop集群涉及跟踪各种关键性能指标,如节点状态、磁盘利用率、内存使用率、CPU负载、网络带宽和数据传输速率等。这些指标有助于识别潜在的瓶颈和故障点。 2. **监控工具**:Zabbix、Ganglia...

    ganglia集群监控(包+部署说明)

    1. **Gmond (Ganglia Monitoring Daemon)**:这是Ganglia的节点代理程序,它运行在每一个被监控的主机上,收集诸如CPU使用率、内存使用、磁盘I/O、网络流量等系统指标,并将这些数据发送到Ganglia集群中的其他节点或...

    EasyHdoop应用开发第二次聚会

    - **Ganglia实战应用**:具体演示了如何使用Ganglia监控Hadoop集群的状态。这包括安装配置过程、常用监控指标设置及数据分析方法等。 ### Hive+MapReduce编程实践 - **Hive+MapReduce编程**:结合使用Hive进行数据...

    Hadoop集群监控与Hive高可用-向磊.pdf

    例如,针对Hadoop集群,可以通过增加磁盘IO、内存详情、单个内核使用率、CPU总和及IOWait等模板,以便更全面地监控集群的状态。 - **Cacti的优点**: - 监控每台服务器的详细数据,如磁盘使用率、CPU利用率等。 - ...

    \"Hadoop集群监控与Hive高可用\"分享总结

    常用的Hadoop集群监控工具有Ambari、Ganglia、Nagios等,它们提供可视化界面,方便管理员实时查看和管理集群。 接下来,我们讨论Hive的高可用性。Hive是一个基于Hadoop的数据仓库工具,用于结构化和半结构化数据的...

    Hadoop搭建实验报告

    NULL 博文链接:https://daxiangwanju.iteye.com/blog/1962175

    机房hadoop集群部署

    8. **监控与日志管理**:安装监控工具(如Nagios、Ganglia)来监控集群的性能和健康状况。同时,配置日志收集和分析系统(如Fluentd、Logstash)以方便问题排查。 9. **资源调度优化**:YARN作为Hadoop的资源调度器...

    Hadoop集群搭建共10页.pdf.zip

    【标题】:Hadoop集群搭建 Hadoop是一个开源的分布式计算框架,由Apache软件基金会维护。它设计用于处理和存储海量数据,通过分布式文件系统(HDFS)和MapReduce编程模型实现。本资料"共10页.pdf"将详细介绍如何...

Global site tag (gtag.js) - Google Analytics