0 环境
操作系统:CentOS 6.2
hadoop版本:hadoop-1.0.1
集群中三台机器:
192.168.137.101 namenode
192.168.137.103 datanode1
192.168.137.104 datanode2
1 安装Ganglia
1.1 添加EPEL软件仓库
CentOS官方软件仓库中没有Ganglia,而Ganglia依赖又太多,本人花了一天时间才把它的一个依赖项rrdtool安装好。后来放弃源码安装,改用yum。添加仓库的方法参考:http://www.linuxidc.com/Linux/2012-05/61350.htm 。需要注意的是,EPEL安装包的地址已经发生了变化,链接中的下载地址已经不适用,可以google一下最新的地址。还要注意匹配操作系统的版本。
1.2 Ganglia服务器端安装
Ganglia服务器端收集监控端信息,并提供访问接口,使用以下命令安装:
yum install ganglia ganglia-devel ganglia-gmetad ganglia-gmond ganglia-web ganglia-gmond-python
1.3 Ganglia客户端安装
$ yum install ganglia ganglia-gmond
2 配置Ganglia
2.1 监控端配置
$ vim /etc/ganglia/gmond.conf
将cluster选项中 name设置为gmetad中data_source指定的名称即可。
$ service gmond start
2.2 服务器端
$ sudo vim /etc/ganglia/gmetad.conf
data_source "hdfs" datanode1 datanode2
只需要更改 data_source一行,"hdfs"代表集群的名字,datanode1,datanode2,就是要监控的机器列表。默认端口8649。
启动服务
service gmetad start
chkconfig gmetad on
2.3服务器端Apache配置
vim /etc/httpd/conf.d/ganglia.conf
Alias /ganglia /usr/share/ganglia
<Location /ganglia>
Order deny,allow
# Deny from all
# Allow from 127.0.0.1
# Allow from ::1
Allow from all
# Allow from .example.com
</Location>
可以使用命令setenforce 0来关闭selinux而不需要重启,刷新页面,即可访问!但此方法只是一权宜之计。要想永久修改selinux设置,还是要使用第一种方法。
3 配置Hadoop metrics
hadoop-1.0.1的配置文件为: hadoop-1.0.1/conf/hadoop-metrics2.properties。我安装的Ganglia为版本为3.1,找到配置文件中for Ganglia 3.1 support。将需要监控的项目前面注释去掉,*.servers的配置为 239.2.11.71:8649,这个地址是Ganglia的广播地址,是固定的。
# for Ganglia 3.1 support
*.sink.ganglia.class=org.apache.hadoop.metrics2.sink.ganglia.GangliaSink31
*.sink.ganglia.period=10
# default for supportsparse is false
*.sink.ganglia.supportsparse=true
*.sink.ganglia.slope=jvm.metrics.gcCount=zero,jvm.metrics.memHeapUsedM=both
*.sink.ganglia.dmax=jvm.metrics.threadsBlocked=70,jvm.metrics.memHeapUsedM=40
namenode.sink.ganglia.servers=239.2.11.71:8649
datanode.sink.ganglia.servers=239.2.11.71:8649
jobtracker.sink.ganglia.servers=239.2.11.71:8649
tasktracker.sink.ganglia.servers=239.2.11.71:8649
maptask.sink.ganglia.servers=239.2.11.71:8649
reducetask.sink.ganglia.servers=239.2.11.71:8649
相关推荐
《Ganglia监控Hadoop 2.2详解》 Ganglia是一款开源的分布式监控系统,广泛用于监控大型计算集群的资源使用情况,包括CPU、内存、网络等关键指标。在Hadoop这样的大数据处理框架中,Ganglia的集成显得尤为重要,因为...
文档"ganglia安装和监控Hadoop.doc"应该包含了详细的步骤指导,如安装Ganglia组件,配置Ganglia以监控Hadoop集群,以及如何将Nagios与Ganglia集成。在实际操作中,你可能需要配置Ganglia的监控项以覆盖Hadoop的关键...
2. Ganglia监控方案 Ganglia是一个分布式监控系统,能够对Hadoop集群进行实时监控。Ganglia的优点是可以对集群总体状况和负载进行汇总,采用多播地址降低带宽占用,TCP采集数据稳定。缺点是配置稍复杂,需安装...
Ganglia 是一款分布式监控系统,它能够收集、聚合并可视化大量计算节点(如Hadoop集群)的性能数据。Ganglia的核心组件包括gmond(监控代理)和gmetad(数据聚合器)。gmond运行在每个监控节点上,收集诸如CPU使用率...
在搭建Hadoop集群的过程中,配置文件起着至关重要的作用,它们定义了集群的运行方式、节点间通信方式以及数据存储和处理的策略。本压缩包包含的文件是全面的Hadoop集群配置集合,旨在帮助用户顺利构建和管理自己的...
2. Ganglia监控工具 Ganglia是一种基于TCP协议的监控工具,具有集群总体状况和负载汇总、采用多播地址降低带宽占用、hadoop原生支持ganglia数据采集等优点。但是,配置稍复杂,需安装客户端,单台数据不如Cacti详细...
### Hadoop集群安装与配置详解 #### 一、引言 随着互联网技术的快速发展和企业数据量的激增,高效处理大规模数据的需求日益迫切。Hadoop作为一种开源的大数据处理框架,因其优秀的分布式处理能力和可扩展性,成为...
4. **监控与日志**:安装监控工具(如Ganglia、Ambari)和日志收集系统(如Flume、Logstash),实时了解集群状态,快速定位问题。 总结,Hadoop集群的高可用性和性能优化是一个持续的过程,需要综合考虑硬件配置、...
- **监控与日志管理**:使用工具如Ganglia、Nagios监控集群健康状况,定期检查日志文件以预防潜在问题。 - **数据备份与恢复**:制定合理的数据备份策略,以便在出现故障时能够快速恢复服务。 #### 五、结论 ...
1. **监控指标**:监控Hadoop集群涉及跟踪各种关键性能指标,如节点状态、磁盘利用率、内存使用率、CPU负载、网络带宽和数据传输速率等。这些指标有助于识别潜在的瓶颈和故障点。 2. **监控工具**:Zabbix、Ganglia...
1. **Gmond (Ganglia Monitoring Daemon)**:这是Ganglia的节点代理程序,它运行在每一个被监控的主机上,收集诸如CPU使用率、内存使用、磁盘I/O、网络流量等系统指标,并将这些数据发送到Ganglia集群中的其他节点或...
- **Ganglia实战应用**:具体演示了如何使用Ganglia监控Hadoop集群的状态。这包括安装配置过程、常用监控指标设置及数据分析方法等。 ### Hive+MapReduce编程实践 - **Hive+MapReduce编程**:结合使用Hive进行数据...
例如,针对Hadoop集群,可以通过增加磁盘IO、内存详情、单个内核使用率、CPU总和及IOWait等模板,以便更全面地监控集群的状态。 - **Cacti的优点**: - 监控每台服务器的详细数据,如磁盘使用率、CPU利用率等。 - ...
常用的Hadoop集群监控工具有Ambari、Ganglia、Nagios等,它们提供可视化界面,方便管理员实时查看和管理集群。 接下来,我们讨论Hive的高可用性。Hive是一个基于Hadoop的数据仓库工具,用于结构化和半结构化数据的...
NULL 博文链接:https://daxiangwanju.iteye.com/blog/1962175
8. **监控与日志管理**:安装监控工具(如Nagios、Ganglia)来监控集群的性能和健康状况。同时,配置日志收集和分析系统(如Fluentd、Logstash)以方便问题排查。 9. **资源调度优化**:YARN作为Hadoop的资源调度器...
【标题】:Hadoop集群搭建 Hadoop是一个开源的分布式计算框架,由Apache软件基金会维护。它设计用于处理和存储海量数据,通过分布式文件系统(HDFS)和MapReduce编程模型实现。本资料"共10页.pdf"将详细介绍如何...