配置Ganglia监控hadoop2.2与hbase0.96
OS: ubuntu12.04 LTS
ganglia版本3.1.7
Hadoop版本2.2.0
Hbase 0.96
1 Ganglia的架构
Ganglia有3部分组成
1. gmond
运行在每个节点上监视收集统计信息,同时可以收发统计信息,它可以运行在广播模式或单播模式
2. gmetad
从gmond以poll的方式收集和存储原数据
3. ganglia-web
跑在gmetad的机器上,访问gmetad存储的元数据并由apache web提供用户访问接口
2 安装Ganglia
2.1 Ganglia服务器端安装
Ganglia服务器端收集监控端信息,并提供访问接口,使用以下命令安装:
$ sudo apt-get install rrdtool apache2 php5 gmetad ganglia-monitor ganglia-webfrontend
2.2 Ganglia客户端安装
$ sudo apt-get install ganglia-monitor
3 配置Ganglia
说明:本文以组播的方式配置ganglia,单播方式没有配置成功。
3.1 服务器端
$ sudo vim /etc/ganglia/gmetad.conf
data_source "hadoop" ubuntu01 ubuntu02 ubuntu03
只需要更改 data_source一行,"hadoop"代表集群的名字,ubuntu01,ubuntu02,ubuntu03,就是要监控的机器列表。默认端口8649。
3.2 监控端配置
$ sudo vim /etc/ganglia/gmond.conf
将cluster选项中 name设置为gmetad.conf中data_source指定的名称即可(hadoop)。
3.3 安装新版本的ganglia-web(可选)
1、将 ganglia-web-3.5.12.tar.gz拷贝到gmetad的机器上。
下载地址:http://jaist.dl.sourceforge.net/project/ganglia/ganglia-web/3.5.12/ganglia-web-3.5.12.tar.gz
2、tar xvzf ganglia-web-3.5.12.tar.gz
3、cd ganglia-web-3.5.12
4、sudo make install
5、sudo rm –rf /var/www/ganglia
6、sudo ln -s /usr/share/ganglia-webfrontend /var/www/ganglia
4 启动服务
$sudo service gmetad start //启动server端
$ sudo service ganglia-monitor start //启动client端
5 配置hadoop hbase
sudo vi hadoop-metrics2.properties #其他都注释掉
*.sink.ganglia.class=org.apache.hadoop.metrics2.sink.ganglia.GangliaSink31 #以下配置根据主机实际部署的情况进行配置 |
sudo vi hadoop-metrics2-hbase.properties #其他都注释掉
*.sink.ganglia.class=org.apache.hadoop.metrics2.sink.ganglia.GangliaSink31 |
说明:
这里再说下server里的IP和端口,是从哪里获取的,就是从我刚才介绍的第二个文件里获取,网上很多资料在介绍的过程中,并没有说明这个,第二个内容截取部分内容如下:
udp_send_channel {
#bind_hostname = yes # Highly recommended, soon to be default.
# This option tells gmond to use a source address
# that resolves to the machine's hostname. Without
# this, the metrics may appear to come from any
# interface and the DNS names associated with
# those IPs will be used to create the RRDs.
mcast_join = 239.2.11.71
port = 8654
ttl = 1
}
6 启动 apache,重启hbase hadoop集群
检查一下/var/www/ganglia 目录下是否有ganglia目录,http://gmetadIP/ganglia
相关推荐
本文将详细讲解如何在Hadoop 2.2版本上配置和使用Ganglia进行监控。 首先,我们理解Ganglia的基本架构。Ganglia由三部分组成:数据采集器(gmond),数据聚合器(gmetad)以及Web前端(web UI)。gmond运行在每个...
文档"ganglia安装和监控Hadoop.doc"应该包含了详细的步骤指导,如安装Ganglia组件,配置Ganglia以监控Hadoop集群,以及如何将Nagios与Ganglia集成。在实际操作中,你可能需要配置Ganglia的监控项以覆盖Hadoop的关键...
4. **监控与调优**:使用HBase自带的监控工具或第三方工具(如Ganglia、Prometheus)监控系统性能,根据监控结果调整参数。 5. **数据压缩**:启用数据压缩可以减少存储空间,同时降低网络传输量,提高性能。HBase...
7. **安全与监控** - **安全设置**:启用Hadoop的安全模式,如Kerberos认证,保护集群数据安全。 - **监控工具**:利用如Ambari、Ganglia等工具监控集群的资源使用情况和运行状态。 8. **数据迁移与备份** - **...
Ganglia 是一款分布式监控系统,它能够收集、聚合并可视化大量计算节点(如Hadoop集群)的性能数据。Ganglia的核心组件包括gmond(监控代理)和gmetad(数据聚合器)。gmond运行在每个监控节点上,收集诸如CPU使用率...
最后,我们可以通过监控工具(如Ambari或Ganglia)观察Hadoop和HBase的运行状态,以及Snappy压缩效果,以便进一步优化性能。同时,持续关注Hadoop和HBase的新版本发布,适时进行升级以获取最新的功能和性能改进。 ...
为了配置HBase把指标信息输出到Ganglia,需要设置$HBASE_HOME/conf/目录下的hadoop-metrics.properties文件中的参数。 结论: 监控HBase集群对于确保系统的高可用性和性能非常重要。通过使用Java代码实现HBase集群...
【Ganglia监控系统在Linux集群上的配置及Solr监控】 Ganglia是一个开源的分布式监控系统,专门设计用于监控大型集群的计算资源,如CPU使用率、内存使用、网络流量等。它由三个主要组件构成:gmond、gmetad和ganglia...
【Ganglia监控系统在Linux集群上的配置及Solr监控】 Ganglia是一个开源的分布式监控系统,专门设计用于监控大型集群的计算性能,如CPU使用率、内存使用情况、网络带宽等。它适用于高性能计算环境(HPC),通过低...
标题中提到的知识点是“基于CentOs的ganglia监控配置”。首先,需要了解Ganglia是一个分布式监控系统,用于高性能计算系统(如集群和网格)的监控。它在大型环境中的性能和扩展性都非常出色。基于CentOs的配置说明...
Spark可以与Hadoop、HBase等存储系统集成,提供高效的计算能力。配置Spark集群,你需要编辑`spark-defaults.conf`,设定如主节点地址、内存分配、执行器数量等参数。如果是在YARN上运行,还需要配置`yarn-site.xml`...
与Cacti、Nagios、Zabbix等其他监控工具相比,Ganglia更专注于收集和跟踪度量数据,尤其适合用于集群的性能监控、分析和优化。它的优点包括但不限于: - **高效的性能数据收集**:Ganglia采用了多播通信机制,能够...
7. **配置与使用**:在Ganglia中集成RRDTool,需要正确配置Ganglia的配置文件,并确保RRDTool库和工具已经安装并可用。管理员还需要了解如何通过Ganglia Web界面查看和分析由RRDTool生成的图表。 8. **性能分析**:...
本文将详细介绍Ganglia系统状态监控软件的安装与配置步骤,以便读者能够快速上手并实施于实际的监控环境中。 ### Ganglia监控软件的核心组件 Ganglia监控软件由两大核心组件构成:Ganglia Monitoring Daemon ...
《Ganglia监控系统安装与配置详解》 Ganglia是一款开源的分布式监控系统,用于收集、聚合并展示网络中的各个节点(如服务器、虚拟机等)的性能数据。本篇将详细介绍Ganglia监控系统的安装步骤,以及相关组件的配置...
Ganglia是一款开源的分布式监控系统,用于集群和网格环境,可以实时监控网络中的各种性能数据,包括CPU使用率、内存使用情况、网络流量、磁盘I/O等。这款工具因其轻量级的设计和强大的数据聚合能力而在IT行业中受到...
name = "mycluster1" // 数据源名称必须与监控端gmeta文件中的名称一致 owner = "unspecified" latlong = "unspecified" url = "unspecified" } ``` - **UDP Send Channel设置**: 配置发送数据的UDP通道: `...