Apache Ambari是对Hadoop进行监控、管理和生命周期管理的基于网页的开源项目。它也是一个为Hortonworks数据平台选择管理组建的项目。Ambari支持管理的服务有:
Apache HBase
Apache HCatalog
Apache Hadoop HDFS
Apache Hive
Apache Hadoop MapReduce
Apache Oozie
Apache Pig
Apache Sqoop
Apache Templeton
Apache Zookeeper
ambari可以使安装hadoop集群,管理hadoop集群服务,监控集群都很容易。目前ambari支持的操作系统为rhel/centos 5、rhel/centos6 。
安装步骤为
1. 首先需要使用svn客户端获取ambari的源码
$ svn checkout http://svn.apache.org/repos/asf/incubator/ambari/trunk ambari
2. 对ambari源码进行打包编译
$ yum install rpm-build $ cd hmc/package/rpm $ ./create_hmc_rpm.sh $ cd mon_dashboard/package/rpm $ ./create_dashboard_rpm.sh如果编译成功的话,将会生成下面的rpm文件
1) hmc/package/rpm/build/rpmbuild/RPMS/noarch/ambari-1.0.0-1.noarch.rpm
2) hmc/package/rpm/build/rpmbuild/RPMS/noarch/ambari-agent-1.0.0-1.noarch.rpm
3) mon_dashboard/package/rpm/build/rpmbuild/RPMS/noarch/hdp_mon_dashboard-0.0.1-2.noarch.rpm
3. 安装ambari前需要做的步骤
将需要安装的hadoop集群按照namenode,datanode进行划分,namenode节点作为ambari master节点,其他节点作为ambari slave。
设置namenode节点到其他节点的无密码登陆的ssh设置。
将各个节点的防火墙停止 service iptables stop
4. 开始安装ambari
因为ambari需要依赖模块puppet ruby php apache等,所以需要先使用yum源安装这些组件
在每个节点设置系统yum源
$ sudo rpm -Uvh http://dl.fedoraproject.org/pub/epel/5/x86_64/epel-release-5-4.noarch.rpm OR $ sudo rpm -Uvh http://dl.fedoraproject.org/pub/epel/5/i386/epel-release-5-4.noarch.rpm $ sudo rpm -Uvh http://passenger.stealthymonkeys.com/rhel/5/passenger-release.noarch.rpm
在ambari master主节点中安装puppet php等模块
$ sudo yum install php-pecl-json # version 1.2.1 compatible with php-5.1 or php-5.2 $ sudo yum install php-pdo
检测是否安装posix $ php -m | grep posix如果没有找到posix模块,使用
$ sudo yum install php-process安装即可。
$ sudo yum install pdsh $ sudo yum install httpd-devel $ sudo yum install mod_passenger $ sudo yum install puppet-2.7.9 $ sudo yum install ruby-devel上面的模块都安装完成后,在ambari master节点安装
$ sudo rpm -iv ambari-1.0.0-1.noarch.rpm $ sudo rpm -iv hdp_mon_dashboard-0.0.1-2.noarch.rpm在其他的slave节点安装
$ sudo rpm -Uvh ambari-agent-1.0.0-1.noarch.rpm
因为hadoop需要jdk环境运行,所以需要到 http://www.oracle.com/technetwork/java/javase/downloads/jdk-6u26-download-400750.html 下载
1) jdk-6u26-linux-x64.bin
2) jdk-6u26-linux-i586.bin
安装包,然后放到 /var/run/hmc/downloads/文件夹中4. 启动ambari server开始安装集群
在ambari master主节点启动ambari server 服务
service ambari start然后在浏览器中打开
http://AMBARIMASTER/hmc/html/ 地址开始安装hadoop 集群
安装集群需要ambari master 节点中root 用户的SSH Private Key File ,路径在/root/.ssh/id_rsa
然后将所需要安装的slaves 节点所有hostname 每行一个进行分割存为文件
在页面中都选择好文件后,即可进行安装,在安装服务的过程中需要等一段时间,因为所需要的hadoop 都是通过yum 进行下载安装。
等安装成功后,即可对集群进行管理,监控了。
参考 http://incubator.apache.org/ambari/install.html
相关推荐
Ambari是Apache开源项目,由Hortonworks公司贡献,专为简化Hadoop集群的部署、管理和监控而设计。在大数据领域,Hadoop生态圈包含了众多组件,如HDFS(分布式文件系统)、MapReduce(分布式计算框架)、HBase(NoSQL...
Apache Ambari 是一个开源平台,用于 provision、管理和监控 Hadoop 集群。Apache Ambari 2.4 版本中引入了许多新的特性,如 Log Search、Zeppelin、Hive LLAP 等服务,Role-Based Access Control、Management Packs...
Ambari 安装及搭建 Hadoop 大数据集群 Ambari 是一个基于 Apache 的...使用 Ambari 安装和搭建 Hadoop 大数据集群可以简化 Hadoop 集群的管理和监控工作。但是,这需要仔细规划和实施,以确保集群的稳定和高效运行。
Apache Ambari 是一款强大的开源工具,专门设计用于...总之,Apache Ambari是Hadoop集群管理的重要工具,通过其组件间的协同工作,实现了高效、便捷的集群管理,降低了运维复杂性,确保了Hadoop生态系统的稳定运行。
Ambari是一款由Apache软件基金会开发的大数据管理工具,它提供了直观的Web界面,用于部署、管理和监控Hadoop集群。在本场景中,我们将详细讨论如何安装Ambari 2.7.3版本,以及与之相关的HDP 3.1安装过程。 首先,...
2. **监控工具**:Zabbix、Ganglia、Ambari和Nagios是常用的Hadoop集群监控工具。它们能实时显示集群的健康状况,并提供警报机制以在出现问题时及时通知管理员。 3. **日志分析**:通过收集和分析Hadoop的日志文件...
常用的Hadoop集群监控工具有Ambari、Ganglia、Nagios等,它们提供可视化界面,方便管理员实时查看和管理集群。 接下来,我们讨论Hive的高可用性。Hive是一个基于Hadoop的数据仓库工具,用于结构化和半结构化数据的...
Ambari是由Apache软件基金会开发的一款开源工具,它提供了用户友好的Web界面,使得Hadoop集群的安装、配置、监控以及故障排查变得更加简单。本手册涵盖的范围广泛,包括Ambari的基础知识、安装过程、升级策略、管理...
Apache Ambari 是一个由 Apache Software Foundation (ASF) 维护的开源项目,主要用于简化 Hadoop 集群的部署、管理和监控。它的核心特性在于提供了一个用户友好的 Web 界面,使得非技术背景的用户也能轻松管理 ...
通过Ambari搭建Hadoop集群环境,用户能够轻松完成从节点安装到集群监控的全过程,这大幅降低了Hadoop集群运维的技术门槛。 在开始搭建之前,我们首先需要确保满足系统最低需求。这不仅包括了操作系统的兼容性,还有...
12. **监控与维护**:使用Hadoop自带的Web UI或者第三方工具,如Ambari,对集群进行实时监控,确保其健康运行,及时发现和解决问题。 以上内容是Hadoop集群搭建的基础步骤和关键知识点,具体的实施过程中可能需要...
Ambari 是一个基于 Apache 的开源集群管理平台,能够帮助用户快速部署、管理和监控 Hadoop 集群。下面是根据给定文件信息生成的相关知识点: Apache Ambari 概述 Apache Ambari 是一个基于 Apache 的开源集群管理...
"Hadoop集群自动安装"是指通过自动化脚本或工具来快速部署和配置Hadoop环境,从而节省手动安装过程中所需的时间和精力。这样的自动化过程对于大规模的Hadoop集群尤其重要,因为它能确保一致性,减少人为错误,并提高...
本文将依次介绍搭建过程中的关键步骤,包括环境准备、数据库搭建、Ambari安装及Hadoop集群的配置等。 #### 二、环境准备 1. **操作系统**:确保所有节点均安装了Centos7.2版本。 2. **硬件配置**:推荐配置至少...
在当今的大数据时代,Hadoop作为处理海量数据的分布式平台,越来越多地被应用于各种业务场景中。...随着技术的不断发展和优化,ELK在Hadoop集群监控领域的应用将会越来越广泛,成为大数据时代运维管理不可或缺的工具。
摘要: Apache Ambari 是一个基于Web的管理工具,用于监控和管理大规模的分布式系统,如Hadoop集群。Ambari从集群节点和服务收集了大量的信息,并把它们表现为容易使用的,集中化的接口:Ambari Web。通过Ambari Web...
腾讯可能会采用Ambari等工具来监控Hadoop集群的健康状态,及时发现并解决问题。Zookeeper则用于协调集群中的各个组件,保证系统的高可用性。对于故障节点,可能有自动化的故障检测和数据恢复机制。 在安全性方面,...
2. Apache Ambari:一个开源的Hadoop集群管理平台。 3. Apache HBase:一个开源的分布式NoSQL数据库。 4. Apache YARN:一个开源的资源管理和调度平台。 5. Apache Spark:一个开源的数据处理和分析平台。 ...