Hadoop集群的管控一直是一个热门的话题,对于这样的一个应用场景,很早就有人研究并且取得不错的成绩,这就是EasyHadoop。它的功能主要有集群安装,管理,监控等功能,国外的Ambari是Apache的顶级项目,现在是大数据新贵Hortonworks公司在推进的项目Ambari,这款软件具有集群自动化安装、中心化管理、集群监控、报警等功能,使得安装集群从几天的时间缩短在几小时以内,运维人员从数十人降低到几人以内,极大的提高集群管理的效率。
Ambari makes Hadoop management simpler by providing a consistent, secure platform for operational control. Ambari provides an intuitive Web UI as well as a robust REST API, which is particularly useful for automating cluster operations. With Ambari, Hadoop operators get the following core benefits:
Simplified Installation, Configuration and Management. Easily and efficiently create, manage and monitor clusters at scale. Takes the guesswork out of configuration with Smart Configs and Cluster Recommendations. Enables repeatable, automated cluster creation with Ambari Blueprints.
Centralized Security Setup. Reduce the complexity to administer and configure cluster security across the entire platform. Helps automate the setup and configuration of advanced cluster security capabilities such as Kerberos and Apache Ranger.
Full Visibility into Cluster Health. Ensure your cluster is healthy and available with a holistic approach to monitoring. Configures predefined alerts — based on operational best practices — for cluster monitoring. Captures and visualizes critical operational metrics — using Grafana — for analysis and troubleshooting. Integrated with Hortonworks SmartSense for proactive issue prevention and resolution.
Highly Extensible and Customizable. Fit Hadoop seamlessly into your enterprise environment. Highly extensible with Ambari Stacks for bringing custom services under management, and with Ambari Views for customizing the Ambari Web UI.
Ambari系统架构
Ambari-server内部架构
Ambari是Hadoop分布式集群配置管理工具,是由hortonworks主导的开源项目,它已经成为了apache基金会的开源项目,已经成为Hadoop运维系统中的得力助手。
Ambari充分利用了一些已有的优秀开源软件,巧妙地把它们结合起来,使其在分布式环境中做到了集群式服务管理能力、监控能力、展示能力,这些优秀的开源软件有:
(1)、agent端,采用了puppet管理节点。
(2)、在web端,采用ember.js作为前端MVC框架和NodeJS相关工具,用handlebars.js作为页面渲染引擎,在CSS/HTML方面还用了Bootstrap框架。
(3)、在Server端,采用了Jetty、Spring、JAX-RS等。
(4)、同时利用了Ganglia、Nagios的分布式监控能力。
Ambari框架采用的是Server/Client的模式,主要由两部分组成:ambari-agent和ambari-server。ambari依赖其它已经成熟的工具,例如:其ambari-server就依赖python,而ambari-agent还同时依赖ruby,puppet,fecter等工具,还有它也依赖一些监控工具nagios和ganglia用于监控集群状况。其中:
puppet是分布式集群配置管理工具,也是典型的Server/Client模式,能够集中式管理分布式集群的安装配置部署,主要语言是ruby。
facter是用Python写的一个节点资源采集库,用于采集节点的系统信息,例如OS信息,由于ambari-agent 主要是用Python写的,因此用facter可以很好的采集到节点信息。
Ambari-agent内部架构
Ambari-agent是一个无状态的,其功能分两部分:
采集所在节点的信息并且汇总发送心跳发送汇报给ambari-server。
处理ambari-server的执行请求。
因此它有两种队列:
(1)、消息队列Message Queue,或称为ResultQueue。包括节点状态信息(包括注册信息)和执行结果信息,并且汇总后通过心跳发送给ambari-server。
(2)、操作队列ActionQueue。用于接收ambari-server发送过来的状态操作,然后交给执行器调用puppet或Python脚本等模块执行任务。
相关推荐
大数据技术之Ambari
Apache Ambari是一种基于Web的工具,支持Apache Hadoop集群的供应、管理和监控。Ambari已支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、Pig、 Hbase、Zookeper、Sqoop和Hcatalog等
**大数据Ambari之flume集成编译好的源码包** Apache Ambari 是一个用于管理和监控Hadoop集群的开源工具,它提供了直观的Web界面和RESTful API,使得安装、配置、管理Hadoop生态系统变得更加简单。Flume是Apache的一...
Ambari搭建的详细说明文档,通过本地源搭建Ambari服务
现在都收费了,自行下载并保存到网盘确定可用
本文档主要介绍了使用 Ambari 搭建大数据平台的安装手册,对于大数据的安装和配置进行了详细的介绍。 大数据平台的基本概念: * 大数据是指无法在一定时间内用传统处理方式处理的巨量数据,包括结构化、非结构化和...
在本文档中,我们将详细介绍Ambari的大数据管理平台的安装和配置过程。 ### 1. 环境配置 在安装Ambari之前,我们需要配置Linux系统环境。首先,我们需要更改主机名,以免因为磁盘太小带来更多的麻烦。我们可以使用...
[大数据][HDP][Ambari][2.7.7]ambari-server-2.7.7.0-0.x86_64.rpm ambari的server端。 Apache Ambari 是一个用于配置、管理和监控 Apache Hadoop 集群的工具。Ambari 由一组 RESTful API 和一个基于浏览器的管理...
【大数据Ambari+HDP最优架构选型】是一个关于构建高效、稳定的大数据处理环境的议题,主要涉及Hadoop Distributed Platform (HDP)、Apache Ambari以及相关的组件和服务。Ambari是一个用于Hadoop集群管理和监控的开源...
本文档详细介绍了Ambari的基本概念、架构设计以及如何利用Ambari进行大数据组件的部署和自定义服务配置。 #### 二、Ambari的功能 Ambari的主要功能包括但不限于: 1. **组件部署**:能够自动安装和配置Hadoop生态...
Esri大数据平台搭建指南之Ambari1是易智瑞中国信息技术有限公司提供的一份详细教程,旨在帮助用户理解和构建基于Ambari的大数据处理环境。Esri,全称Environmental Systems Research Institute,是一家专注于地理...
Apache Ambari是一个开源项目,由Apache Software Foundation维护,它为Hadoop生态...通过Ambari,用户可以实现一键式安装和升级,监控性能指标,配置集群服务,以及处理日志等,极大地简化了大数据平台的操作和管理。
在本场景中,我们将详细讨论如何安装Ambari 2.7.3版本,以及与之相关的HDP 3.1安装过程。 首先,Ambari的安装始于设置用户仓库。在描述中提到了三个仓库: 1. HDP-3.1: 这是 Hortonworks Data Platform 的3.1版本...
【Ambari与大数据集群部署】 Apache Ambari 是一个开源工具,专门设计用于简化Hadoop和其他大数据组件的管理和部署。在这个详细的Ambari安装文档中,我们将深入理解如何在公司环境中设置大数据集群,首先从操作系统...
[大数据][HDP][Ambari][2.7.7]ambari-agent-2.7.7.0-0.x86_64.rpm Apache Ambari 是一个用于配置、管理和监控 Apache Hadoop 集群的工具。Ambari 由一组 RESTful API 和一个基于浏览器的管理界面组成。 ambari-...
Ambari 安装及搭建 Hadoop 大数据集群 Ambari 是一个基于 Apache 的开源项目,提供了一个简洁的 Web 界面来管理和监控 Hadoop 集群。下面是使用 Ambari 安装和搭建 Hadoop 大数据集群的详细步骤。 一、安装环境...
### Ambari部署大数据环境知识点概述 #### 一、Ambari简介 - **定义**:Ambari是一款开源的工具,主要用于简化Apache Hadoop集群的部署、管理和监控过程。 - **功能**:Ambari提供了图形化界面,使得用户能够更加...
ambari 搭建分布式的大数据平台,可对大数据平台进行集群管理
基于ambari安装大数据平台,已通过测试,按照文档步骤可以完成安装。
使用Ambari整合的各大数据组件版本(hadoop,spark,hbase,phoenix)等