整个Hadoop家族由以下几个子项目组成:
成员名
|
用途
|
Hadoop Common
|
Hadoop体系最底层的一个模块,为Hadoop各子项目提供各 种工具,如:配置文件和日志操作等。
|
Avro
|
Avro是doug cutting主持的RPC项目,有点类似Google的protobuf和Facebook的thrift。avro用来做以后hadoop的RPC,使hadoop的RPC模块通信速度更快、数据结构更紧凑。
|
Chukwa
|
Chukwa是基于Hadoop的大集群监控系统,由yahoo贡献。
|
HBase
|
基于Hadoop Distributed File System,是一个开源的,基于列存储模型的分布式数据库。
|
HDFS
|
分布式文件系统
|
Hive
|
hive类似CloudBase,也是基于hadoop分布式计算平台上的提供data warehouse的sql功能的一套软件。使得存储在hadoop里面的海量数据 的汇总,即席查询简单化。hive提供了一套QL的查询语言,以sql为基础,使用起来很方便。
|
MapReduce
|
实现了MapReduce编程框架
|
Pig
|
Pig是SQL-like语言,是在MapReduce上构建的一种高级查询语言,把一些运算编译进MapReduce模型的Map和Reduce中,并且用户可以定义自己的功能。Yahoo网格运算部门开发的又一个克隆Google的项目Sawzall。
|
ZooKeeper
|
Zookeeper是Google的Chubby一个开源的实现。它是一个针对大型分布式系统的可靠协调系统,提供的功能包括:配置维护、名字服务、 分布式同步、组服务等。ZooKeeper的目标就是封装好复杂易出错的关键服务,将简单易用的接口和性能高效、功能稳定的系统提供给用户。
|
分享到:
相关推荐
"Hadoop家族技能图谱.rar"这个压缩包文件,显然为我们提供了一个全面了解Hadoop生态系统的指导蓝图,包括了Hive和Mahout这两个重要的子项目。下面,我们将深入探讨这两个组件以及它们在Hadoop生态系统中的作用。 ...
hadoop家族各种中间件图谱,包含HBase、Hive、Pig、Sqoop、Hadoop、Zookeeper、Mahout、Hue等等
Hadoop包括介绍:Hadoop、Zookeeper、Avro、Chukwa、Ambari、Whirr、Bigtop、HCatalog、Hue、HBase、Pig、Sqoop、Cassandra、Hama、Flume、Giraph、Oozie、Crunch、Hive、Mahout。
详细介绍 Hadoop 家族中的 MapReduce 原理 MapReduce 是 Hadoop 家族中的核心组件之一,是一个分布式运算程序的编程框架。MapReduce 的核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式...
这是一个hadoop家族系列的描述图...主要是展示hadoop系列的各种软件以及软件组成
Hadoop家族技能树图谱,一图胜千言,一图胜万字,结构清晰明了,内容丰富多彩,条理简明扼要,所见即所得,简约而不简单。
Hadoop家族技能职业技能图谱,一图胜千言,一图胜万字,结构清晰明了,内容丰富多彩,条理简明扼要,所见即所得,简约而不简单,带您装逼带您飞。
hadoop技能图谱
Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, Cassandra, Hama, Whirr, ...
标题中的“Hadoop 06 Hadoop大家族”揭示了这是一份关于Hadoop生态系统的教程,重点关注Hadoop家族中的各个组件。这份32页的压缩包文件包含了一个PPTX文档,很可能是用于教学或培训,教授如何理解和操作Hadoop大数据...
3. **Hadoop生态系统**:介绍Hadoop家族中的其他重要组件,如HBase(分布式数据库)、Hive(数据仓库工具)、Pig(数据分析平台)、Zookeeper(协调服务)等,以及它们如何与Hadoop集成。 4. **YARN(Yet Another ...
4. **Hadoop生态工具**:Hadoop家族拥有众多相关工具,如Hive(数据仓库)、Pig(数据处理)、Spark(快速计算)、HBase(NoSQL数据库)等。掌握这些工具与Hadoop的集成,能实现更复杂的数据处理和分析任务。 5. **...
6. **Hadoop生态**:除了HDFS和MapReduce,Hadoop家族还包括许多其他组件,如HBase(分布式数据库)、Hive(数据仓库工具)、Pig(数据处理语言)、Oozie(工作流调度系统)等。这部分可能简述这些组件的作用和应用...
4. Hadoop生态:Hadoop家族还包括许多其他组件,如HBase(分布式NoSQL数据库)、Hive(基于Hadoop的数据仓库工具)、Pig(高级数据流语言)、ZooKeeper(分布式协调服务)等,它们共同构建了一个完整的数据分析生态...
5. **Hadoop生态系统的组件**:涵盖Hadoop家族中的其他重要工具,如HBase(分布式数据库)、Hive(数据仓库工具)、Pig(数据流处理)、Spark(快速数据处理框架)等,以及它们在大数据处理中的应用场景。...
10. Hadoop家族和其他相关技术:文档中提到了Hadoop家族(如Strom、Spark)以及Linux、Flume等技术的包,说明Hadoop通常与这些技术和工具一起使用以构建复杂的大数据处理平台。 11. 用户支持和社区:文档提供了51...