`
landyer
  • 浏览: 141948 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

Hadoop家族

阅读更多

整个Hadoop家族由以下几个子项目组成:
成员名
用途
Hadoop Common
Hadoop体系最底层的一个模块,为Hadoop各子项目提供各 种工具,如:配置文件和日志操作等。
Avro
Avrodoug cutting主持的RPC项目,有点类似GoogleprotobufFacebookthriftavro用来做以后hadoopRPC,使hadoopRPC模块通信速度更快、数据结构更紧凑。
Chukwa
Chukwa是基于Hadoop的大集群监控系统,由yahoo贡献。
HBase
基于Hadoop Distributed File System,是一个开源的,基于列存储模型的分布式数据库。
HDFS
分布式文件系统
Hive
hive类似CloudBase,也是基于hadoop分布式计算平台上的提供data warehousesql功能的一套软件。使得存储在hadoop里面的海量数据 的汇总,即席查询简单化。hive提供了一套QL的查询语言,以sql为基础,使用起来很方便。
MapReduce
实现了MapReduce编程框架
Pig
PigSQL-like语言,是在MapReduce上构建的一种高级查询语言,把一些运算编译进MapReduce模型的MapReduce中,并且用户可以定义自己的功能。Yahoo网格运算部门开发的又一个克隆Google的项目Sawzall
ZooKeeper
ZookeeperGoogleChubby一个开源的实现。它是一个针对大型分布式系统的可靠协调系统,提供的功能包括:配置维护、名字服务、 分布式同步、组服务等。ZooKeeper的目标就是封装好复杂易出错的关键服务,将简单易用的接口和性能高效、功能稳定的系统提供给用户。


分享到:
评论

相关推荐

    Hadoop 家族技能图谱.rar

    "Hadoop家族技能图谱.rar"这个压缩包文件,显然为我们提供了一个全面了解Hadoop生态系统的指导蓝图,包括了Hive和Mahout这两个重要的子项目。下面,我们将深入探讨这两个组件以及它们在Hadoop生态系统中的作用。 ...

    hadoop家族各种中间件图谱

    hadoop家族各种中间件图谱,包含HBase、Hive、Pig、Sqoop、Hadoop、Zookeeper、Mahout、Hue等等

    Hadoop家族技能图谱

    Hadoop包括介绍:Hadoop、Zookeeper、Avro、Chukwa、Ambari、Whirr、Bigtop、HCatalog、Hue、HBase、Pig、Sqoop、Cassandra、Hama、Flume、Giraph、Oozie、Crunch、Hive、Mahout。

    详细介绍Hadoop家族中的MapReduce原理

    详细介绍 Hadoop 家族中的 MapReduce 原理 MapReduce 是 Hadoop 家族中的核心组件之一,是一个分布式运算程序的编程框架。MapReduce 的核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式...

    Hadoop家族技能图

    这是一个hadoop家族系列的描述图...主要是展示hadoop系列的各种软件以及软件组成

    Hadoop家族技能树图谱

    Hadoop家族技能树图谱,一图胜千言,一图胜万字,结构清晰明了,内容丰富多彩,条理简明扼要,所见即所得,简约而不简单。

    11-Hadoop家族技能职业技能图谱.jpg

    Hadoop家族技能职业技能图谱,一图胜千言,一图胜万字,结构清晰明了,内容丰富多彩,条理简明扼要,所见即所得,简约而不简单,带您装逼带您飞。

    Hadoop 家族技能图谱.jpg

    hadoop技能图谱

    Hadoop安装学习-入门教程

    Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, Cassandra, Hama, Whirr, ...

    完整版大数据云计算课程 Hadoop数据分析平台系列课程 Hadoop 06 Hadoop大家族 共32页.rar

    标题中的“Hadoop 06 Hadoop大家族”揭示了这是一份关于Hadoop生态系统的教程,重点关注Hadoop家族中的各个组件。这份32页的压缩包文件包含了一个PPTX文档,很可能是用于教学或培训,教授如何理解和操作Hadoop大数据...

    史上最全--HADOOP权威指南 第3版带目录书签 完整版

    3. **Hadoop生态系统**:介绍Hadoop家族中的其他重要组件,如HBase(分布式数据库)、Hive(数据仓库工具)、Pig(数据分析平台)、Zookeeper(协调服务)等,以及它们如何与Hadoop集成。 4. **YARN(Yet Another ...

    1Hadoop高级应用实战

    4. **Hadoop生态工具**:Hadoop家族拥有众多相关工具,如Hive(数据仓库)、Pig(数据处理)、Spark(快速计算)、HBase(NoSQL数据库)等。掌握这些工具与Hadoop的集成,能实现更复杂的数据处理和分析任务。 5. **...

    云计算第三版精品课程配套PPT课件含习题(30页)第6章 Hadoop 2.0 大家族(一).rar

    6. **Hadoop生态**:除了HDFS和MapReduce,Hadoop家族还包括许多其他组件,如HBase(分布式数据库)、Hive(数据仓库工具)、Pig(数据处理语言)、Oozie(工作流调度系统)等。这部分可能简述这些组件的作用和应用...

    《Hadoop权威指南》(第4版)中文+英文.pdf

    4. Hadoop生态:Hadoop家族还包括许多其他组件,如HBase(分布式NoSQL数据库)、Hive(基于Hadoop的数据仓库工具)、Pig(高级数据流语言)、ZooKeeper(分布式协调服务)等,它们共同构建了一个完整的数据分析生态...

    云计算第三版精品课程配套PPT课件含习题(31页)第6章 Hadoop 2.0 大家族(二).rar

    5. **Hadoop生态系统的组件**:涵盖Hadoop家族中的其他重要工具,如HBase(分布式数据库)、Hive(数据仓库工具)、Pig(数据流处理)、Spark(快速数据处理框架)等,以及它们在大数据处理中的应用场景。...

    hadoop2.5汇总:新特性、安装包、Eclipse插件、集群安装.pdf

    10. Hadoop家族和其他相关技术:文档中提到了Hadoop家族(如Strom、Spark)以及Linux、Flume等技术的包,说明Hadoop通常与这些技术和工具一起使用以构建复杂的大数据处理平台。 11. 用户支持和社区:文档提供了51...

Global site tag (gtag.js) - Google Analytics