`
cfyme
  • 浏览: 275073 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

Hadoop项目简介

 
阅读更多

Apache Hadoop项目简介 

 

Core---- 一系列分布式文件系统和通用I/O的组件和接口(序列化、Java RPC和持久化数据结构)

Avro---- 一种提供高效、跨语言PRC的数据序列化系统,持久化数据存储。

MapReduce----分布式数据处理模式和执行环境,运行于大型商用机集群;

HDFS----分布式文件系统,运行于大型商用机集群;

ZooKeeper----一个分布式的、高可用性的协调服务;

Pig---- 一种数据流语言和运行环境,用以检索非常大的数据集,运行在MapReduce和HDFS集群上;

Chukwa------ 分布式数据收集和分析系统;

Hive--- 分布式数据仓库,Hive管理HDFS中存储的数据,并提供基于SQL的查询语言用以查询数据;

Hbase---- -一个分布式的、列存储数据库。HBase使用HDFS作为底层存储,同时支持MapReduce的批量式计算和点查询。

 

其中MapReduce和HDFS是Hadoop的核心

分享到:
评论

相关推荐

    HADOOP 相关项目简介

    ### Hadoop相关项目知识点 #### 一、Avro:数据序列化系统 **知识点概述**: Apache Avro 是一种数据序列化系统,主要用于处理结构化的数据格式,支持丰富的数据结构,提供紧凑高效的二进制数据格式,具备容器文件...

    Hadoop技术讲解.ppt

    **Hadoop项目简介** Hadoop 起源于Google的论文,包括Google的分布式文件系统(GFS)、分布式计算模型MapReduce以及分布式数据库BigTable。Hadoop 将这些概念实现为开源软件,旨在提供一种可扩展、容错性强的平台,...

    hadoop简介Word版

    Hadoop的概念源于2005年秋天,当时作为Lucene的子项目Nutch的一部分被引入,受到了Google Lab开发的MapReduce和Google File System (GFS)的启发。随后,MapReduce和Nutch Distributed File System (NDFS)在2006年3月...

    Hadoop技术-Hadoop架构简介.pptx

    HDFS(Hadoop Distributed File System)是Hadoop项目的核心组件,对海量数据进行存储与管理,实现将文件分布式存储在很多的服务器上。HDFS主要包括Name Node、Secondary Name Node和Data Node三个组件。Name Node...

    Hadoop技术讲解

    Hadoop项目简介 HDFS体系结构 HDFS关键运行机制 Hadoop VS.Google(分布式文件系统) Hadoop API Hadoop环境搭建

    基于hadoop的电影行业分析可视化源码+项目说明.zip

    简介本资源提供了一套基于Hadoop的电影行业分析可视化源码及项目说明,旨在通过大数据技术对电影行业相关数据进行深入分析和可视化展示。项目包括完整的源码、数据集以及详细的代码注释,非常适合学习Hadoop生态系统...

    eclipse hadoop2 插件

    Eclipse Hadoop2 插件是为开发人员提供的一种强大工具,它允许用户在Eclipse集成开发环境中(IDE)直接编写、调试和管理Hadoop项目。这个插件针对Hadoop 2.x版本进行了优化,提供了丰富的功能来简化Hadoop应用程序的...

    Hadoop组件简介共5页.pdf.zip

    这个压缩包文件“Hadoop组件简介共5页.pdf.zip”很可能包含了对Hadoop生态系统的基础介绍,特别是其核心组件。虽然“赚钱项目”这个子文件名可能与Hadoop无关,但我们可以专注于Hadoop的相关知识。 Hadoop的核心由...

    hadoop-eclipse-plugin

    Hadoop Eclipse Plugin是Apache Hadoop项目的一个重要组成部分,它为Eclipse IDE提供了集成开发环境的支持,使得Java开发者能够在Eclipse中直接对Hadoop项目进行创建、编辑和调试。这个压缩包包含了两个版本的Hadoop...

    hadoop-eclipse插件各版本合集

    Hadoop-Eclipse插件是Apache Hadoop项目与Eclipse IDE集成的一个重要工具,它使得Hadoop开发者能够在Eclipse环境中直接创建、编辑、调试和管理Hadoop MapReduce作业,极大地提升了开发效率。本合集包含了多个版本的...

    Hadoop学习总结

    **HDFS(Hadoop Distributed File System)简介** HDFS是Hadoop的核心组件之一,是一个高度容错性的分布式文件系统。它被设计成能在普通的硬件上运行,并能够处理大规模的数据集。HDFS遵循主从架构,由NameNode(主...

    hadoop-common-2.7.3-bin-master-windows

    Hadoop Common是Hadoop项目的核心部分,它包含了Hadoop运行所需的各种通用工具和库,为HDFS(Hadoop Distributed File System)和MapReduce提供了基础支持。在2.7.3版本中,Hadoop Common对稳定性和性能进行了优化,...

    hadoop ambari简介,为什么选择ambari

    ### Hadoop Ambari简介与选择理由 #### 一、Hadoop Ambari概述 Hadoop Ambari 是一个开源项目,由 Hortonworks 发起并维护,旨在为 Hadoop 集群提供易于使用的管理界面。它通过 Web UI 提供了一个直观的操作平台,...

    hadoop平台的搭建过程简介

    在Eclipse中配置Hadoop环境,需要将Hadoop的相关jar包配置到项目的构建路径中,并设置Hadoop的配置文件位置,以便可以运行MapReduce作业。 4. 集群检验:搭建完成Hadoop平台后,需要检验整个集群是否能正常运行。这...

    Hadoop云计算实验报告

    ### 一、Hadoop简介 Hadoop的核心组件包括HDFS(Hadoop Distributed File System)和MapReduce。HDFS为大数据提供高容错性的分布式存储,而MapReduce则提供了处理这些数据的并行计算模型。 ### 二、Hadoop环境配置...

    Hadoop入门学习文档

    - 2006年:Map-Reduce和NDFS被纳入Hadoop项目。 ##### 2.3 Hadoop发行版本 - **Apache版本**:最基础的版本,适合初学者学习。 - **Cloudera版本**:在大型互联网企业中较为流行,提供商业支持和服务。 - **...

    大数据之路选择Hadoop还是MaxCompute?Hadoop开源与MaxCompute对比材料

    Hadoop主要是一个开源项目,而MaxCompute则是阿里云提供的商业服务。因此,两者在服务方面存在显著差异: - **Hadoop**:用户需要自行搭建和维护Hadoop集群,包括硬件配置、软件安装、故障排查等。 - **MaxCompute**...

Global site tag (gtag.js) - Google Analytics