szjian

浏览: 75627 次
性别:
来自: 深圳

最近访客更多访客>>

leisureWong

iamjustlyl

run7428821

yinhong_sh

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

Hadoop 1.0 体系结构

博客分类：

HADOOP介绍

hadoop mapreduce

HDFS和MapReduce是Hadoop的两大核心。Hadoop的体系结构主要是通过HDFS来实现分布式存储的底层支持的，通过MapReduce来实现分布式并行任务处理的程序支持。

一、HDFS的体系结构。

HDFS采用了主从（Master/Slave）结构模型，一个HDFS集群是由一个NameNode和若干个DataNode组成的。其中:NameNode作为主服务器，管理文件系统的命名空间和客户端对文件的访问操作；DataNode管理存储的数据。

HDFS允许用户以文件的形式存储数据。从内部来看，文件被分成若干个数据块，而且这若干个数据块存放在一组DataNode上。

NameNode执行文件系统的命名空间操作，比如打开、关闭、重命名文件或目录等，它也负责数据块到具体DataNode的映射。

DataNode负责处理文件系统客户端的文件读写请求，并在NameNode的统一调度下进行数据块的创建、删除和复制工作。

二、MapReduce的体系结构。

MapReduce是一种并行编程模式，利用这种模式软件开发者可以轻松地编写出分布式并行程序。在Hadoop的体系结构中，MapReduce是一个简单易用的软件框架，基于它可以将任务分发到由上千台商用机器组成的集群上，并以一种可靠容错的方式并行处理大量的数据集，实现Hadoop的并行任务处理功能。

MapReduce框架是由一个单独运行在主节点的JobTracker和运行在每个集群从节点的TaskTracker共同组成的。

主节点负责调度构成一个作业的所有任务，这些任务分布在不同的从节点上。主节点监控它们的执行情况，并且重新执行之前失败的任务；

从节点仅负责由主节点指派的任务。当一个Job被提交时，JobTracker接收到提交作业和其配置信息之后，就会将配置信息等分发给从节点，同时调度任务并监控TaskTracker的执行。

从上面的介绍可以看出，HDFS和MapReduce共同组成了Hadoop分布式系统体系结构的核心。HDFS在集群上实现了分布式文件系统，MapReduce在集群上实现了分布式计算和任务处理。HDFS在MapReduce任务处理过程中提供了对文件操作和存储等的支持，MapReduce在HDFS的基础上实现了任务的分发、跟踪、执行等工作，并收集结果，二者相互作用，完成了Hadoop分布式集群的主要任务。

分享到：

用MapReduce操作mongodb与hdfs的读写例子 | Yarn基本组成结构

2014-02-11 14:23
浏览 1421
评论(0)
分类:互联网
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Hadoop 1.0 体系结构

一、HDFS的体系结构。

二、MapReduce的体系结构。

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Hadoop 1.0 体系结构

一、HDFS的体系结构。

二、MapReduce的体系结构。

评论

发表评论

相关推荐

HBase简介

Hadoop2.0- MapReduceV2(Yarn) 框架简介

Hadoop2.0-HA介绍

Hadoop1.0-MapReduce介绍

Hadoop1.0-HDFS介绍

最近访客更多访客>>