快速了解Hadoop架构

hyneng

浏览: 252856 次
性别:
来自: 深圳

最近访客更多访客>>

ff100zjl

fhtwins

林新育

晴天pan

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

hadoop

hadoop

Hadoop是一个能够对大量数据进行分布式处理的软件框架, Hadoop实现了一个分布式文件系统（Hadoop Distributed File System），简称HDFS。hadoop的集群是基于master/slave模式

运行在master上的：NameNode Secondary NameNode JobTracker

运行在slave上的：DataNode TaskTracker

1、NameNode是HDFS的守护程序，负责记录文件是如何分割成数据块的，以及这些数据块分别被存到那些数据节点上，只要功能是对内存及I/O进行集中管理（是个单点，发生故障将使集群崩溃）

2、DataNode这个后台程序负责把HDFS数据块读写到本地的文件系统，当客户端要读写某个数据时候，先由NameNode告诉客户端去哪个DataNode进行具体的读/写操作，然后客户端直接与这个DataNode服务器上的后台程序进行通讯，并且对相关的数据块进行读/写操作。

3、SecondaryNameNode：是一个用来监控HDFS状态的辅助后台程序，就像NameNode一样，每个集群都有一个Secondary NameNode，不接收或记录任何任何实时的数据变化，但是，他会与NameNode进行通信，以便定期的保存HDFS元数据的快照，如果Name发生问题，SecondaryNameNode可以及时的作为备用NameNode。

4、JobTracker：用来连接应用程序与Hadoop，用户代码提交到集群以后，由JobTracker决定那个文件将被处理，并且为不同的task分配节点，同时，他还监控所有运行的task一旦某个task失败了JobTacker就会自动重新开启task。每个集群只有唯一一个JobTracker，位于Master节点

5、TaskTracker：与负责存储的DataNode结合，JobTracker负责分配Tasker，管理各自节点上的task。每个节点只有一个TaskTracker，但一个TaskTracker可以启动多个JVM，用于并行执行map或reduce任务

本文链接：快速了解Hadoop架构，本文由领悟书生原创，转载请注明出处http://www.656463.com/article/376

分享到：

这样的面试题，你能回答几个 | hadoop简介

2013-02-25 22:40
浏览 3883
评论(1)
论坛回复 / 浏览 (0 / 2283)
分类:数据库
查看更多

1 楼 kiansoung 2016-08-17

在Slave机器需不需开SecondaryNameNode程序，我看别人的Slave中有SecondaryNameNode程序，但并不是全部的Slave机器都有，能问一下这是为什么？？？

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论