HDFS的基本概念

雨一直下

浏览: 49737 次
性别:
来自: 北京

最近访客更多访客>>

weicy7600

艾伦蓝

itnull

zhangly2011

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

hadoop

hdfs hadoop

1、数据块(block)

HDFS(Hadoop Distributed File System)默认的最基本的存储单位是64M的数据块。

和普通文件系统相同的是，HDFS中的文件是被分成64M一块的数据块存储的。

不同于普通文件系统的是，HDFS中，如果一个文件小于一个数据块的大小，并不占用整个数据块存储空间。

2、元数据节点(Namenode)和数据节点(datanode)

namenode用来管理文件系统的命名空间

其将所有的文件和文件夹的元数据保存在一个文件系统树中。

这些信息也会在硬盘上保存成以下文件：命名空间镜像(namespace image)及修改日志(edit log)

其还保存了一个文件包括哪些数据块，分布在哪些数据节点上。然而这些信息并不存储在硬盘上，而是在系统启动的时候从数据节点收集而成的。

datanode是文件系统中真正存储数据的地方。

客户端(client)或者元数据信息(namenode)可以向数据节点请求写入或者读出数据块。

其周期性的向元数据节点回报其存储的数据块信息。

从元数据节点(secondary namenode)

secondary namenode并不是元数据节点出现问题时候的备用节点，它和元数据节点负责不同的事情。

其主要功能就是周期性将namenode的namespace image和edit log合并，以防日志文件过大。

合并过后的namespace image也在从元数据节点保存了一份，以防namenode失败的时候，可以恢复。

2.1、namenode文件夹结构

${dfs.name.dir}/current/VERSION
                       /edits
                       /fsimage
                       /fstime

VERSION文件是java properties文件，保存了HDFS的版本号。

#Fri Dec 21 16:45:25 CST 2012
namespaceID=1555019963
cTime=0
storageType=NAME_NODE
layoutVersion=-32
layoutVersion是一个负整数，保存了HDFS的持久化在硬盘上的数据结构的格式版本号。

namespaceID是文件系统的唯一标识符，是在文件系统初次格式化时生成的。

cTime此处为0

storageType表示此文件夹中保存的是元数据节点的数据结构。

fsimage和edits：

当文件系统客户端(client)进行写操作时，首先把它记录在修改日志中(edit log)

元数据节点在内存中保存了文件系统的元数据信息。在记录了修改日志后，元数据节点则修改内存中的数据结构。

每次的写操作成功之前，修改日志都会同步(sync)到文件系统。

fsimage文件，也即命名空间映像文件，是内存中的元数据在硬盘上的checkpoint，它是一种序列化的格式，并不能够在硬盘上直接修改。

同数据的机制相似，当元数据节点失败时，则最新checkpoint的元数据信息从fsimage加载到内存中，然后逐一重新执行edit log中的操作。

2.2、secondary namenode的目录结构

${dfs.name.dir}/current/VERSION
                       /edits
                       /fsimage
                       /fstime
               /previous.checkpoint/VERSION
                       /edits
                       /fsimage
                       /fstime
secondary namenode就是用来帮助namenode将内存中的元数据信息checkpoint到硬盘上的。

checkpoint的过程如下：

secondary namenode通知namenode生成新的日志文件edits.new，以后的日志都写到新的日志文件中。

secondary namenode用http get从元数据节点获得fsimage文件及旧的日志文件。

secondary namenode将fsimage文件加载到内存中，并执行日志文件中的操作，然后生成新的fsimage文件。

secondary namenode将新的fsimage文件用http post传回namenode

namenode可以将旧的fsimage文件及旧的日志文件，换为新的fsimage文件和新的日志文件(第一步生成的)，然后更新fstime文件，写入此次checkpoint的时间。

这样namenode中的fsimage文件保存了最新的checkpoint的元数据信息，日志文件也重新开始，不会变的很大了。

2.3、datanode的目录结构

${dfs.name.dir}/current/VERSION
                       /blk_<id_1>
                       /blk_<id_1>.meta
                       /blk_<id_2>
                       /blk_<id_2>.meta
                       /...
                       /blk_<id_64>
                       /blk_<id_64>.meta
                       /subdir0/
                       /subdir1/
                       /...
                       /subdir63/

blk_<id>保存的是HDFS的数据块，其中保存了具体的二进制数据。

blk_<id>.meta保存的是数据块的属性信息：版本信息，类型信息，和checksum

subdirxx:当一个目录中的数据块到达一定数量的时候，则创建子文件夹来保存数据块及数据块属性信息。

数据节点的VERSION文件格式如下：

namespaceID=1232737062
storageID=DS-1640411682-127.0.1.1-50010-1254997319480
cTime=0
storageType=DATA_NODE
layoutVersion=-18

分享到：

Shell编程基础 | hadoop作业调优参数整理及原理(转)

2014-05-09 11:35
浏览 456
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论