HDFS文件系统源码总结

younglibin

浏览: 1222089 次
性别:
来自: 北京

最近访客更多访客>>

u010277881

Asdpboy

yhtppp

java_dotar_01

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

hdfs

NameNode节点是就是HDFS的大脑。想了解HDFS文件系统，必须了解大脑结构。咱们就从NameNode节点开始。NameNode类中，关于HDFS文件系统的存储和管理都交给了FSNamesystem负责。下面介绍一下FSNamesystem的逻辑组成和类图。

FSNameSystem层次结构

INode: 它用来存放文件及目录的基本信息：名称，父节点、修改时间，访问时间以及UGI信息等。
INodeFile: 继承自INode，除INode信息外，还有组成这个文件的Blocks列表，重复因子，Block大小
INodeDirectory：继承自INode，此外还有一个INode列表来组成文件或目录树结构
Block(BlockInfo)：组成文件的物理存储，有BlockId，size ，以及时间戳
BlocksMap: 保存数据块到INode和DataNode的映射关系
FSDirectory：保存文件树结构，HDFS整个文件系统是通过FSDirectory来管理
FSImage：保存的是文件系统的目录树
FSEditlog: 文件树上的操作日志
FSNamesystem: HDFS文件系统管理

概念之间的层次关系：

FSNameSystem 主要类关系图

这个类图可以分成三个部分
Bock相关的部分(BlocksMap & BlockInof & Block)
INode相关的部分(INode & INodeDirectory & INodeFile & INodeDirectoryWithQuota)
FSImage & FSEditLog (Storage & StorageInfo)

其中
BlockInfo是Block的加强类，增加了INodeFile的引用和DataNode列表
INodeFirectoryWithQuota 是INodeDirectory的增强类，增加了Quota限制功能

从层次关系图和类图中，可以看出FSNamesystem中各数据结构之间的关系。了解FSNamesystem, 那么HDFS的文件系统就了解了90%。

一下为其他重要信息说明：

1.2.1、元数据节点文件夹结构

VERSION文件是java properties文件，保存了HDFS的版本号。

layoutVersion是一个负整数，保存了HDFS的持续化在硬盘上的数据结构的格式版本号。

namespaceID是文件系统的唯一标识符，是在文件系统初次格式化时生成的。

cTime此处为0

storageType表示此文件夹中保存的是元数据节点的数据结构。

namespaceID=1232737062

cTime=0

storageType=NAME_NODE

layoutVersion=-18