`

Hadoop HDFS详细知识学习(fsimage和editlog)

 
阅读更多
一、HDFS的基本概念
1.1、数据块(block)

HDFS(Hadoop Distributed File System)默认的最基本的存储单位是64M的数据块。
和普通文件系统相同的是,HDFS中的文件是被分成64M一块的数据块存储的。
不同于普通文件系统的是,HDFS中,如果一个文件小于一个数据块的大小,并不占用整个数据块存储空间。

1.2、元数据节点(Namenode)和数据节点(datanode)
元数据节点用来管理文件系统的命名空间
其将所有的文件和文件夹的元数据保存在一个文件系统树中。
这些信息也会在硬盘上保存成以下文件:命名空间镜像(namespace image)及修改日志(edit log)
其还保存了一个文件包括哪些数据块,分布在哪些数据节点上。然而这些信息并不存储在硬盘上,而是在系统启动的时候从数据节点收集而成的。

数据节点(datanode)是文件系统中真正存储数据的地方。

客户端(client)或者元数据信息(namenode)可以向数据节点请求写入或者读出数据块。
其周期性的向元数据节点回报其存储的数据块信息。
从元数据节点(secondary namenode)
从元数据节点并不是元数据节点出现问题时候的备用节点,它和元数据节点负责不同的事情。
其主要功能就是周期性将元数据节点的命名空间镜像文件和修改日志合并,以防日志文件过大。这点在下面会详细叙述。
合并过后的命名空间镜像文件也在从元数据节点保存了一份,以防元数据节点失败的时候,可以恢复。
1.2.1、元数据节点文件夹结构

fsimage是在磁盘

metadata是在内存



VERSION文件是java properties文件,保存了HDFS的版本号。
#layoutVersion是一个负整数,保存了HDFS的持续化在硬盘上的数据结构的格式版本号。
#namespaceID是文件系统的唯一标识符,是在文件系统初次格式化时生成的。
#cTime此处为0
#storageType表示此文件夹中保存的是元数据节点的数据结构。

namespaceID=1232737062

cTime=0

storageType=NAME_NODE

layoutVersion=-18


1.2.2、文件系统命名空间映像文件及修改日志

当文件系统客户端(client)进行写操作时,首先把它记录在修改日志中(edit log)
元数据节点在内存中保存了文件系统的元数据信息。在记录了修改日志后,元数据节点则修改内存中的数据结构。

每次的写操作成功之前,修改日志都会同步(sync)到文件系统。
fsimage文件,也即命名空间映像文件,是内存中的元数据在硬盘上的checkpoint,它是一种序列化的格式,并不能够在硬盘上直接修改。

同数据的机制相似,当元数据节点失败时,则最新checkpoint的元数据信息从fsimage加载到内存中,然后逐一重新执行修改日志中的操作。
从元数据节点就是用来帮助元数据节点将内存中的元数据信息checkpoint到硬盘上的

checkpoint的过程如下:
从元数据节点通知元数据节点生成新的日志文件,以后的日志都写到新的日志文件中。
从元数据节点用http get从元数据节点获得fsimage文件及旧的日志文件。
从元数据节点将fsimage文件加载到内存中,并执行日志文件中的操作,然后生成新的fsimage文件。
从元数据节点将新的fsimage文件用http post传回元数据节点
元数据节点可以将旧的fsimage文件及旧的日志文件,换为新的fsimage文件和新的日志文件(第一步生成的),然后更新fstime文件,写入此次checkpoint的时间。
这样元数据节点中的fsimage文件保存了最新的checkpoint的元数据信息,日志文件也重新开始,不会变的很大了。



元数据信息(fsimage + editslog),内存保存一份,磁盘保存一份,,,,,其他有个什么地方也要保存一份。

就如,学校图书馆里。书库,为了使得借书运转,要买多本书存库。

fsimage:元数据镜像文件,存储某一时段NameNode内存元数据信息。(文件目录树和文件数据块映射信息)

在hadoop1.*里,就是fsimage。

在hadoop2.*里,还加了后缀。

听说过镜像。  关闭时,将机器内存的信息写到磁盘,启动时,将磁盘的东西读取到内存。

edits:操作日志文件

比如说,上传一个文件或删除一个文件,这些操作。

fstime:保存最近一次checkpoint的时间     

比如说,在6月1号买的新电脑,在6月5日,做的第一次还原点,在6月18号,由于中病毒。在6月21号是做的第二次还原点。Checkpoint是保存最近的那次做还原点的数据。6月18-21日。

namenode始终在内存中保存metadata,用于处理“读请求”。到有“读请求”时,namenode会首先写editlog到磁盘,即向edits(操作日志文件)中写入日志,成功返回后,才会修改内存,并且向客户端返回。

形象化例子:我client提货员,向仓库管理员namenode,请求提货,在他同意同时,会将这情况写到editlog,先是将editlog写到磁盘,成功后,再写到内存。

1.2.3、从元数据节点的目录结构





1.2.4、数据节点的目录结构



数据节点的VERSION文件格式如下:

namespaceID=1232737062

storageID=DS-1640411682-127.0.1.1-50010-1254997319480

cTime=0

storageType=DATA_NODE

layoutVersion=-18


blk_<id>保存的是HDFS的数据块,其中保存了具体的二进制数据。
blk_<id>.meta保存的是数据块的属性信息:版本信息,类型信息,和checksum
当一个目录中的数据块到达一定数量的时候,则创建子文件夹来保存数据块及数据块属性信息。

二、数据流(data flow)
2.1 读文件的过程

客户端(client)用FileSystem的open()函数打开文件
DistributedFileSystem用RPC调用元数据节点,得到文件的数据块信息。
对于每一个数据块,元数据节点返回保存数据块的数据节点的地址。
DistributedFileSystem返回FSDataInputStream给客户端,用来读取数据。

客户端调用stream的read()函数开始读取数据。
DFSInputStream连接保存此文件第一个数据块的最近的数据节点。
Data从数据节点读到客户端(client)
当此数据块读取完毕时,DFSInputStream关闭和此数据节点的连接,然后连接此文件下一个数据块的最近的数据节点。
当客户端读取完毕数据的时候,调用FSDataInputStream的close函数。
在读取数据的过程中,如果客户端在与数据节点通信出现错误,则尝试连接包含此数据块的下一个数据节点。
失败的数据节点将被记录,以后不再连接。



2.2 写文件的过程

客户端调用create()来创建文件
DistributedFileSystem用RPC调用元数据节点,在文件系统的命名空间中创建一个新的文件。

元数据节点首先确定文件原来不存在,并且客户端有创建文件的权限,然后创建新文件。

DistributedFileSystem返回DFSOutputStream,客户端用于写数据。

客户端开始写入数据,DFSOutputStream将数据分成块,写入data queue。

Data queue由Data Streamer读取,并通知元数据节点分配数据节点,用来存储数据块(每块默认复制3块)。分配的数据节点放在一个pipeline里。

Data Streamer将数据块写入pipeline中的第一个数据节点。第一个数据节点将数据块发送给第二个数据节点。第二个数据节点将数据发送给第三个数据节点。
DFSOutputStream为发出去的数据块保存了ack queue,等待pipeline中的数据节点告知数据已经写入成功。

如果数据节点在写入的过程中失败:
关闭pipeline,将ack queue中的数据块放入data queue的开始。
当前的数据块在已经写入的数据节点中被元数据节点赋予新的标示,则错误节点重启后能够察觉其数据块是过时的,会被删除。
失败的数据节点从pipeline中移除,另外的数据块则写入pipeline中的另外两个数据节点。
元数据节点则被通知此数据块是复制块数不足,将来会再创建第三份备份。
当客户端结束写入数据,则调用stream的close函数。此操作将所有的数据块写入pipeline中的数据节点,并等待ack queue返回成功。最后通知元数据节点写入完毕。

转自:http://www.cnblogs.com/forfuture1978/archive/2010/03/14/1685351.html
  • 大小: 19.3 KB
  • 大小: 71.9 KB
  • 大小: 43.9 KB
  • 大小: 58 KB
  • 大小: 148.7 KB
  • 大小: 183.2 KB
分享到:
评论
发表评论

文章已被作者锁定,不允许评论。

相关推荐

    Hadoop(HDFS).docx

    - **Secondary NameNode**:负责定期合并FsImage和EditLog文件,减轻主NameNode的压力。 **启动过程**: 1. **初始化**:第一次启动时创建FsImage和EditLog文件;非首次启动时直接加载这两个文件至内存; 2. **...

    Hadoop技术-HDFS元数据.pptx

    HDFS元数据管理机制的主要组件包括Fsimage、Editlog和TransactionId三个部分,通过这些组件,HDFS元数据管理机制可以维护整个文件系统的结构和内容,提供给用户一个统一的文件视图,实现文件系统的高效存取和管理。...

    EditLog_src

    在IT行业中,EditLog是一个非常关键的术语,特别是在分布式存储系统,如Hadoop的HDFS(Hadoop Distributed File System)中。EditLog是HDFS元数据管理的重要组成部分,它记录了文件系统的更改日志,确保数据的一致性...

    hadoop-hdfs.pdf

    具体来说,它利用FsImage和EditLog来实现这一点。FsImage包含了整个文件系统元数据的快照,而EditLog则记录了自上次保存快照以来发生的变更。每当客户端进行写操作时,这些操作会被记录在EditLog中,随后在适当的...

    NameNode职责.pptx

    NameNode的职责是维护HDFS的命名空间和文件系统,包括维护fsImage文件和editLog文件。fsImage文件存储了HDFS的元信息,而editLog文件存储了HDFS的操作日志。了解NameNode的职责和fsImage、editLog文件的作用,对于...

    2大数据技术之Hadoop(HDFS文件系统).doc

    它维护两个关键的文件:`fsimage`(文件系统元数据的静态快照)和`editlog`(记录所有改变元数据的操作日志)。 2. **DataNode**:是HDFS的存储节点,存储实际的数据块。每个DataNode会定期向NameNode报告其存储的...

    Hadoop原理详细解析.pdf

    Secondary NameNode 不是备份,而是协助NameNode定期合并FsImage和EditLog,生成新的检查点,避免EditLog过大。这个过程中,Secondary NameNode获取FsImage和旧的EditLog,应用日志操作生成新的FsImage.ckpt,并将...

    Hadoop原理详细解析.doc

    为了防止EditLog过大影响系统重启速度,Secondary NameNode扮演了一个辅助角色,定期将FsImage和EditLog合并成一个新的FsImage checkpoint,同时生成新的EditLog,确保NameNode的高效运行。 在HDFS中,DataNodes是...

    Hadoop之hdfs架构详解共2页.pdf.zip

    7. **Secondary NameNode**:辅助NameNode,主要负责周期性合并NameNode的edit log和fsimage,以减少NameNode重启时的恢复时间。 8. **读写流程**:读取操作通常从最近的DataNode开始,写入操作则首先将数据写入一...

    大数据安全hadoop所用ppt

    HDFS通过周期性合并fsimage和editlog来保证数据一致性,并确保在故障恢复时能快速恢复状态。 4. **MapReduce**: MapReduce是Hadoop的主要计算模型,它将大任务分解为小的Map任务,再由Reduce任务汇总结果。Map...

    Hadoop分布式文件系统HDFS深入教程

    具体而言,Secondary NameNode定期从NameNode上下载fsimage和editlog文件,将它们合并成一个新的fsimage文件,再将其传回给NameNode。 #### 1.1 架构图示例 ``` graph TD N[NameNode] --&gt; D(DataNode) N --&gt; S...

    hadoop概述及介绍

    当 Namenode 启动时,会合并 FsImage 和 Editlog 并生成新的 FsImage,这个过程称为检查点。为了提高效率,未来版本的Hadoop将支持周期性的检查点。 总的来说,Hadoop 提供了一个高效、可靠的分布式计算平台,通过...

    Hadoop学习总结之一:HDFS简介

    元数据节点文件夹结构 gồm VERSION 文件、命名空间镜像文件(fsimage)和修改日志(edit log)。VERSION 文件是 java properties 文件,保存了 HDFS 的版本号。 文件系统命名空间映像文件及修改日志 当文件系统...

    Hadoop学习总结之二:HDFS读写过程解析.doc

    本文将详细解析HDFS的读取和写入过程,基于标题"《Hadoop学习总结之二:HDFS读写过程解析》"和描述中提到的代码分析。 1. **文件的打开** 当客户端想要打开一个HDFS文件时,它会调用`DistributedFileSystem.open`...

    基于hadoop的词频统计.docx

    NameNode 负责管理文件系统的元数据,包括 FsImage 和 EditLog,其中 FsImage 存储文件系统的状态,EditLog 记录所有对文件系统的修改操作。Secondary NameNode 作为辅助角色,定期创建检查点,合并 EditLog 和 ...

    Hadoop学习总结

    - **替换文件**: Namenode将旧的fsimage文件和edit log替换为新的fsimage文件和新的edit log。 **1.2.3 从元数据节点的目录结构** - **从元数据节点**: 包含用于辅助Namenode进行日志合并的文件。 **1.2.4 数据...

    Hadoop学习总结.doc

    ### Hadoop 学习总结 #### 一、HDFS简介 **1.1 数据块(Block)** ...通过对HDFS和MapReduce的学习,不仅可以了解如何存储和处理大规模数据,还可以进一步探索Hadoop生态系统中的其他组件和技术。

    Hadoop技术HDFS的组成架构共7页.pdf.zip

    - **编辑日志**:NameNode的所有元数据变更都会记录在编辑日志(Edit Log)中,用于在系统重启时恢复状态。 - **元数据文件**:FSEditLog和FSImage是NameNode的两个关键文件,FSEditLog记录更改,FSImage保存当前...

    hadoop日记2.1:hdfs设计思想和基础概念

    Namenode使用事务日志Editlog记录系统元数据的修改,如创建新文件、修改文件的副本设置等。 #### HDFS的体系结构特征 - **Namenode与Datanode的硬件要求**:两者均可以在普通的PC机上运行,操作系统通常是Linux。...

Global site tag (gtag.js) - Google Analytics