hadoop fsimage edits关系

chengjianxiaoxue

浏览: 1323860 次
性别:
来自: 北京

最近访客更多访客>>

liu_shui8

happy2012

nddht

yhtppp

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

hadoop1

fsimage = name table , 存放namonode中所有数据，运行时数据加载到内存中存放

edits_inprogress 类似于LSM树中的Log，在向hdfs写的过程都向此文件存放，
                 当存的数据到一定程度/或者定期间隔多久，会把此文件内容跟新到fsimage
     刚开始写数据时会同时向namonode内存和edit中写，
     此时立刻读取刚写入的数据是读取namenode内存和原fsimage内存的数据,
     在当edits的数据合并到fsimage时，在读取写入的那个数据就会在fsimage中读取。

1.SNN CheckPoint的处理流程
配置中配置做CheckPoint的两个条件，一个是文件大小editlog大于多大就做，另一个是时间维度，多长时间做一次。
(1)SNN首先检查是否需要进行checkpoint操作，如果上面两个条件任何一个满足了就可以
(2)通过RPC 向NameNode发送请求，rollEditLog()NameNode关闭现在的edit的stream，同时生成一个edit.new,并打开加入写入的源。
(3)SNN从NN处download fsimage文件和edit文件并进行merge
(4)merge结束后通知NN从SNN处拉去FSImage文件保存在NN的FSImage.ckpt上面
(5)一切顺利结束的话将edit.new重命名为edit,并open stream，将FSImage.ckpt重命名为FSImage,更新FSTime文件，更新时间戳
 
 

2、NN重启对Image和Edits的处理
先对各个目录的image和edit文件有效性进行判断，同时读取checkpoint的最近值。
如果image.ckpt存在，同时edit.new存在那么也许正进行一半，无法确定是否完成image拉取，删掉image.ckpt。否则将image.ckpt rename到image。
然后正常的读取FSImage，将edit merge进去。
如果存在edit.new 也merge进去。

查看图片附件

分享到：

hadoop博客整理 | 将公司oracle脚本迁移到hive平台hql时一些 ...

2015-12-11 16:54
浏览 1914
评论(0)
分类:操作系统
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

hadoop fsimage edits关系

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

hadoop fsimage edits关系

评论

发表评论

相关推荐

hadoop fs命令详解链接

使用 MultipleOutputs设置多路径输出

自定义DBInputFormat,抽取mysql表存储在分库中

64位linux系统编译hadoop源码 native库

YARN内存使用优化配置

mapreduce-chain TODO

hadoop mr实现单表列转行--mr system.out数据位置

google mapreduce杂谈

gfs杂谈

hadoop调度算法

hadoop优化0

hadoop压缩

hadoop博客整理

hadoop合并小文件的一些说说

ma-hadoop脚本命令 hadoop-hadoop dfs-hdfs dfs区别

ma-hadoop1 集群内存设置

ma-hadoop集群-配置文件-进程地址端口-和hive hbase关系

ma-大数据HDFS

ma-大数据mapreduce思想和数据切割

ma-云计算 大数据 mapreduce概念和关系

最近访客更多访客>>

ma-云计算大数据 mapreduce概念和关系