hadoop namenode format的作用 -

twtbgn

浏览: 45188 次
性别:
来自: 北京

最近访客更多访客>>

huageng520

ding__lin

ddwolf715

tyzqqq

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

hadoop namenode format的作用

博客分类：

hadoop

今天一同事问重启了hadoop集群后要不要format，我当时想也没想就说，不可以，不然数据都丢失了。后来仔细一想，不对，namenode format貌似不会影响datanode上面的数据，那么namenode format的作用是什么呢，通过代码来看一看吧。

namenode format的类为 org.apache.hadoop.hdfs.server.namenode.NameNode,看看format部分的源码：

private static boolean format(Configuration conf,
      boolean isConfirmationNeeded, boolean isInteractive) throws IOException {
    //这里获取配置文件中dfs.name.dir属性中配置的文件，主要为fsimage
    Collection<File> dirsToFormat = FSNamesystem.getNamespaceDirs(conf);
    //这里获取配置文件中dfs.name.edits.dir属性中配置的文件，主要为edits文件
    Collection<File> editDirsToFormat = 
                 FSNamesystem.getNamespaceEditsDirs(conf);
	。。。
	。。。
    	
    FSNamesystem nsys = new FSNamesystem(new FSImage(dirsToFormat,
                                         editDirsToFormat), conf);
    //这里执行format
    nsys.dir.fsImage.format();
    return false;
  }

后面调用了FsImage的format：

  public void format() throws IOException {
    //新的layoutVersion
    this.layoutVersion = FSConstants.LAYOUT_VERSION;
    //新的namespaceid
    this.namespaceID = newNamespaceID();
    this.cTime = 0L;
    this.checkpointTime = FSNamesystem.now();
    for (Iterator<StorageDirectory> it = 
                           dirIterator(); it.hasNext();) {
      StorageDirectory sd = it.next();
      //这里正在执行format，删除文件夹，重建文件夹，设置新文件内容
      format(sd);
    }
  }

再来看看format(StorageDirectory )方法做了什么：

void format(StorageDirectory sd) throws IOException {
    //删除current文件夹及其下的所有文件，接着在创建一个新的current文件夹
    sd.clearDirectory(); // create currrent dir
    sd.lock();
    try {
      //将image，edits，namespaceid，layoutVersion等下入current文件夹下
      saveCurrent(sd);
    } finally {
      sd.unlock();
    }
    LOG.info("Storage directory " + sd.getRoot()
             + " has been successfully formatted.");
  }

这里看到format只是对namenode的fsimage，edits等进行删除和重建，并不对datanode有的任何操作，因此不用担心会丢失数据。重新启动集群，datanode向namenode发送了block的信息，namenode就会又得到整个集群的元数据了，并保存在内存中。

下次研究下整个集群的启动过程。。

分享到：

hadoop dfs 启动过程 | maven构建hadoop项目

2013-11-07 18:03
浏览 1728
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

hadoop namenode format的作用

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

hadoop namenode format的作用

评论

发表评论

相关推荐

hadoop 上传文件

hadoop-- storage类分析

hadoop-- datanode源码分析

mapreduce简单实现基于物品的协同过滤算法

hadoop中的rpc

hadoop 1.0.4 fsimage 文件格式分析

namenode加载fsimge好edits

hadoop dfs 启动过程

maven构建hadoop项目

自己编译 hadoop-eclipse-plugin-1.1.2.jar 并安装

Hadoop运行mapred的时候报错： java.lang.ClassNotFoundException解决方法

转载--Job的数据输入格式化器—InputFormat

eclipse中导入nutch源码更新

hadoop中设置同一组中所有用户都有权限操作

最近访客更多访客>>