`
david.org
  • 浏览: 157526 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

Hadoop的Secondary NameNode(1)

阅读更多
Secondary NameNode

NameNode将对文件系统的改动追加保存到本地文件系统上的一个日志文件(edits)。当一个NameNode启动时,它首先从一个映像文件(fsimage)中读取HDFS的状态,接着应用日志文件中的edits操作。然后它将新的HDFS状态写入(fsimage)中,并使用一个空的edits文件开始正常操作。因为NameNode只有在启动阶段才合并fsimage和edits,所以久而久之日志文件可能会变得非常庞大,特别是对大型的集群。日志文件太大的另一个副作用是下一次NameNode启动会花很长时间。

Secondary NameNode定期合并fsimage和edits日志,将edits日志文件大小控制在一个限度下。因为内存需求和NameNode在一个数量级上,所以通常secondary NameNode和NameNode运行在不同的机器上。Secondary NameNode通过bin/start-dfs.sh在conf/masters中指定的节点上启动。

Secondary NameNode的检查点进程启动,是由两个配置参数控制的:

    * fs.checkpoint.period,指定连续两次检查点的最大时间间隔, 默认值是1小时。
    * fs.checkpoint.size定义了edits日志文件的最大值,一旦超过这个值会导致强制执行检查点(即使没到检查点的最大时间间隔)。默认值是64MB。

Secondary NameNode保存最新检查点的目录与NameNode的目录结构相同。 所以NameNode可以在需要的时候读取Secondary NameNode上的检查点镜像。

如果NameNode上除了最新的检查点以外,所有的其他的历史镜像和edits文件都丢失了, NameNode可以引入这个最新的检查点。以下操作可以实现这个功能:

    * 在配置参数dfs.name.dir指定的位置建立一个空文件夹;
    * 把检查点目录的位置赋值给配置参数fs.checkpoint.dir;
    * 启动NameNode,并加上-importCheckpoint。

NameNode会从fs.checkpoint.dir目录读取检查点, 并把它保存在dfs.name.dir目录下。 如果dfs.name.dir目录下有合法的镜像文件,NameNode会启动失败。 NameNode会检查fs.checkpoint.dir目录下镜像文件的一致性,但是不会去改动它。


secondarynamenode 的命令

运行HDFS的secondary namenode。

用法:hadoop secondarynamenode [-checkpoint [force]] | [-geteditsize]

命令选项 描述
-checkpoint [force] 如果EditLog的大小 >= fs.checkpoint.size,启动Secondary namenode的检查点过程。 如果使用了-force,将不考虑EditLog的大小。
-geteditsize 打印EditLog大小。
分享到:
评论

相关推荐

    Hadoop大数据期末考试重点

    4. **Secondary NameNode的作用**:Secondary NameNode并非用于缩短Hadoop集群启动时间,而是辅助NameNode合并编辑日志,减少NameNode的重启时间。 5. **Hadoop的硬件需求与可靠性**:Hadoop设计允许在普通硬件上...

    Hadoop中namenode和secondarynamenode工作机制讲解

    1. SecondaryNameNode会定期询问namenode是否需要执行checkpoint。 2. 如果需要,SecondaryNameNode向namenode请求执行checkpoint。 3. 在checkpoint过程中,SecondaryNameNode会引导namenode滚动更新正在写的edits...

    Hadoop Namenode恢复

    3. `<property><name>fs.checkpoint.dir</name><value>/data/work/hdfs/namesecondary</value><description>Determines where on the local filesystem the DFS secondary ...-secondary namenode 的存储目录...

    Hadoop源代码分析(三六)

    ### Hadoop源代码分析——Secondary NameNode深入解析 #### 一、引言 在Hadoop分布式文件系统(HDFS)中,Secondary NameNode虽然不是核心组件,但它在维护系统的稳定性和提高性能方面扮演着重要的角色。本文将...

    Hadoop源代码分析(三七)

    在Hadoop生态系统中,Secondary NameNode扮演着重要的角色,它是NameNode的一个辅助节点,负责周期性地与NameNode进行检查点(Checkpoint)操作,以帮助NameNode减轻内存压力并保持数据一致性。本文将深入探讨...

    Hadoop-2.0-NameNode-HA和Federation实践1

    为此,Hadoop社区引入了多种解决方案,如Secondary NameNode、Backup NameNode、AvatarNode等,但这些方法要么不能提供即时的故障切换,要么不能保证数据完整性。 HA的实现方式主要依赖于共享存储和故障切换机制。...

    Hadoop分布式介绍

    1. Secondary 通知 Namenode 切换 edits 文件。 2. Secondary 从 Namenode 获得 fsimage 和 edits(通过 HTTP)。 3. Secondary 将 fsimage 载入内存,然后开始合并 edits。 4. Secondary 将新的 fsimage 发回给 ...

    Hadoop系统完全分布式集群搭建方法

    配置Hadoop集群,包括设置 Namenode 节点、DataNode 节点、Secondary Namenode 节点等。 五、结语 本文档详细介绍了如何搭建Hadoop完全分布式集群,包括安装Linux操作系统、设置静态IP、安装SSH并配置免密码访问...

    Hadoop云计算2.0笔记第一课Hadoop介绍

    其中,HDFS 是 Hadoop розпределённой файловой системой,包括 Namenode、Secondary Namenode、DataNode 等组件。 3. HDFS(Hadoop Distributed File System): HDFS 是 Hadoop ...

    hadoop配置

    2. "hadoop的namenode和secondnamenode分开部署在不同服务器.htm" - 这篇文档可能讲解了如何将Hadoop的NameNode(主节点)和Secondary NameNode(辅助节点)部署在不同的物理服务器上,以提高系统的可用性和稳定性。...

    hadoop+hbase集群搭建 详细手册

    | hadoop-node8 | *.*.83.8 | Hadoop Secondary Namenode/HBase HMaster/ZooKeeper | 三、硬件环境 在本文中,我们使用8台曙光服务器,每台服务器配置如下: * CPU:8核 * 硬盘:两个500GB硬盘 * 操作系统:SUSE ...

    Hadoop原理详细解析.pdf

    这个过程中,Secondary NameNode获取FsImage和旧的EditLog,应用日志操作生成新的FsImage.ckpt,并将结果返回给NameNode。这样,NameNode始终保持最新的元数据信息,而Secondary NameNode则可以处理旧的FsImage和...

    hadoop集群部署

    master 节点用于运行 namenode、secondary namenode 和 jobtracker 任务,而 slave 节点用于运行 datanode 和 tasktracker 任务。可以通过复制和粘贴虚拟机节点来轻松地创建多个虚拟机节点。 hosts 文件配置 hosts...

    hadoop-hdfs-1.docx

    1. NameNode和DataNode:NameNode是HDFS集群中的主节点,负责管理文件系统的命名空间和目录结构。每个HDFS集群只有一个NameNode,通常还会配置一个Secondary NameNode用作备份。DataNode是HDFS集群中的从节点,负责...

    完全分布式Hadoop2.3安装与配置

    HDFS 架构主要包括 NameNode、Secondary NameNode 和 DataNode 三部分。 * NameNode:负责管理 HDFS 的目录树和相关文件的元数据信息。 * Secondary NameNode:有两个作用,一是镜像备份,二是日志与镜像定期合并,...

    Hadoop搭建的源代码.doc

    5. `dfs.namenode.checkpoint.dir`: 用于设定Secondary NameNode存储检查点的本地文件系统路径,这里是`file:///home/hadoop/hadoop2.7/hdfs/namesecondary`。 6. `dfs.webhdfs.enabled`: 如果设置为`true`(如案例...

    hadoop配置相关的好书

    了解如何设置和优化Secondary NameNode的配置可以提高整个Hadoop集群的效率。 "jobtracker"是Hadoop MapReduce旧版中的任务调度器和资源管理器,负责作业的提交、监控和调度。每个MapReduce作业被分解为多个map任务...

    hadoop 完全分布式搭建

    在 Hadoop 集群中,主要有三种节点:NameNode、DataNode 和 Secondary NameNode。NameNode 负责管理 HDFS 文件系统的元数据,DataNode 负责存储数据块,而 Secondary NameNode 负责 NameNode 的热备。 知识点2:...

Global site tag (gtag.js) - Google Analytics