`
samuschen
  • 浏览: 405891 次
  • 性别: Icon_minigender_2
  • 来自: 北京
社区版块
存档分类
最新评论

Hadoop的Secondary NameNode方案

阅读更多

http://book.51cto.com/art/201205/339038.htm

 

Hadoop的Secondary NameNode方案(不是双机热备)

该方案启动一个Secondary NameNode节点,该节点定期从NameNode节点上下载元数据信息(元数据镜像fsimage 和元数据库操作日志edits),然后将fsimage和edits进行合并,生成新的fsimage(该fsimage就是Secondary NameNode下载时刻的元数据的Checkpoint),在本地保存,并将其推送到NameNode,同时重置NameNode上的edits。

优点

Hadoop自带机制,成熟可靠,使用简单方便,无需开发,配置即可。

Secondaryary NameNode定期做Checkpoint,可保证各个Checkpoint阶段的元数据的可靠性,同时,进行fsimage与edits的合并,可以有效限制edits的大小,防止其无限制增长。

缺点

没有做到热备,当NameNode无法提供服务时,需要重启NameNode,服务恢复时间与文件系统规模大小成正比。

Secondary NameNode保存的只是Checkpoint时刻的元数据,因此,一旦NameNode上的元数据损坏,通过Checkpoint恢复的元数据并不是HDFS此刻的最新数据,存在一致性问题。

分享到:
评论

相关推荐

    Hadoop大数据期末考试重点

    4. **Secondary NameNode的作用**:Secondary NameNode并非用于缩短Hadoop集群启动时间,而是辅助NameNode合并编辑日志,减少NameNode的重启时间。 5. **Hadoop的硬件需求与可靠性**:Hadoop设计允许在普通硬件上...

    Hadoop中namenode和secondarynamenode工作机制讲解

    了解了namenode和secondarynamenode的工作机制之后,我们可以看到,在Hadoop系统中,通过这样的设计既保证了系统的高可用性,又确保了元数据的稳定性和一致性。这种机制是Hadoop处理大数据时能够保持高效和稳定运行...

    Hadoop Namenode恢复

    3. `<property><name>fs.checkpoint.dir</name><value>/data/work/hdfs/namesecondary</value><description>Determines where on the local filesystem the DFS secondary ...-secondary namenode 的存储目录...

    Hadoop源代码分析(三六)

    ### Hadoop源代码分析——Secondary NameNode深入解析 #### 一、引言 在Hadoop分布式文件系统(HDFS)中,Secondary NameNode虽然不是核心组件,但它在维护系统的稳定性和提高性能方面扮演着重要的角色。本文将...

    Hadoop源代码分析(三七)

    在Hadoop生态系统中,Secondary NameNode扮演着重要的角色,它是NameNode的一个辅助节点,负责周期性地与NameNode进行检查点(Checkpoint)操作,以帮助NameNode减轻内存压力并保持数据一致性。本文将深入探讨...

    Hadoop分布式介绍

    * Secondary NameNode:HA(高可用性)解决方案,用于镜像备份和日志与镜像的定期合并。 HDFS中的基本概念 * 文件块(Block):最基本的存储单位,HDFS默认Block大小是128MB。 * Replication:指定多副本,HDFS中...

    Hadoop-2.0-NameNode-HA和Federation实践1

    为此,Hadoop社区引入了多种解决方案,如Secondary NameNode、Backup NameNode、AvatarNode等,但这些方法要么不能提供即时的故障切换,要么不能保证数据完整性。 HA的实现方式主要依赖于共享存储和故障切换机制。...

    Hadoop系统完全分布式集群搭建方法

    配置Hadoop集群,包括设置 Namenode 节点、DataNode 节点、Secondary Namenode 节点等。 五、结语 本文档详细介绍了如何搭建Hadoop完全分布式集群,包括安装Linux操作系统、设置静态IP、安装SSH并配置免密码访问...

    hadoop配置

    2. "hadoop的namenode和secondnamenode分开部署在不同服务器.htm" - 这篇文档可能讲解了如何将Hadoop的NameNode(主节点)和Secondary NameNode(辅助节点)部署在不同的物理服务器上,以提高系统的可用性和稳定性。...

    Hadoop云计算2.0笔记第一课Hadoop介绍

    其中,HDFS 是 Hadoop розпределённой файловой системой,包括 Namenode、Secondary Namenode、DataNode 等组件。 3. HDFS(Hadoop Distributed File System): HDFS 是 Hadoop ...

    hadoop+hbase集群搭建 详细手册

    | hadoop-node8 | *.*.83.8 | Hadoop Secondary Namenode/HBase HMaster/ZooKeeper | 三、硬件环境 在本文中,我们使用8台曙光服务器,每台服务器配置如下: * CPU:8核 * 硬盘:两个500GB硬盘 * 操作系统:SUSE ...

    Hadoop原理详细解析.pdf

    这个过程中,Secondary NameNode获取FsImage和旧的EditLog,应用日志操作生成新的FsImage.ckpt,并将结果返回给NameNode。这样,NameNode始终保持最新的元数据信息,而Secondary NameNode则可以处理旧的FsImage和...

    hadoop集群部署

    master 节点用于运行 namenode、secondary namenode 和 jobtracker 任务,而 slave 节点用于运行 datanode 和 tasktracker 任务。可以通过复制和粘贴虚拟机节点来轻松地创建多个虚拟机节点。 hosts 文件配置 hosts...

    完全分布式Hadoop2.3安装与配置

    HDFS 架构主要包括 NameNode、Secondary NameNode 和 DataNode 三部分。 * NameNode:负责管理 HDFS 的目录树和相关文件的元数据信息。 * Secondary NameNode:有两个作用,一是镜像备份,二是日志与镜像定期合并,...

    hadoop配置相关的好书

    了解如何设置和优化Secondary NameNode的配置可以提高整个Hadoop集群的效率。 "jobtracker"是Hadoop MapReduce旧版中的任务调度器和资源管理器,负责作业的提交、监控和调度。每个MapReduce作业被分解为多个map任务...

    hadoop-hdfs-1.docx

    4. Secondary NameNode:Secondary NameNode是HDFS集群中的备份NameNode,用于在Primary NameNode故障时提供服务。Secondary NameNode会定期从Primary NameNode同步数据,以确保数据的一致性。 5. 数据块报告:...

    Hadoop搭建的源代码.doc

    5. `dfs.namenode.checkpoint.dir`: 用于设定Secondary NameNode存储检查点的本地文件系统路径,这里是`file:///home/hadoop/hadoop2.7/hdfs/namesecondary`。 6. `dfs.webhdfs.enabled`: 如果设置为`true`(如案例...

    hadoop 高可用性HA部署

    【Hadoop高可用性HA部署】是为了解决Hadoop 1.0架构中的单点故障问题,确保在NameNode或关键服务失败时,集群仍能持续运行。Hadoop HA通过部署双NameNode(Active/Standby模式)来提供高可用性。在正常情况下,...

Global site tag (gtag.js) - Google Analytics