`

samuschen

浏览: 409766 次
性别:
来自: 北京

最近访客更多访客>>

dy.f

u012363178

谁谁谁

wangyy

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

秦时明月黑：深入浅出，楼主很有功底
hive编译部分的源码结构
tywo45：感觉好多错误，但还是支持！
HDFS+MapReduce+Hive+HBase十分钟快速入门
xbbHistory：解析的很棒！！
Linux-VFS
darrendu：执行这个命令，bin/hadoop fs -ls /home/ ...
Hadoop示例程序WordCount运行及详解
moudaen：请问楼主，我执行总后一条语句时，执行的是自带的1.sql，你当 ...
TPC-H on Hive

Hadoop的Secondary NameNode方案

博客分类：

Hadoop

阅读更多

http://book.51cto.com/art/201205/339038.htm

Hadoop的Secondary NameNode方案(不是双机热备)

该方案启动一个Secondary NameNode节点，该节点定期从NameNode节点上下载元数据信息（元数据镜像fsimage 和元数据库操作日志edits），然后将fsimage和edits进行合并，生成新的fsimage（该fsimage就是Secondary NameNode下载时刻的元数据的Checkpoint），在本地保存，并将其推送到NameNode，同时重置NameNode上的edits。

优点

Hadoop自带机制，成熟可靠，使用简单方便，无需开发，配置即可。

Secondaryary NameNode定期做Checkpoint，可保证各个Checkpoint阶段的元数据的可靠性，同时，进行fsimage与edits的合并，可以有效限制edits的大小，防止其无限制增长。

缺点

没有做到热备，当NameNode无法提供服务时，需要重启NameNode，服务恢复时间与文件系统规模大小成正比。

Secondary NameNode保存的只是Checkpoint时刻的元数据，因此，一旦NameNode上的元数据损坏，通过Checkpoint恢复的元数据并不是HDFS此刻的最新数据，存在一致性问题。

分享到：

第三层交换机和路由器的区别 | 双机热备：基于共享存储与纯软件方式

2012-11-13 10:39
浏览 1302
评论(0)
分类:Web前端
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

王家林的“云计算分布式大数据Hadoop第九讲Hadoop图文训练课程：剖析NameNode和Secondary NameNode的工作机制和流程.: 理解NameNode和Secondary NameNode的工作机制对于优化Hadoop集群的性能和可靠性至关重要。在实际的Hadoop部署中，根据集群规模和业务需求，合理配置这两个组件的参数，以及监控它们的运行状态，都是运维人员必须掌握...

Hadoop大数据期末考试重点: 4. **Secondary NameNode的作用**：Secondary NameNode并非用于缩短Hadoop集群启动时间，而是辅助NameNode合并编辑日志，减少NameNode的重启时间。 5. **Hadoop的硬件需求与可靠性**：Hadoop设计允许在普通硬件上...

Hadoop中namenode和secondarynamenode工作机制讲解: 了解了namenode和secondarynamenode的工作机制之后，我们可以看到，在Hadoop系统中，通过这样的设计既保证了系统的高可用性，又确保了元数据的稳定性和一致性。这种机制是Hadoop处理大数据时能够保持高效和稳定运行...

Hadoop Namenode恢复: 3. `<property><name>fs.checkpoint.dir</name><value>/data/work/hdfs/namesecondary</value><description>Determines where on the local filesystem the DFS secondary ...-secondary namenode 的存储目录...

Hadoop源代码分析（三六）: ### Hadoop源代码分析——Secondary NameNode深入解析 #### 一、引言在Hadoop分布式文件系统（HDFS）中，Secondary NameNode虽然不是核心组件，但它在维护系统的稳定性和提高性能方面扮演着重要的角色。本文将...

hadoop快速入门: - **格式化分布式文件系统**：使用`bin/hadoop namenode -format`命令格式化新的HDFS。 - **启动Hadoop守护进程**：执行`bin/start-all.sh`脚本来启动所有Hadoop守护进程。 - **查看Hadoop守护进程日志**：日志文件...

Hadoop源代码分析（三七）: 在Hadoop生态系统中，Secondary NameNode扮演着重要的角色，它是NameNode的一个辅助节点，负责周期性地与NameNode进行检查点（Checkpoint）操作，以帮助NameNode减轻内存压力并保持数据一致性。本文将深入探讨...

Hadoop分布式介绍: * Secondary NameNode：HA（高可用性）解决方案，用于镜像备份和日志与镜像的定期合并。 HDFS中的基本概念 * 文件块（Block）：最基本的存储单位，HDFS默认Block大小是128MB。 * Replication：指定多副本，HDFS中...

Hadoop-2.0-NameNode-HA和Federation实践1: 为此，Hadoop社区引入了多种解决方案，如Secondary NameNode、Backup NameNode、AvatarNode等，但这些方法要么不能提供即时的故障切换，要么不能保证数据完整性。 HA的实现方式主要依赖于共享存储和故障切换机制。...

Hadoop系统完全分布式集群搭建方法: 配置Hadoop集群，包括设置 Namenode 节点、DataNode 节点、Secondary Namenode 节点等。五、结语本文档详细介绍了如何搭建Hadoop完全分布式集群，包括安装Linux操作系统、设置静态IP、安装SSH并配置免密码访问...

hadoop配置: 2. "hadoop的namenode和secondnamenode分开部署在不同服务器.htm" - 这篇文档可能讲解了如何将Hadoop的NameNode（主节点）和Secondary NameNode（辅助节点）部署在不同的物理服务器上，以提高系统的可用性和稳定性。...

Hadoop云计算2.0笔记第一课Hadoop介绍: 其中，HDFS 是 Hadoop розпределённой файловой системой，包括 Namenode、Secondary Namenode、DataNode 等组件。 3. HDFS（Hadoop Distributed File System）： HDFS 是 Hadoop ...

hadoop+hbase集群搭建详细手册: | hadoop-node8 | *.*.83.8 | Hadoop Secondary Namenode/HBase HMaster/ZooKeeper | 三、硬件环境在本文中，我们使用8台曙光服务器，每台服务器配置如下： * CPU：8核 * 硬盘：两个500GB硬盘 * 操作系统：SUSE ...

Hadoop原理详细解析.pdf: 这个过程中，Secondary NameNode获取FsImage和旧的EditLog，应用日志操作生成新的FsImage.ckpt，并将结果返回给NameNode。这样，NameNode始终保持最新的元数据信息，而Secondary NameNode则可以处理旧的FsImage和...

hadoop集群部署: master 节点用于运行 namenode、secondary namenode 和 jobtracker 任务，而 slave 节点用于运行 datanode 和 tasktracker 任务。可以通过复制和粘贴虚拟机节点来轻松地创建多个虚拟机节点。 hosts 文件配置 hosts...

完全分布式Hadoop2.3安装与配置: HDFS 架构主要包括 NameNode、Secondary NameNode 和 DataNode 三部分。 * NameNode：负责管理 HDFS 的目录树和相关文件的元数据信息。 * Secondary NameNode：有两个作用，一是镜像备份，二是日志与镜像定期合并，...

hadoop配置相关的好书: 了解如何设置和优化Secondary NameNode的配置可以提高整个Hadoop集群的效率。 "jobtracker"是Hadoop MapReduce旧版中的任务调度器和资源管理器，负责作业的提交、监控和调度。每个MapReduce作业被分解为多个map任务...

hadoop-hdfs-1.docx: 4. Secondary NameNode：Secondary NameNode是HDFS集群中的备份NameNode，用于在Primary NameNode故障时提供服务。Secondary NameNode会定期从Primary NameNode同步数据，以确保数据的一致性。 5. 数据块报告：...

Hadoop搭建的源代码.doc: 5. `dfs.namenode.checkpoint.dir`: 用于设定Secondary NameNode存储检查点的本地文件系统路径，这里是`file:///home/hadoop/hadoop2.7/hdfs/namesecondary`。 6. `dfs.webhdfs.enabled`: 如果设置为`true`（如案例...

hadoop 高可用性HA部署: 【Hadoop高可用性HA部署】是为了解决Hadoop 1.0架构中的单点故障问题，确保在NameNode或关键服务失败时，集群仍能持续运行。Hadoop HA通过部署双NameNode（Active/Standby模式）来提供高可用性。在正常情况下，...

Global site tag (gtag.js) - Google Analytics