【转】Hadoop集群的NameNode的备份 - 记忆不靠谱..那就写吧.. - ITeye博客

`

邢邢色色

浏览: 232141 次
性别:
来自: 广州

最近访客更多访客>>

qq_25052997

fww4022

yeahgoodboy

san_yun

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

tss0823：感谢，解决困惑我的编译问题。
手把手教你用jpcap抓包
xueyuan4315：太酷了
ZooKeeper学习之运维工具zkweb
NASa_CJ： “合法的值为sync，表示异步发送；sync表示同步发送。”这 ...
Kafka学习之producer配置(0.8.1版)
邢邢色色： lv12312 写道楼主，canary是测试的意思，金丝雀版 ...
【Netty官方文档翻译】引用计数对象（reference counted objects）
lv12312：楼主，canary是测试的意思，金丝雀版本，就是还没有做好发 ...
【Netty官方文档翻译】引用计数对象（reference counted objects）

【转】Hadoop集群的NameNode的备份

博客分类：

Hadoop

阅读更多

原文链接：http://www.tech126.com/tag/secondary-namenode/

Hadoop集群中，NameNode节点存储着HDFS上所有文件和目录的元数据信息

如果NameNode挂了，也就意味着整个Hadoop集群也就完了

所以，NameNode节点的备份很重要，可以从以下2个方面来备份NameNode节点

1. 在hdfs-site.xml中，配置多个name的dir到不同的磁盘分区上：

<property>
<name>dfs.name.dir</name>
<value>/pvdata/hadoopdata/name/,/opt/hadoopdata/name/</value>
</property>

2. 在另外的一台服务器上配置Secondary NameNode：它是NameNode的一个备份

Secondary NameNode会定期合并fsimage和edits日志，将edits日志文件大小控制在一个限度下

合并的时机是由2个配置参数决定的：

fs.checkpoint.period，指定连续两次检查点的最大时间间隔，默认值是1小时。
fs.checkpoint.size定义了edits日志文件的最大值，一旦超过这个值会导致强制执行检查点（即使没到检查点的最大时间间隔）。默认值是64MB。

Secondary NameNode的配置过程如下：

在conf/masters中指定第二名称节点的主机名

在core-site.xml中指定checkpoint的目录

<property>
<name>fs.checkpoint.dir</name>
<value>/opt/hadoopdata/secondname,/pvdata/hadoopdata/secondname</value>
<description>Determines where on the local filesystem the DFS secondary
      name node should store the temporary images to merge.
      If this is a comma-delimited list of directories then the image is
      replicated in all of the directories for redundancy.
</description>
</property>

如果NameNode节点挂了，可以按照如下步骤来从Secondary NameNode来恢复：

在 dfs.name.dir 指定的位置建立一个空文件夹
从 Secondary NameNode上把 secondname的目录给scp到新的NameNode机器的fs.checkpoint.dir下
使用hadoop/bin/hadoop namenode -importCheckpoint 来启动NameNode，主要不要执行format命令
使用hadoop fsck /user命令检查文件Block的完整性

详细的 Secondary NameNode细节可参考Hadoop官方文档：

http://hadoop.apache.org/common/docs/r0.20.2/hdfs_user_guide.html#Secondary+NameNode

分享到：

【转】hbase导入工具Import介绍 | 【转】Hadoop 操作备忘

2012-07-08 00:02
浏览 1766
评论(0)
分类:开源软件
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Hadoop集群配置文件备份: 本文将深入探讨“Hadoop集群配置文件备份”的重要性、步骤和最佳实践。 **1. Hadoop配置文件概述** Hadoop的配置文件主要包括`core-site.xml`、`hdfs-site.xml`、`yarn-site.xml`、`mapred-site.xml`等，这些XML...

hadoop集群安装、配置、维护文档: 本文将深入探讨在标题为“hadoop集群安装、配置、维护文档”的压缩包中涉及的关键知识点，包括如何安装、配置Hadoop集群，以及相关的维护技巧。我们将依次讨论每个文件所涵盖的主题。 1. **hadoop增加节点.txt**： ...

腾讯大规模hadoop集群实践: 在大数据处理领域，Hadoop是不可或缺的关键技术，尤其在腾讯这样的互联网巨头中，其大规模Hadoop集群的应用更是具有深远的影响力。"腾讯大规模Hadoop集群实践"深入探讨了腾讯如何利用Hadoop解决海量数据处理的问题，...

linux下hadoop集群搭建: 在Hadoop集群中，NameNode作为主节点负责元数据管理，DataNode作为从节点存储实际数据。MapReduce框架由JobTracker和TaskTracker组成，JobTracker调度任务，TaskTracker执行任务。在环境说明部分，我们了解到一个...

搭建hadoop集群的全部配置文件: 在搭建Hadoop集群的过程中，配置文件起着至关重要的作用，它们定义了集群的运行方式、节点间通信方式以及数据存储和处理的策略。本压缩包包含的文件是全面的Hadoop集群配置集合，旨在帮助用户顺利构建和管理自己的...

理解hadoop集群: Hadoop集群主要由两种类型的节点构成：NameNode节点和DataNode节点。NameNode通常只有一个（有时会有备份的Secondary NameNode以防止数据丢失），而DataNode则可以有很多。在Hadoop集群中，还涉及到几个关键组件： ...

hadoop集群维护手册.pdf: 1. 备份 dfs.namenode.dir 下的文件和 hdfs 文件目录的元数据信息。 2. 停止所有节点，重新部署 Hadoop 并替换 conf 文件夹下的所有文件。 3. 使用 bin/start-dfs.sh -upgrade 命令升级 Hadoop 版本。 4. 监控升级...

大数据时代：高性能Hadoop集群与应用案例: ### 大数据时代：高性能Hadoop集群与应用案例 #### 一、Hadoop概述与重要性随着信息技术的快速发展，数据量呈爆炸性增长趋势，这不仅为数据分析带来了前所未有的机遇，同时也对数据处理能力提出了更高要求。...

Hadoop集群搭建总结: ### Hadoop集群搭建总结 #### 一、Hadoop概述与应用场景 Hadoop是一个由Apache基金会维护的开源分布式计算框架，其主要目标是处理大规模数据集的存储与计算问题。通过Hadoop，用户能够轻松地在分布式环境中开发和...

基于Ubuntu的hadoop集群安装与配置: 本文将详细介绍基于Ubuntu环境下的Hadoop集群安装与配置，涵盖Hadoop的基本概念、HDFS（分布式文件系统）、MapReduce（分布式计算模型）、集群架构、NameNode和DataNode的角色、JobTracker和TaskTracker的职责等方面...

hadoop namenode双机热备: "hadoop namenode双机热备"是为确保Hadoop集群持续运行而采取的一种重要策略，通过双机热备可以避免单点故障，提高服务的可靠性。本配置详细讲解了如何利用DRBD（Distributed Replicated Block Device）、Heartbeat...

Hadoop集群搭建共10页.pdf.zip: 【标题】：“Hadoop集群搭建共10页.pdf” 【描述】：该压缩包文件包含了一份详细的关于Hadoop集群搭建的教程，总计10页，可能是PDF格式的文档，提供了从基础到进阶的Hadoop集群配置和管理指导。【标签】：...

机房hadoop集群部署: 1. **硬件规划**：机房中的Hadoop集群通常由多台服务器组成，包括NameNode（主节点）、DataNode（数据节点）和Secondary NameNode（辅助NameNode）。硬件配置应根据数据规模、处理需求和预算来确定，包括CPU、内存、...

深入理解Hadoop集群和网络: "深入理解Hadoop集群和网络"这个主题涵盖了Hadoop的核心组件、集群架构以及与之相关的网络概念。下面将对这些知识点进行详细阐述。首先，Hadoop的核心组件主要包括HDFS（Hadoop Distributed File System）和...

腾讯大规模Hadoop集群实践: 腾讯通过实施JobTracker分散化和NameNode高可用方案，在提高Hadoop集群性能的同时也增强了系统的可靠性和可维护性。这些实践经验对于其他企业构建和优化自己的Hadoop集群具有重要的参考价值。未来，随着技术的不断...

大数据技术基础培训-Hadoop集群管理与维护.pptx: 最后，Hadoop集群的生产运维最佳实践涵盖了监控自动化、性能优化、故障排查和备份恢复策略。监控自动化可以减少人工干预，性能优化通过对配置参数的调整，如增大MapReduce的slot数以提高并行处理能力。故障排查需要...

Hadoop集群搭建.pdf: 在构建Hadoop集群的过程中，需要遵循一系列步骤和配置要求，以确保集群稳定高效地运行。以下是对标题"《Hadoop集群搭建.pdf》"和描述中所述知识点的详细说明： 1. **集群搭建目的**：创建Hadoop集群的目的是为了...

最新Hadoop集群安装教程.rar: 这个“最新Hadoop集群安装教程”可能包含了从零开始构建一个高效、可靠的Hadoop集群的详细步骤。下面，我们将深入探讨Hadoop的基本概念，集群搭建的关键环节，以及可能涉及到的相关技术。 Hadoop是由Apache基金会...

细细品味Hadoop_Hadoop集群VSFTP安装配置.rar_hadoop: 在Hadoop集群中，节点通常分为NameNode、DataNode和TaskTracker，分别负责元数据管理、数据存储和任务调度。 VSFTP的安装和配置是Hadoop集群管理的重要一环，因为Hadoop在处理大数据时，可能需要从外部源获取或向...

hadoop集群部署.docx: 2.1 环境：在部署Hadoop集群前，你需要准备多台服务器（至少两台，一台作为Master，一台作为Slave），操作系统通常选择Linux，并确保网络连通，硬件配置应满足Hadoop的最低需求。 2.2 Host配置：在所有节点上配置...

Global site tag (gtag.js) - Google Analytics