在hadoop集群中NameNode的备份 - - ITeye博客

`

zc0604

浏览: 227311 次
性别:
来自: 北京

最近访客更多访客>>

xyc1985414

abraxas101

l1012384516

puquanbuai

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

itway：很棒的小demo
nodejs 之模拟登录
zgc123123：阿斯达是事实上事实上事实上
利用java反射机制，实现对类的私有变量和私有方法的访问
Jabbar2011： ...
httpwatch的在IE8版本的开启
铁拳无敌孙中山：试了下新浪微博的登录, 没有成功啊登录后重定向public S ...
腾讯，新浪微博模拟登录爬取数据程序，无偿奉献了(java版本)
sunshinan2013：请问腾讯微博 p_skey这个cookie怎么取？
腾讯，新浪微博模拟登录爬取数据程序，无偿奉献了(java版本)

在hadoop集群中NameNode的备份

博客分类：

hadoop

阅读更多

Hadoop集群的NameNode的备份Posted by admin in Hadoop

Hadoop集群中，NameNode节点存储着HDFS上所有文件和目录的元数据信息

如果NameNode挂了，也就意味着整个Hadoop集群也就完了

所以，NameNode节点的备份很重要，可以从以下2个方面来备份NameNode节点

1. 在hdfs-site.xml中，配置多个name的dir到不同的磁盘分区上：

<property>
<name>dfs.name.dir</name>
<value>/pvdata/hadoopdata/name/,/opt/hadoopdata/name/</value>
</property>

2. 在另外的一台服务器上配置Secondary NameNode：它是NameNode的一个备份

Secondary NameNode会定期合并fsimage和edits日志，将edits日志文件大小控制在一个限度下

合并的时机是由2个配置参数决定的：

fs.checkpoint.period，指定连续两次检查点的最大时间间隔，默认值是1小时。
fs.checkpoint.size定义了edits日志文件的最大值，一旦超过这个值会导致强制执行检查点（即使没到检查点的最大时间间隔）。默认值是64MB。

Secondary NameNode的配置过程如下：

在conf/masters中指定第二名称节点的主机名

在core-site.xml中指定checkpoint的目录

<property>
<name>fs.checkpoint.dir</name>
<value>/opt/hadoopdata/secondname,/pvdata/hadoopdata/secondname</value>
<description>Determines where on the local filesystem the DFS secondary
      name node should store the temporary images to merge.
      If this is a comma-delimited list of directories then the image is
      replicated in all of the directories for redundancy.
</description>
</property>

如果NameNode节点挂了，可以按照如下步骤来从Secondary NameNode来恢复：

在dfs.name.dir指定的位置建立一个空文件夹
从Secondary NameNode上把secondname的目录给scp到新的NameNode机器的fs.checkpoint.dir下
使用hadoop/bin/hadoop namenode -importCheckpoint来启动NameNode，不要执行format命令
使用hadoop fsck /user命令检查文件Block的完整性

详细的Secondary NameNode细节可参考Hadoop官方文档：

http://hadoop.apache.org/common/docs/r0.20.2/hdfs_user_guide.html#Secondary+NameNode

分享到：

hadoop中mapred.tasktracker.map.tasks.max ... | 在hadoop集群中删除结点

2012-03-20 15:33
浏览 1123
评论(0)
分类:开源软件
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Hadoop集群配置文件备份: 在Hadoop集群中，配置文件扮演着至关重要的角色，它们定义了集群的行为、性能优化参数以及故障转移策略等。本文将深入探讨“Hadoop集群配置文件备份”的重要性、步骤和最佳实践。 **1. Hadoop配置文件概述** Hadoop...

hadoop集群安装、配置、维护文档: 本文将深入探讨在标题为“hadoop集群安装、配置、维护文档”的压缩包中涉及的关键知识点，包括如何安装、配置Hadoop集群，以及相关的维护技巧。我们将依次讨论每个文件所涵盖的主题。 1. **hadoop增加节点.txt**： ...

理解hadoop集群: 在分布式数据分析的示例场景中，比如需要统计客户通过邮件发送给客服的“Fraud”（欺诈）一词出现的次数，可以将包含所有邮件内容的大型文件加载进Hadoop集群中。然后通过MapReduce进行分析，将结果存储在HDFS中，并...

linux下hadoop集群搭建: 在Hadoop集群中，NameNode作为主节点负责元数据管理，DataNode作为从节点存储实际数据。MapReduce框架由JobTracker和TaskTracker组成，JobTracker调度任务，TaskTracker执行任务。在环境说明部分，我们了解到一个...

腾讯大规模hadoop集群实践: 在大数据处理领域，Hadoop是不可或缺的关键技术，尤其在腾讯这样的互联网巨头中，其大规模Hadoop集群的应用更是具有深远的影响力。"腾讯大规模Hadoop集群实践"深入探讨了腾讯如何利用Hadoop解决海量数据处理的问题，...

hadoop集群维护手册.pdf: 2. 在 Hadoop Namenode 的配置文件中添加新节点的主机名。 3. 执行 bin/start-all.sh 命令启动集群。 4. 等待数据平衡完成。三、数据平衡数据平衡是 Hadoop 集群维护的重要一步骤。可以使用 start-balancer.sh ...

搭建hadoop集群的全部配置文件: 在搭建Hadoop集群的过程中，配置文件起着至关重要的作用，它们定义了集群的运行方式、节点间通信方式以及数据存储和处理的策略。本压缩包包含的文件是全面的Hadoop集群配置集合，旨在帮助用户顺利构建和管理自己的...

Hadoop集群搭建总结: 在搭建好Hadoop集群后，还需要进行性能优化和日常维护工作： - **性能调优**：根据实际业务需求调整MapReduce、HDFS和YARN的参数。 - **监控与日志管理**：使用工具如Ganglia、Nagios监控集群健康状况，定期检查...

大数据时代：高性能Hadoop集群与应用案例: ### 大数据时代：高性能Hadoop集群与应用案例 #### 一、Hadoop概述与重要性随着信息技术的快速发展，数据量呈爆炸性增长趋势，这不仅为数据分析带来了前所未有的机遇，同时也对数据处理能力提出了更高要求。...

基于Ubuntu的hadoop集群安装与配置: 本文将详细介绍基于Ubuntu环境下的Hadoop集群安装与配置，涵盖Hadoop的基本概念、HDFS（分布式文件系统）、MapReduce（分布式计算模型）、集群架构、NameNode和DataNode的角色、JobTracker和TaskTracker的职责等方面...

深入理解Hadoop集群和网络: 在"深入理解Hadoop集群和网络"的学习过程中，你可能还会接触到其他重要概念，如Hadoop的安装和配置，包括环境变量设置、配置文件调整等。此外，性能调优是另一个重要的话题，这涉及数据局部性、资源分配策略以及网络...

细细品味Hadoop_Hadoop集群VSFTP安装配置.rar_hadoop: 在Hadoop集群中，节点通常分为NameNode、DataNode和TaskTracker，分别负责元数据管理、数据存储和任务调度。 VSFTP的安装和配置是Hadoop集群管理的重要一环，因为Hadoop在处理大数据时，可能需要从外部源获取或向...

机房hadoop集群部署: 1. **硬件规划**：机房中的Hadoop集群通常由多台服务器组成，包括NameNode（主节点）、DataNode（数据节点）和Secondary NameNode（辅助NameNode）。硬件配置应根据数据规模、处理需求和预算来确定，包括CPU、内存、...

HDFS中NameNode节点的配置、备份和恢复.doc: 在本文档中，我们将详细讲解 HDFS 中 NameNode 节点的配置、备份和恢复，以及 SecondaryNameNode 的配置。 1. NameNode 节点的配置在 HDFS 中，NameNode 节点是中心服务器，负责管理文件系统的名字空间和客户端对...

腾讯大规模Hadoop集群实践: 腾讯通过实施JobTracker分散化和NameNode高可用方案，在提高Hadoop集群性能的同时也增强了系统的可靠性和可维护性。这些实践经验对于其他企业构建和优化自己的Hadoop集群具有重要的参考价值。未来，随着技术的不断...

最新Hadoop集群安装教程.rar: 总之，这个“最新Hadoop集群安装教程”将引导你完成从环境准备到集群搭建的全过程，让你掌握在实际环境中部署和管理Hadoop集群的技能。通过学习这个教程，你不仅能了解Hadoop的基本原理，还能提升在大数据处理领域的...

Hadoop集群搭建共10页.pdf.zip: 【压缩包子文件的文件名称列表】：由于只给出“赚钱项目”这一条信息，无法确定它与Hadoop集群搭建的直接关联，因此在接下来的内容中，我们将专注于Hadoop集群搭建的核心知识点。 **Hadoop概述** Hadoop是一个开源...

大数据与云计算培训学习资料 Hadoop集群细细品味Hadoop_第5期_Hadoop安装配置共44页.pdf: - **Master节点**：在Hadoop集群中，Master节点主要分为NameNode和JobTracker。NameNode是HDFS的主节点，负责管理文件系统的元数据，包括文件的命名空间和文件块的映射信息，以及客户端的访问控制。JobTracker是...

大数据技术基础培训-Hadoop集群管理与维护.pptx: 最后，Hadoop集群的生产运维最佳实践涵盖了监控自动化、性能优化、故障排查和备份恢复策略。监控自动化可以减少人工干预，性能优化通过对配置参数的调整，如增大MapReduce的slot数以提高并行处理能力。故障排查需要...

hadoop集群部署.docx: 2.1 环境：在部署Hadoop集群前，你需要准备多台服务器（至少两台，一台作为Master，一台作为Slave），操作系统通常选择Linux，并确保网络连通，硬件配置应满足Hadoop的最低需求。 2.2 Host配置：在所有节点上配置...

Global site tag (gtag.js) - Google Analytics