Hadoop的Namenode的容灾处理 - JesseZhang的技术空间 - ITeye博客

`

jessezhang1981

浏览: 41361 次
性别:
来自: 深圳

最近访客更多访客>>

icehhb

jianshuai

cankun.xiao

rp_xk

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

Wuaner：体积小巧，文字却很清晰，不错的版本。谢谢lz分享！
Hadoop权威指南（第二版）pdf中文版
laserdance： command type python3.2
在Linux下安装Python

Hadoop的Namenode的容灾处理

博客分类：

hadoop

阅读更多

Hadoop的namenode是关键节点，虽然业务尽量单一，减少出错几率，但是程序都有出错的可能，所以还是需要有效的办法来解决，如下是权威指南里面介绍的两种方法：

1、备份那些组成文件系统元数据持久状态的文件。hadoop可以通过配置使namenode在多个文件系统上保存元数据的持久状态。这些写操作是实时同步的，是原子操作。一般的配置是：将持久状态写入本地磁盘的同时，写入一个远程挂载的网络文件系统NFS

2、运行一个辅助的namenode，但它不能被用作namenode。这个辅助的namenode的重要作用是定期通过编辑日志合并命名空间镜像，以防止编辑日志过大。这个辅助namenode一般在另一台单独的物理计算机上运行，因为它需要占用大量CPU时间与namenode相同容量的内存来执行合并操作。它会保存合并后的命名空间镜像的副本，并在namenode发生故障时启用。辅助namenode保存的状态总是滞后于主节点，所以在主节点全部失效时，难免会丢失部分数据，在这种情况下，一般把存在在NFS上的namenode元数据复制到辅助namenode并作为新的主namenode运行。

需要逐个试验一下，看哪种比较合适

-------------------------------------------------------------------------------------------------------------------

作者：CNZQS|JesseZhang 个人博客：CNZQS(http://www.cnzqs.com)

版权声明：除非注明，文章均为原创，可以任意转载，转载时请务必以超链接形式标明文章原始出处和作者信息及本声明

--------------------------------------------------------------------------------------------------------------------

分享到：

hadoop的应用（摘自itpub论坛） | HDFS系统学习笔记

2011-08-17 21:48
浏览 1664
评论(0)
分类:开源软件
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

hadoop 3.1.4: Hadoop 3.1.4 是 Apache 软件基金会发布的一个重要版本，它作为大数据处理的核心框架，为用户提供了高效、可靠的分布式计算能力。在这个版本中，Hadoop 进行了多方面的优化和增强，使得它在处理海量数据时性能更优，...

Hadoop平台搭建 1.搭建步骤文档 2.搭建时要用到的组件安装包: 搭建步骤：准备硬件环境：确保服务器具备足够的内存、存储和网络带宽等资源。安装Java环境：Hadoop需要Java运行环境，因此需要先安装Java。...数据备份和容灾：Hadoop可以作为数据备份和容灾的解决方案，

Hadoop原理详细解析.pdf: 通过移动计算而非移动数据，Hadoop 提高了效率，同时也保证了在不同软硬件平台间的可移植性，具备良好的容灾能力和高吞吐量的水平扩展能力。 HDFS 的关键组成部分是NameNode 和 DataNode。NameNode 是整个系统的...

Hadoop原理详细解析.doc: Hadoop的HDFS是其主要的分布式文件系统，主要特点是容灾、大容量和大吞吐量。HDFS通过数据的本地化策略优化MapReduce计算，即尽量将计算任务调度到存储数据的节点上，减少数据传输的开销。系统结构中，名称节点...

Hadoop基础面试题（附答案）: 6. **格式化HDFS**：使用`hadoop namenode -format`命令初始化文件系统。 7. **启动HDFS**：使用`sbin/start-dfs.sh`脚本启动HDFS。 #### 十三、HDFS写数据流程 1. **客户端发起写请求**：客户端向NameNode发送...

阿里Hadoop集群架构及服务体系: 阿里Hadoop集群架构及服务体系是大数据处理领域的一个关键话题，尤其在阿里巴巴这样的互联网巨头中，高效、稳定的大规模数据处理能力是业务发展的基石。本文将深入探讨阿里在Hadoop集群上的构建方式和服务体系，帮助...

腾讯大规模Hadoop集群实践: 面对如此大规模的集群，腾讯遇到了一系列的技术挑战，包括计算层和存储层的问题，如NameNode没有容灾机制、JobTracker调度效率低下等。 - **NameNode高可用性**：为了解决NameNode单点故障问题，腾讯采用了NameNode...

2013中国大数据技术大会PPT——腾讯大规模Hadoop集群实践: 在大数据技术领域，Hadoop作为重要的开源框架，被广泛用于存储和处理大规模数据集。腾讯作为中国互联网行业的领头羊之一，也在大规模Hadoop集群建设上取得了显著成就。本次分享主要由腾讯数据中心资深专家翟艳堂进行...

hadoop china 2010: 为了提高效率，云梯对Hadoop进行了大量定制，包括安全性增强（密码认证和ACL扩展）、调度器优化（基于FairScheduler的改造，允许动态调整slots）、Slave单磁盘容错机制以及Master节点的容灾方案（3个Master + 1个...

翟艳堂：腾讯大规模Hadoop集群实践: 在存储层，NameNode没有容灾机制，存在丢失1个小时数据的风险，重启耗时长，且不支持灰度变更。 ### 高可用性设计为了解决上述问题，腾讯在设计Hadoop集群时采取了高可用性的策略。JobTracker和NameNode的高可用...

Hadoop学习必看路线图2.pdf: - **互补关系**：探索如何将Hadoop与Storm结合起来，共同构建更强大的数据处理系统。 - **Storm体系架构**：深入了解Storm的工作原理及其组件之间的交互方式。 #### 六、Zookeeper分布式协作服务 - **Zookeeper...

构建一个跨机房的Hadoop集群.rar: Hadoop是分布式计算框架，主要用于处理和存储大规模数据，而跨机房部署可以提高容灾能力和系统稳定性。下面我们将深入探讨这个主题。首先，我们来理解Hadoop的基本架构。Hadoop主要由两个核心组件组成：HDFS...

巴豆大数据团队讲师课件HDFS.pdf: HDFS快照功能是Hadoop 2.0引入的一个数据备份和容灾恢复机制。它允许用户对HDFS文件系统或其目录创建一个时间点的快照，相当于在特定时刻对整个文件系统或目录树进行镜像。快照不会影响HDFS的正常操作，用户可以利用...

基于Hadoop的高速公路工程大数据平台搭建.zip: 2. 容灾备份：定期备份NameNode元数据，以防数据丢失。 3. 系统维护：定期更新Hadoop版本，修复安全漏洞，确保集群稳定运行。基于Hadoop的高速公路工程大数据平台搭建，能够帮助我们高效地管理和分析大量工程数据...

淘宝分布式数据处理实践: 3. **Master节点容灾方案**：为了保证高可用性，云梯采用了3个Master节点和1个Standby节点的配置，配合虚拟IP、JobHistory备份以及NameNode和SecondaryNameNode的冗余策略，确保在节点故障时能够快速恢复服务。...

2017最新大数据架构师精英课程: 113_hadoop namenode HA自动容灾" X3 `' ^/ U+ u+ U" F: } b 114_hadoop RM HA自动容灾 115_hbase集群搭建 116_hbase名字空间-表 117_hbase大批量操作7 [! ^" m3 B$ C. {1 S$ h. X 118_hbase架构-表和区域切割( p4 _...

大数据功能需求说明书.docx: - **Datanode**：Datanodes是Hadoop集群的基础存储单元，每个节点管理其本地存储，处理读写请求，并在Namenode的协调下执行数据块的操作。 - **SecondaryNamenode**：并非Namenode的备份，而是用来定期合并...

Global site tag (gtag.js) - Google Analytics