`

hadoop name node 双机热备

 
阅读更多

 

参考:http://touch-123.iteye.com/blog/1493594

 

 

以前Hadoop版本中,NameNode是HDFS集群的单点故障(single point of failure,SPoF),SPoF指系统中这个部件失效或停止运转将会导致整个系统不能工作。而这在下面两种情况出现:

         (1) 意外事件如机器crash,集群直到重启NameNode操作执行后才可用;

         (2) 计划维修事件,如NameNode上的软硬件升级会导致NameNode一段宕机时间。

         HDFS HA提供在一个集群中配置两台冗余NN来解决上述问题,是一种双机热备。这可以在NN崩溃时快速的故障恢复,同时在自发管理的计划维修时快速失效备援。当前hadoop版本是hadoop-0.23.0-cdh4b1

         HA主要机制是:两个单独机器运行NN,在所有时刻只有一台出于active状态,而另外一台出于standby状态。active NN负责客户端对集群的所有操作,而Standby NN作为从设备只是保存足够的状态来进行快速的故障恢复。





HA总体流程图

         Block location: 为了快速failover,standby NN必须知道这个的相关信息。为了达到此目的,所有DN上都配置了此两个NN,并且发送block location和heartbeat到两个NN上。

         至关重要的一点:只有一个Active NN.两个NN都是active即所谓脑裂情景(split-brain scenario),因此管理员必须设置一个对共享存储的fencing method(绝缘方法),当不能确定前Active NN不会自己重新变成active时,需要切断其对共享存储的访问权限,如此便能使新active NN安全的故障恢复。

         standby NN也执行namespace的状态检查,因此HA集群不需要运行Secondary NN, Checkpoint Node, Backup Node。



下面是详细的配置安装,请参见CDH4_High_Availability_Guide_b1.pdf。cloudera 官网有http://www.cloudera.com/.或者在我资源里下载看(免费):http://download.csdn.net/detail/liuxingjiaofu/4238395

 

分享到:
评论

相关推荐

    Hadoop_HDFS系统双机热备方案.pdf

    在展开有关Hadoop HDFS系统双机热备方案的知识点前,首先需要了解双机热备的基本概念,HDFS的基本架构以及如何搭建Hadoop集群。在这些基础之上,才能更深入地理解双机热备方案的设计理念及其实施步骤。 双机热备,...

    hadoop namenode双机热备

    "hadoop namenode双机热备"是为确保Hadoop集群持续运行而采取的一种重要策略,通过双机热备可以避免单点故障,提高服务的可靠性。本配置详细讲解了如何利用DRBD(Distributed Replicated Block Device)、Heartbeat...

    Hadoop_HDFS系统双机热备方案

    Hadoop_HDFS系统双机热备方案

    Hadoop HDFS系统双机热备方案

    【Hadoop HDFS 双机热备方案】 在Hadoop分布式文件系统(HDFS)中,高可用性是至关重要的,因为系统需要处理各种故障,包括名字节点(Namenode)、数据节点(Datanode)的失效以及网络分割。HDFS通过数据节点的冗余...

    利用heartbeat和drbd实现HDFS的双机热备

    ### 利用Heartbeat与DRBD实现HDFS的双机热备 #### 一、概述 在当前的大数据处理环境中,Hadoop分布式文件系统(HDFS)作为主流的数据存储解决方案之一,面临着诸多挑战,其中最重要的一项就是如何保障系统的高可用...

    Ubuntu11.10下安装Hadoop1.0.2(双机集群)

    ### Ubuntu11.10下安装Hadoop1.0.2(双机集群) #### 一、概述 本文档详细介绍了如何在Ubuntu11.10操作系统上搭建Hadoop1.0.2双机集群的过程,并通过WordCount示例验证了集群的正确性和可用性。该文档对于希望在类...

    Hadoop Multi Node Cluster 安装步骤.pdf

    Hadoop Multi Node Cluster 安装步骤.pdf

    集群配置笔录

    本篇文章将详细阐述集群配置中的关键步骤,特别是针对SSH无密码认证、Hadoop集群的配置以及双机热备的实现。 首先,SSH无密码认证是集群中实现自动化运维的基础。在集群环境中,为了简化节点间的交互,通常会设置...

    Hadoop Single Node Cluster的安装.txt

    Hadoop Single Node Cluster的详细安装,master主机与data1、data2、data3三台节点连接。

    hadoop single node setup

    根据给定的文件信息,以下是对“hadoop single node setup”相关知识点的详细说明: 1. Hadoop单节点安装的目的 Hadoop单节点安装的主要目的是为了让用户能够在单机上快速地进行简单的Hadoop MapReduce和Hadoop...

    Config and Run Hadoop Single Node mode in Ubuntu linux

    <name>hadoop.tmp.dir</name> <value>/opt/hadoop/tmp/hadoop-${user.name} <name>dfs.name.dir</name> <value>/opt/hadoop/filesystem/name <name>dfs.data.dir</name> <value>/opt/hadoop/...

    Config and Run Hadoop Multiple Node mode in Ubuntu linux

    配置和运行hadoop,以multi node方式在ununtu linux 上。

    hadoop+hbase集群搭建 详细手册

    | hadoop-node8 | *.*.83.8 | Hadoop Secondary Namenode/HBase HMaster/ZooKeeper | 三、硬件环境 在本文中,我们使用8台曙光服务器,每台服务器配置如下: * CPU:8核 * 硬盘:两个500GB硬盘 * 操作系统:SUSE ...

    企业数据库架构建设规划方案.docx

    2. 双机热备和镜像:随着业务发展,单机模式无法满足高可用性需求,出现了双机热备或镜像模式,通过Active-Standby的方式确保故障时能快速接管,但存在资源浪费、数据单点风险等问题。 3. 节点多活:面对不断增长的...

    高可用性的HDFS-Hadoop分布式文件系统深度实践.part1.rar

    内容包括:hdfs元数据解析、hadoop元数据备份方案、hadoop backup node方案、avatarnode解决方案以及最新的ha解决方案cloudrea ha name node等。其中有关backup node方案及avatarnode方案的内容是本书重点,尤其是对...

    Hadoop配置手册

    - 编辑`/etc/hostname`文件,分别将各节点的主机名修改为`hadoop-master`、`hadoop-node1`、`hadoop-node2`。 2. **配置主机映射:** - 编辑`/etc/hosts`文件,添加主机IP与名称的映射: ``` 127.0.0.1 ...

    hadoop完全分布配置指南

    192.168.1.140 hadoop-node1 hadoop-node1 192.168.1.141 hadoop-node2 hadoop-node2 ``` #### 二、Hadoop环境配置 在进行Hadoop的配置前,需要下载Hadoop压缩包,推荐使用Hadoop 0.20.1版本,可以从Apache官网...

    高可用性的HDFS-Hadoop分布式文件系统深度实践.part2.rar

    内容包括:hdfs元数据解析、hadoop元数据备份方案、hadoop backup node方案、avatarnode解决方案以及最新的ha解决方案cloudrea ha name node等。其中有关backup node方案及avatarnode方案的内容是本书重点,尤其是对...

Global site tag (gtag.js) - Google Analytics