`
流氓阿飞
  • 浏览: 18495 次
社区版块
存档分类
最新评论

Hadoop基于Quorum Journal Manager的高可用配置

阅读更多

 基于前一篇:Hadoop安装与配置进行修改 http://liumangafei.iteye.com/blog/2303359

 

 修改:core-site.xml

 

 

<configuration>
        <property>
                <name>fs.defaultFS</name>
                <value>hdfs://mycluster</value>
        </property>
        <property>
                <name>hadoop.tmp.dir</name>
                <value>/usr/hadoop/tmp/hadoop-2.6.4</value>
        </property>
        <property>
                <name>io.file.buffer.size</name>
                <value>131072</value>
        </property>
</configuration>

 

 

 修改:hdfs-site.xml

 

 

<configuration>
        <property>
                <name>dfs.namenode.name.dir</name>
                <value>file:///usr/hadoop/tmp/hadoop-2.6.4/dfs/name</value>
        </property>
        <property>
                <name>dfs.datanode.data.dir</name>
                <value>file:///usr/hadoop/tmp/hadoop-2.6.4/dfs/data</value>
        </property>
        <property>
                <name>dfs.replication</name>
                <value>3</value>
        </property>
        <property>
                <name>dfs.nameservices</name>
                <value>mycluster</value>
        </property>
	<property>
                <name>dfs.ha.namenodes.mycluster</name>
                <value>nn1,nn2</value>
        </property>
	<property>
                <name>dfs.namenode.rpc-address.mycluster.nn1</name>
                <value>hadoop1:8020</value>
        </property>
	<property>
                <name>dfs.namenode.rpc-address.mycluster.nn2</name>
                <value>hadoop2:8020</value>
        </property>
	<property>
                <name>dfs.namenode.http-address.mycluster.nn1</name>
                <value>hadoop1:50070</value>
        </property>
	<property>
                <name>dfs.namenode.http-address.mycluster.nn2</name>
                <value>hadoop2:50070</value>
        </property>
	<property>
                <name>dfs.namenode.shared.edits.dir</name>
                <value>qjournal://hadoop2:8485;hadoop3:8485;hadoop4:8485;hadoop5:8485;hadoop6:8485/mycluster</value>
        </property>
	<property>
                <name>dfs.client.failover.proxy.provider.mycluster</name>
                <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
        </property>
	<property>
                <name>dfs.ha.fencing.methods</name>
                <value>sshfence</value>
        </property>
	<property>
                <name>dfs.ha.fencing.ssh.private-key-files</name>
                <value>/root/.ssh/id_rsa</value>
        </property>
	<property>
                <name>dfs.journalnode.edits.dir</name>
                <value>/usr/hadoop/journalnode</value>
        </property>
        <property>
                <name>dfs.ha.automatic-failover.enabled</name>
                <value>true</value>
        </property>
	<property>
                <name>ha.zookeeper.quorum</name>
                <value>hadoop2:2181,hadoop3:2181,hadoop4:2181</value>
        </property>
	<property>
                <name>dfs.webhdfs.enabled</name>
                <value>true</value>
        </property>
        <property>
                <name>dfs.permissions.enabled</name>
                <value>false</value>
        </property>
</configuration>

 

 

  创建对应的journalnode文件夹

 

  配置:

    1、删除hadoop对应的logs、name、data、journalnode对应的内容

    2、执行:bin/hdfs zkfc -formatZK          // 格式化zkfc

    3、所有journalnode执行:sbin/hadoop-daemon.sh start journalnode        // 启动所有journalnode节点

    4、执行:bin/hdfs namenode -format        // 格式化当前的namenode

    5、拷贝dfs/name下的内容拷贝到另一个namenode下        // 拷贝namenode信息到另一个namenode

    6、执行:sbin/start-all.sh        // 启动hadoop

 

 

 

分享到:
评论

相关推荐

    hadoop用Quorum Journal Manager(QJM)实现高可用

    在Hadoop 2.x版本之后,引入了Quorum Journal Manager (QJM) 来增强NameNode的高可用性,使得在NameNode故障时能够无缝切换,保持集群的正常运行。 Quorum Journal Manager是Hadoop HDFS(Hadoop Distributed File ...

    基于Zookeeper搭建Hadoop高可用集群

    Hadoop 支持使用 Quorum Journal Manager (QJM) 或 Network File System (NFS) 作为共享的存储系统,这里以 QJM 集群为例进行说明: 1. Active NameNode 首先把 EditLog 提交到 JournalNode 集群,然后 Standby ...

    Hadoop分布式(高可用)部署配置文件

    本文件“Hadoop分布式(高可用)部署配置文件”应包含所有必要的配置,以实现这一目标。现在,我们将深入探讨Hadoop HA的部署及其关键配置。 1. **NameNode HA**:Hadoop HA的核心是NameNode的高可用,通过设置两个...

    hadoop HA高可用性完全分布式集群安装

    为了解决这一问题,Hadoop引入了HA机制,通过设置两个NameNode实例(一个主动、一个被动),并利用共享存储(如Quorum Journal Manager,QJM)来同步状态信息,实现了NameNode的故障自动转移功能。 #### 集群环境...

    hadoop+HA+zookeeper+hbase配置文件

    Hadoop 2.6.0版本引入了高可用性(HA)特性,增强了系统的稳定性,而Zookeeper则作为协调服务,确保了分布式环境中的有序和一致性。HBase是基于Hadoop的数据存储系统,适用于实时读写的大数据操作。本文将详细阐述...

    Hadoop2.7Hbase1.1.3高可用集群安装与部署.pdf

    文档提到了三种实现 NN 高可用的方式,但最终选择了基于 QJM (Quorum Journal Manager) 的共享日志方案,具体步骤如下: 1. **Active NN** 将日志写入本地以及多个 JournalNode 上。 2. **Standby NN** 定期从 ...

    hdfs高可用配置文件

    通常使用共享文件系统如GFS或NFS,或者使用Quorum Journal Manager (QJM)。 3. **配置NameNode节点**:在每个NameNode的`hdfs-site.xml`配置文件中,需要设置`dfs.nameservices`,定义一个名称服务标识,然后分别...

    hadoop-2.8.1完全分布式搭建脚本和配置文件

    这通常涉及到Quorum Journal Manager(QJM)和Zookeeper的配合使用。 4. **Resourcemanager高可用**:在YARN中,Resourcemanager负责任务调度和资源分配。同样,配置高可用模式可以防止单点故障,确保集群的持续...

    hadoop大数据生态圈工具配置与应用.pdf

    这需要配置HA模式,包括设置共享的存储系统(如Quorum Journal Manager),并配置Zookeeper以监控NameNode状态。此外,还需要配置Hadoop的客户端,使它们能够正确地与主NameNode或备用NameNode交互。 **第七章 Hive...

    Hadoop-2.8.0分布式安装手册

     本文的目的是为当前最新版本的Hadoop 2.8.0提供最为详细的安装说明,以帮助减少安装过程中遇到的困难,并对一些错误原因进行说明,hdfs配置使用基于QJM(Quorum Journal Manager)的HA。本文的安装只涉及了hadoop-...

    Hadoop HA搭建笔记和配置文件

    4. **设置共享存储**:NameNode的元数据需要存储在一个共享的存储系统中,如NFS或Quorum Journal Manager(QJM)。在`hdfs-site.xml`中配置`dfs.journalnode.edits.dir`指向共享存储路径。 5. **配置Zookeeper**:...

    hadoop2.7安装演示

    - 使用Quorum Journal Manager (QJM)实现NameNode的高可用性。 - 高可用性集群需要硬件对等的NameNode和JournalNode机器。JournalNode应为奇数数量,如3、5或7台,以保证Quorum的形成。 - 配置`hdfs-site.xml`以...

    HDFS High Availability(HA)高可用配置.doc

    HDFS HA解决方案之一是Quorum Journal Manager (QJM),由Cloudera公司提出并被官方推荐。QJM利用Zookeeper的ZKFC(Zookeeper-based Failover Controller)进行主备切换,并通过Journal Node (JN)集群实现Edits Log的...

    Hadoop HA(QJM)高可集群性配置

    通过使用Quorum Journal Manager(QJM),Hadoop实现了对共享存储设备的高可用访问,这允许Active NameNode和Standby NameNode对共享数据进行日志追加,而不会造成数据冲突。QJM使用一组JournalNode节点来确保日志的...

    Hadoop CDH5.5.0 配置(Hdfs/Yarn HA)

    - **NameNode HA**:需要至少两台机器作为主NameNode,通过Quorum Journal Manager (QJM) 实现日志同步,确保数据的一致性。 - **Secondary NameNode**:不再承担主NameNode的备份角色,而是转变为CheckPoint Node...

    hadoop_HA版本的配置

    在本文中,我们将详细讨论如何配置Hadoop HA版本,特别是使用Quorum Journal Manager (QJM) 实现HDFS的HA。 首先,我们需要理解Hadoop HA的基本架构。Hadoop HA主要涉及两个关键组件:NameNode和ResourceManager。...

    大数据高可用集群.docx

    此外,Hadoop的高可用性解决方案是通过Quorum Journal Manager (QJM)来实现的,NameNode之间的元数据同步依赖于JournalNode,确保数据的一致性。同时,Hadoop 2.6.4及更高版本引入了ResourceManager的高可用性,通过...

    Cloudera产品高可用性配置说明1

    - **为共享存储使用Quorum Journal Manager**:更推荐使用QJM,它提供了更为可靠的多副本机制,通过多数派投票原则确保数据一致性。 3. **QuorumJournalManager的功能** QJM是HDFS HA的核心组件,它负责在多个...

    hadoop-2.7.1.tar.gz

    - HA(High Availability):在2.7.1版本中,HDFS支持NameNode的高可用性,通过使用Secondary NameNode和Quorum Journal Manager实现,确保了服务的连续性。 - HDFS Federation:允许多个独立的命名空间并行运行在...

    hdfs的高可用搭建

    本文档详细介绍了如何利用Hadoop 2.6版本中的QJM(Quorum Journal Manager)和ZooKeeper来实现HDFS的高可用性。 #### 二、HDFS HA原理概述 HDFS HA (High Availability) 解决方案旨在解决NameNode单点故障问题。...

Global site tag (gtag.js) - Google Analytics