基于前一篇:Hadoop安装与配置进行修改 http://liumangafei.iteye.com/blog/2303359
修改:core-site.xml
<configuration> <property> <name>fs.defaultFS</name> <value>hdfs://mycluster</value> </property> <property> <name>hadoop.tmp.dir</name> <value>/usr/hadoop/tmp/hadoop-2.6.4</value> </property> <property> <name>io.file.buffer.size</name> <value>131072</value> </property> </configuration>
修改:hdfs-site.xml
<configuration> <property> <name>dfs.namenode.name.dir</name> <value>file:///usr/hadoop/tmp/hadoop-2.6.4/dfs/name</value> </property> <property> <name>dfs.datanode.data.dir</name> <value>file:///usr/hadoop/tmp/hadoop-2.6.4/dfs/data</value> </property> <property> <name>dfs.replication</name> <value>3</value> </property> <property> <name>dfs.nameservices</name> <value>mycluster</value> </property> <property> <name>dfs.ha.namenodes.mycluster</name> <value>nn1,nn2</value> </property> <property> <name>dfs.namenode.rpc-address.mycluster.nn1</name> <value>hadoop1:8020</value> </property> <property> <name>dfs.namenode.rpc-address.mycluster.nn2</name> <value>hadoop2:8020</value> </property> <property> <name>dfs.namenode.http-address.mycluster.nn1</name> <value>hadoop1:50070</value> </property> <property> <name>dfs.namenode.http-address.mycluster.nn2</name> <value>hadoop2:50070</value> </property> <property> <name>dfs.namenode.shared.edits.dir</name> <value>qjournal://hadoop2:8485;hadoop3:8485;hadoop4:8485;hadoop5:8485;hadoop6:8485/mycluster</value> </property> <property> <name>dfs.client.failover.proxy.provider.mycluster</name> <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value> </property> <property> <name>dfs.ha.fencing.methods</name> <value>sshfence</value> </property> <property> <name>dfs.ha.fencing.ssh.private-key-files</name> <value>/root/.ssh/id_rsa</value> </property> <property> <name>dfs.journalnode.edits.dir</name> <value>/usr/hadoop/journalnode</value> </property> <property> <name>dfs.ha.automatic-failover.enabled</name> <value>true</value> </property> <property> <name>ha.zookeeper.quorum</name> <value>hadoop2:2181,hadoop3:2181,hadoop4:2181</value> </property> <property> <name>dfs.webhdfs.enabled</name> <value>true</value> </property> <property> <name>dfs.permissions.enabled</name> <value>false</value> </property> </configuration>
创建对应的journalnode文件夹
配置:
1、删除hadoop对应的logs、name、data、journalnode对应的内容
2、执行:bin/hdfs zkfc -formatZK // 格式化zkfc
3、所有journalnode执行:sbin/hadoop-daemon.sh start journalnode // 启动所有journalnode节点
4、执行:bin/hdfs namenode -format // 格式化当前的namenode
5、拷贝dfs/name下的内容拷贝到另一个namenode下 // 拷贝namenode信息到另一个namenode
6、执行:sbin/start-all.sh // 启动hadoop
相关推荐
在Hadoop 2.x版本之后,引入了Quorum Journal Manager (QJM) 来增强NameNode的高可用性,使得在NameNode故障时能够无缝切换,保持集群的正常运行。 Quorum Journal Manager是Hadoop HDFS(Hadoop Distributed File ...
Hadoop 支持使用 Quorum Journal Manager (QJM) 或 Network File System (NFS) 作为共享的存储系统,这里以 QJM 集群为例进行说明: 1. Active NameNode 首先把 EditLog 提交到 JournalNode 集群,然后 Standby ...
本文件“Hadoop分布式(高可用)部署配置文件”应包含所有必要的配置,以实现这一目标。现在,我们将深入探讨Hadoop HA的部署及其关键配置。 1. **NameNode HA**:Hadoop HA的核心是NameNode的高可用,通过设置两个...
为了解决这一问题,Hadoop引入了HA机制,通过设置两个NameNode实例(一个主动、一个被动),并利用共享存储(如Quorum Journal Manager,QJM)来同步状态信息,实现了NameNode的故障自动转移功能。 #### 集群环境...
Hadoop 2.6.0版本引入了高可用性(HA)特性,增强了系统的稳定性,而Zookeeper则作为协调服务,确保了分布式环境中的有序和一致性。HBase是基于Hadoop的数据存储系统,适用于实时读写的大数据操作。本文将详细阐述...
文档提到了三种实现 NN 高可用的方式,但最终选择了基于 QJM (Quorum Journal Manager) 的共享日志方案,具体步骤如下: 1. **Active NN** 将日志写入本地以及多个 JournalNode 上。 2. **Standby NN** 定期从 ...
通常使用共享文件系统如GFS或NFS,或者使用Quorum Journal Manager (QJM)。 3. **配置NameNode节点**:在每个NameNode的`hdfs-site.xml`配置文件中,需要设置`dfs.nameservices`,定义一个名称服务标识,然后分别...
这通常涉及到Quorum Journal Manager(QJM)和Zookeeper的配合使用。 4. **Resourcemanager高可用**:在YARN中,Resourcemanager负责任务调度和资源分配。同样,配置高可用模式可以防止单点故障,确保集群的持续...
这需要配置HA模式,包括设置共享的存储系统(如Quorum Journal Manager),并配置Zookeeper以监控NameNode状态。此外,还需要配置Hadoop的客户端,使它们能够正确地与主NameNode或备用NameNode交互。 **第七章 Hive...
本文的目的是为当前最新版本的Hadoop 2.8.0提供最为详细的安装说明,以帮助减少安装过程中遇到的困难,并对一些错误原因进行说明,hdfs配置使用基于QJM(Quorum Journal Manager)的HA。本文的安装只涉及了hadoop-...
4. **设置共享存储**:NameNode的元数据需要存储在一个共享的存储系统中,如NFS或Quorum Journal Manager(QJM)。在`hdfs-site.xml`中配置`dfs.journalnode.edits.dir`指向共享存储路径。 5. **配置Zookeeper**:...
- 使用Quorum Journal Manager (QJM)实现NameNode的高可用性。 - 高可用性集群需要硬件对等的NameNode和JournalNode机器。JournalNode应为奇数数量,如3、5或7台,以保证Quorum的形成。 - 配置`hdfs-site.xml`以...
HDFS HA解决方案之一是Quorum Journal Manager (QJM),由Cloudera公司提出并被官方推荐。QJM利用Zookeeper的ZKFC(Zookeeper-based Failover Controller)进行主备切换,并通过Journal Node (JN)集群实现Edits Log的...
通过使用Quorum Journal Manager(QJM),Hadoop实现了对共享存储设备的高可用访问,这允许Active NameNode和Standby NameNode对共享数据进行日志追加,而不会造成数据冲突。QJM使用一组JournalNode节点来确保日志的...
- **NameNode HA**:需要至少两台机器作为主NameNode,通过Quorum Journal Manager (QJM) 实现日志同步,确保数据的一致性。 - **Secondary NameNode**:不再承担主NameNode的备份角色,而是转变为CheckPoint Node...
在本文中,我们将详细讨论如何配置Hadoop HA版本,特别是使用Quorum Journal Manager (QJM) 实现HDFS的HA。 首先,我们需要理解Hadoop HA的基本架构。Hadoop HA主要涉及两个关键组件:NameNode和ResourceManager。...
此外,Hadoop的高可用性解决方案是通过Quorum Journal Manager (QJM)来实现的,NameNode之间的元数据同步依赖于JournalNode,确保数据的一致性。同时,Hadoop 2.6.4及更高版本引入了ResourceManager的高可用性,通过...
- **为共享存储使用Quorum Journal Manager**:更推荐使用QJM,它提供了更为可靠的多副本机制,通过多数派投票原则确保数据一致性。 3. **QuorumJournalManager的功能** QJM是HDFS HA的核心组件,它负责在多个...
- HA(High Availability):在2.7.1版本中,HDFS支持NameNode的高可用性,通过使用Secondary NameNode和Quorum Journal Manager实现,确保了服务的连续性。 - HDFS Federation:允许多个独立的命名空间并行运行在...
本文档详细介绍了如何利用Hadoop 2.6版本中的QJM(Quorum Journal Manager)和ZooKeeper来实现HDFS的高可用性。 #### 二、HDFS HA原理概述 HDFS HA (High Availability) 解决方案旨在解决NameNode单点故障问题。...