2012-09-20
前言
为一个已存在的Hadoop集群添加新节点,非常简单。可以算即插即用。
首先是要遵循一个规则,集群中的所有机器的Hadoop涉及到的配置位置要一致:安装路径,JDK(使用的版本与安装路径),所属用户与群组。
然后开始做下面的事情:
步骤
1. 拷贝一份集群上都用的hadoop包到新节点机器上的指定路径上。我建议一直有一份这样的干净的文件存在某个地方,以便不时之需。记得修改文件的拥有者。
2. 拷贝集群使用的JDK到指定目录下。顺便说一句,集群使用的JAVA_HOME参数是由%HADOOP_HOME%/conf/hadoop-env.sh里指定的。
3. 修改该机器上hadoop对应用户的authorized_keys,使得namenode可以不需要密码进行访问该机器。
4. 在各节点的/etc/hosts上添加对应的ip与主机名。
5. 修改namenode的slaves文件。增加新节点的ip或者主机名
6. 在新节点上启动hadoop。
%HADOOP_HOME/bin/hadoop-daemon.sh start datanode
%HADOOP_HOME/bin/hadoop-daemon.sh start tasktracker
7.使用hadoop dfsadmin命令集来刷新集群信息
hadoop dfsadmin -refreshNodes
8. 完成。
如果有问题的话,可以到新节点的日志里进行查看,并分析。
问题集锦
1. JAVA_HOME is not set.
解决:
看看%HADOOP_HOME%/conf/hadoop-env.sh的配置,想很久才明白,原来不是使用系统默认的JAVA_HOME而是这个文件里的配置。
2. 在namenode上用stop-all.sh关闭集群时,新节点要求输入密码。
解决:
修改新节点的hadoop对应用户的authorized_keys,使得namenode可以不需要密码进行访问该机器。
3. 启动jobtracker失败
现象:
org.apache.hadoop.security.AccessControlException: org.apache.hadoop.security.AccessControlException: Permission denied: user=mapred, access=WRITE, inode="/":hdfs:supergroup: ...
解决:
在hdfs上创建mapred.system.dir(该值一般指定在mapred-site.xml中)对应的目录,并赋予对应权限。
相关推荐
在安装Hadoop集群时,需要关闭防火墙,以便Hadoop节点之间可以通信。关闭防火墙可以确保Hadoop集群的正常运行。 关闭SELinux SELinux是Linux操作系统的安全模块,用于控制访问控制和权限管理。在安装Hadoop集群时...
在该目录下,创建`hosts`文件,列出所有Hadoop集群节点的IP地址或主机名,按照角色进行分组,例如,`namenode`、`datanode`等。 3. **编写Playbook**:创建`site.yml`或`hadoop-cluster.yml`文件,这是Ansible的...
"基于多元线性回归模型的Hadoop集群节点性能计算方法" 本文档介绍了一种基于多元线性回归模型的Hadoop集群节点性能计算方法,该方法可以对Hadoop集群节点的性能进行准确的评估和优化。 什么是Hadoop集群节点性能...
Centos7.0系统下配置Hadoop集群(以3节点为例)超详细过程
本文将深入探讨在标题为“hadoop集群安装、配置、维护文档”的压缩包中涉及的关键知识点,包括如何安装、配置Hadoop集群,以及相关的维护技巧。我们将依次讨论每个文件所涵盖的主题。 1. **hadoop增加节点.txt**: ...
总结来说,Hadoop集群在Zookeeper框架下的扩容过程涉及了主机名配置、SSH免密登录、JDK和Hadoop的安装、Zookeeper节点的更新,以及启动新节点的服务。每一步都是为了确保新节点能够无缝地融入到现有集群中,提供扩展...
### Hadoop集群构建实训知识点详解 #### 一、运行平台构建 在构建Hadoop集群之前,需要对各台服务器进行必要的配置,确保集群能够稳定运行。主要包括修改主机名称、配置域名解析规则、关闭防火墙以及配置免密登录...
Hadoop和Spark多节点集群搭建Hadoop和Spark多节点集群搭建Hadoop和Spark多节点集群搭建Hadoop和Spark多节点集群搭建Hadoop和Spark多节点集群搭建Hadoop和Spark多节点集群搭建Hadoop和Spark多节点集群搭建Hadoop和...
《Hadoop集群程序设计与开发教材最终代码》这个压缩包文件是针对学习和理解Hadoop分布式计算框架的重要教学资源。Hadoop是Apache软件基金会开发的一个开源项目,它为大规模数据处理提供了一种分布式、容错性强的解决...
Hadoop 集群架构搭建分析 Hadoop 集群架构搭建分析是指设计和搭建一个高效、可靠、可扩展的 Hadoop 集群环境,以满足大数据处理和分析的需求。本文将从概述、环境准备、环境搭建三个方面对 Hadoop 集群架构搭建进行...
这个“细细品味Hadoop_Hadoop集群(第9期)_MapReduce初级案例”主题聚焦于Hadoop集群的核心组件——MapReduce,这是一种分布式计算模型,对于处理海量数据具有重要作用。 MapReduce的工作原理可以分为两个主要阶段...
3. "细细品味Hadoop_Hadoop集群(第4期)_SecureCRT使用.pdf":SecureCRT是一款远程终端工具,用于SSH连接,文件可能教读者如何使用SecureCRT来管理Hadoop集群中的节点。 4. "细细品味Hadoop_Hadoop集群(第5期)_...
2. **Hadoop集群架构**:Hadoop集群通常包含一个NameNode(主节点),多个DataNode(数据节点)和一个Secondary NameNode(辅助NameNode)。NameNode负责元数据管理,DataNode存储实际数据,而Secondary NameNode...
本文将详细介绍如何搭建多节点 Hadoop 环境,包括安装 Ubuntu 操作系统、安装 Hadoop 软件、配置 SSH 无密码登录、配置 Hadoop 集群等步骤。 一、安装 Ubuntu 操作系统 在开始搭建 Hadoop 环境之前,需要安装 ...
Hadoop集群搭建详解 Hadoop是一个开源的分布式计算平台,由 Apache 软件基金会开发,核心组件包括HDFS(Hadoop Distributed Filesystem)和MapReduce。HDFS是一个分布式文件系统,提供了对文件系统的命名空间和...
本文将详细讲解如何搭建一个Hadoop集群,包括虚拟机安装、环境配置、Hadoop和Zookeeper的安装及集群验证。以下是对每个步骤的详细说明: 一、虚拟机安装与配置 在搭建Hadoop集群之前,首先需要准备多台虚拟机。可以...
通常,Hadoop集群由一台NameNode(主节点)和多台DataNode(工作节点)组成。NameNode负责管理文件系统的命名空间和块信息,而DataNode则存储实际的数据块。你需要确保所有机器之间有良好的网络连接,并分配足够的...