`

为Hadoop集群增加新节点

阅读更多

2012-09-20

 

前言

为一个已存在的Hadoop集群添加新节点,非常简单。可以算即插即用。

      首先是要遵循一个规则,集群中的所有机器的Hadoop涉及到的配置位置要一致:安装路径,JDK(使用的版本与安装路径),所属用户与群组。

      然后开始做下面的事情:

 

步骤

1. 拷贝一份集群上都用的hadoop包到新节点机器上的指定路径上。我建议一直有一份这样的干净的文件存在某个地方,以便不时之需。记得修改文件的拥有者

 

2. 拷贝集群使用的JDK到指定目录下。顺便说一句,集群使用的JAVA_HOME参数是由%HADOOP_HOME%/conf/hadoop-env.sh里指定的。

 

3. 修改该机器上hadoop对应用户的authorized_keys,使得namenode可以不需要密码进行访问该机器。

 

4. 在各节点的/etc/hosts上添加对应的ip与主机名。

 

5. 修改namenode的slaves文件。增加新节点的ip或者主机名

 

6. 在新节点上启动hadoop。

     %HADOOP_HOME/bin/hadoop-daemon.sh start datanode

     %HADOOP_HOME/bin/hadoop-daemon.sh start tasktracker

 

7.使用hadoop dfsadmin命令集来刷新集群信息

     hadoop dfsadmin -refreshNodes

 

8. 完成。

     如果有问题的话,可以到新节点的日志里进行查看,并分析。

 

问题集锦

1.  JAVA_HOME is not set.

解决:

看看%HADOOP_HOME%/conf/hadoop-env.sh的配置,想很久才明白,原来不是使用系统默认的JAVA_HOME而是这个文件里的配置。

 

2. 在namenode上用stop-all.sh关闭集群时,新节点要求输入密码。

解决:

修改新节点的hadoop对应用户的authorized_keys,使得namenode可以不需要密码进行访问该机器。

 

3. 启动jobtracker失败

现象:

org.apache.hadoop.security.AccessControlException: org.apache.hadoop.security.AccessControlException: Permission denied: user=mapred, access=WRITE, inode="/":hdfs:supergroup: ...

解决:

在hdfs上创建mapred.system.dir(该值一般指定在mapred-site.xml中)对应的目录,并赋予对应权限。

 

分享到:
评论

相关推荐

    hadoop集群安装笔记

    在安装Hadoop集群时,需要关闭防火墙,以便Hadoop节点之间可以通信。关闭防火墙可以确保Hadoop集群的正常运行。 关闭SELinux SELinux是Linux操作系统的安全模块,用于控制访问控制和权限管理。在安装Hadoop集群时...

    利用ansible 自动 安装Hadoop 集群

    在该目录下,创建`hosts`文件,列出所有Hadoop集群节点的IP地址或主机名,按照角色进行分组,例如,`namenode`、`datanode`等。 3. **编写Playbook**:创建`site.yml`或`hadoop-cluster.yml`文件,这是Ansible的...

    基于多元线性回归模型的Hadoop集群节点性能计算方法.pdf

    "基于多元线性回归模型的Hadoop集群节点性能计算方法" 本文档介绍了一种基于多元线性回归模型的Hadoop集群节点性能计算方法,该方法可以对Hadoop集群节点的性能进行准确的评估和优化。 什么是Hadoop集群节点性能...

    Centos7.0系统配置Hadoop集群(以3节点为例)

    Centos7.0系统下配置Hadoop集群(以3节点为例)超详细过程

    hadoop集群安装、配置、维护文档

    本文将深入探讨在标题为“hadoop集群安装、配置、维护文档”的压缩包中涉及的关键知识点,包括如何安装、配置Hadoop集群,以及相关的维护技巧。我们将依次讨论每个文件所涵盖的主题。 1. **hadoop增加节点.txt**: ...

    Hadoop集群(zookeeper框架下)增加服役节点_step-b-step.docx

    总结来说,Hadoop集群在Zookeeper框架下的扩容过程涉及了主机名配置、SSH免密登录、JDK和Hadoop的安装、Zookeeper节点的更新,以及启动新节点的服务。每一步都是为了确保新节点能够无缝地融入到现有集群中,提供扩展...

    Hadoop集群构建实训报告.doc

    ### Hadoop集群构建实训知识点详解 #### 一、运行平台构建 在构建Hadoop集群之前,需要对各台服务器进行必要的配置,确保集群能够稳定运行。主要包括修改主机名称、配置域名解析规则、关闭防火墙以及配置免密登录...

    Hadoop和Spark多节点集群搭建:从入门到进阶0基础!!易懂!!

    Hadoop和Spark多节点集群搭建Hadoop和Spark多节点集群搭建Hadoop和Spark多节点集群搭建Hadoop和Spark多节点集群搭建Hadoop和Spark多节点集群搭建Hadoop和Spark多节点集群搭建Hadoop和Spark多节点集群搭建Hadoop和...

    Hadoop集群程序设计与开发教材最终代码.zip

    《Hadoop集群程序设计与开发教材最终代码》这个压缩包文件是针对学习和理解Hadoop分布式计算框架的重要教学资源。Hadoop是Apache软件基金会开发的一个开源项目,它为大规模数据处理提供了一种分布式、容错性强的解决...

    Hadoop集群架构搭建分析

    Hadoop 集群架构搭建分析 Hadoop 集群架构搭建分析是指设计和搭建一个高效、可靠、可扩展的 Hadoop 集群环境,以满足大数据处理和分析的需求。本文将从概述、环境准备、环境搭建三个方面对 Hadoop 集群架构搭建进行...

    细细品味Hadoop_Hadoop集群(第9期)_MapReduce初级案例

    这个“细细品味Hadoop_Hadoop集群(第9期)_MapReduce初级案例”主题聚焦于Hadoop集群的核心组件——MapReduce,这是一种分布式计算模型,对于处理海量数据具有重要作用。 MapReduce的工作原理可以分为两个主要阶段...

    大数据教程之搭建Hadoop集群.zip_大数据环境搭建hadoop

    3. "细细品味Hadoop_Hadoop集群(第4期)_SecureCRT使用.pdf":SecureCRT是一款远程终端工具,用于SSH连接,文件可能教读者如何使用SecureCRT来管理Hadoop集群中的节点。 4. "细细品味Hadoop_Hadoop集群(第5期)_...

    hadoop集群搭建文档资料

    2. **Hadoop集群架构**:Hadoop集群通常包含一个NameNode(主节点),多个DataNode(数据节点)和一个Secondary NameNode(辅助NameNode)。NameNode负责元数据管理,DataNode存储实际数据,而Secondary NameNode...

    hadoop (多节点)环境搭建

    本文将详细介绍如何搭建多节点 Hadoop 环境,包括安装 Ubuntu 操作系统、安装 Hadoop 软件、配置 SSH 无密码登录、配置 Hadoop 集群等步骤。 一、安装 Ubuntu 操作系统 在开始搭建 Hadoop 环境之前,需要安装 ...

    Hadoop集群搭建(全)

    Hadoop集群搭建详解 Hadoop是一个开源的分布式计算平台,由 Apache 软件基金会开发,核心组件包括HDFS(Hadoop Distributed Filesystem)和MapReduce。HDFS是一个分布式文件系统,提供了对文件系统的命名空间和...

    hadoop集群搭建(超级详细)

    本文将详细讲解如何搭建一个Hadoop集群,包括虚拟机安装、环境配置、Hadoop和Zookeeper的安装及集群验证。以下是对每个步骤的详细说明: 一、虚拟机安装与配置 在搭建Hadoop集群之前,首先需要准备多台虚拟机。可以...

    Hadoop集群搭建详细简明教程

    通常,Hadoop集群由一台NameNode(主节点)和多台DataNode(工作节点)组成。NameNode负责管理文件系统的命名空间和块信息,而DataNode则存储实际的数据块。你需要确保所有机器之间有良好的网络连接,并分配足够的...

Global site tag (gtag.js) - Google Analytics