`

为Hadoop集群增加新节点

 
阅读更多

2012-09-20

 

前言

为一个已存在的Hadoop集群添加新节点,非常简单。可以算即插即用。

      首先是要遵循一个规则,集群中的所有机器的Hadoop涉及到的配置位置要一致:安装路径,JDK(使用的版本与安装路径),所属用户与群组。

      然后开始做下面的事情:

 

步骤

1. 拷贝一份集群上都用的hadoop包到新节点机器上的指定路径上。我建议一直有一份这样的干净的文件存在某个地方,以便不时之需。记得修改文件的拥有者

 

2. 拷贝集群使用的JDK到指定目录下。顺便说一句,集群使用的JAVA_HOME参数是由%HADOOP_HOME%/conf/hadoop-env.sh里指定的。

 

3. 修改该机器上hadoop对应用户的authorized_keys,使得namenode可以不需要密码进行访问该机器。

 

4. 在各节点的/etc/hosts上添加对应的ip与主机名。

 

5. 修改namenode的slaves文件。增加新节点的ip或者主机名

 

6. 在新节点上启动hadoop。

     %HADOOP_HOME/bin/hadoop-daemon.sh start datanode

     %HADOOP_HOME/bin/hadoop-daemon.sh start tasktracker

 

7.使用hadoop dfsadmin命令集来刷新集群信息

     hadoop dfsadmin -refreshNodes

 

8. 完成。

     如果有问题的话,可以到新节点的日志里进行查看,并分析。

 

问题集锦

1.  JAVA_HOME is not set.

解决:

看看%HADOOP_HOME%/conf/hadoop-env.sh的配置,想很久才明白,原来不是使用系统默认的JAVA_HOME而是这个文件里的配置。

 

2. 在namenode上用stop-all.sh关闭集群时,新节点要求输入密码。

解决:

修改新节点的hadoop对应用户的authorized_keys,使得namenode可以不需要密码进行访问该机器。

 

3. 启动jobtracker失败

现象:

org.apache.hadoop.security.AccessControlException: org.apache.hadoop.security.AccessControlException: Permission denied: user=mapred, access=WRITE, inode="/":hdfs:supergroup: ...

解决:

在hdfs上创建mapred.system.dir(该值一般指定在mapred-site.xml中)对应的目录,并赋予对应权限。

 

分享到:
评论

相关推荐

    利用ansible 自动 安装Hadoop 集群

    在该目录下,创建`hosts`文件,列出所有Hadoop集群节点的IP地址或主机名,按照角色进行分组,例如,`namenode`、`datanode`等。 3. **编写Playbook**:创建`site.yml`或`hadoop-cluster.yml`文件,这是Ansible的...

    基于多元线性回归模型的Hadoop集群节点性能计算方法.pdf

    "基于多元线性回归模型的Hadoop集群节点性能计算方法" 本文档介绍了一种基于多元线性回归模型的Hadoop集群节点性能计算方法,该方法可以对Hadoop集群节点的性能进行准确的评估和优化。 什么是Hadoop集群节点性能...

    Centos7.0系统配置Hadoop集群(以3节点为例)

    Centos7.0系统下配置Hadoop集群(以3节点为例)超详细过程

    hadoop集群安装、配置、维护文档

    本文将深入探讨在标题为“hadoop集群安装、配置、维护文档”的压缩包中涉及的关键知识点,包括如何安装、配置Hadoop集群,以及相关的维护技巧。我们将依次讨论每个文件所涵盖的主题。 1. **hadoop增加节点.txt**: ...

    Hadoop集群(zookeeper框架下)增加服役节点_step-b-step.docx

    总结来说,Hadoop集群在Zookeeper框架下的扩容过程涉及了主机名配置、SSH免密登录、JDK和Hadoop的安装、Zookeeper节点的更新,以及启动新节点的服务。每一步都是为了确保新节点能够无缝地融入到现有集群中,提供扩展...

    Hadoop集群构建实训报告.doc

    ### Hadoop集群构建实训知识点详解 #### 一、运行平台构建 在构建Hadoop集群之前,需要对各台服务器进行必要的配置,确保集群能够稳定运行。主要包括修改主机名称、配置域名解析规则、关闭防火墙以及配置免密登录...

    Hadoop和Spark多节点集群搭建:从入门到进阶0基础!!易懂!!

    Hadoop和Spark多节点集群搭建Hadoop和Spark多节点集群搭建Hadoop和Spark多节点集群搭建Hadoop和Spark多节点集群搭建Hadoop和Spark多节点集群搭建Hadoop和Spark多节点集群搭建Hadoop和Spark多节点集群搭建Hadoop和...

    Hadoop集群程序设计与开发教材最终代码.zip

    《Hadoop集群程序设计与开发教材最终代码》这个压缩包文件是针对学习和理解Hadoop分布式计算框架的重要教学资源。Hadoop是Apache软件基金会开发的一个开源项目,它为大规模数据处理提供了一种分布式、容错性强的解决...

    Hadoop集群架构搭建分析

    Hadoop 集群架构搭建分析 Hadoop 集群架构搭建分析是指设计和搭建一个高效、可靠、可扩展的 Hadoop 集群环境,以满足大数据处理和分析的需求。本文将从概述、环境准备、环境搭建三个方面对 Hadoop 集群架构搭建进行...

    细细品味Hadoop_Hadoop集群(第9期)_MapReduce初级案例

    这个“细细品味Hadoop_Hadoop集群(第9期)_MapReduce初级案例”主题聚焦于Hadoop集群的核心组件——MapReduce,这是一种分布式计算模型,对于处理海量数据具有重要作用。 MapReduce的工作原理可以分为两个主要阶段...

    大数据教程之搭建Hadoop集群.zip_大数据环境搭建hadoop

    3. "细细品味Hadoop_Hadoop集群(第4期)_SecureCRT使用.pdf":SecureCRT是一款远程终端工具,用于SSH连接,文件可能教读者如何使用SecureCRT来管理Hadoop集群中的节点。 4. "细细品味Hadoop_Hadoop集群(第5期)_...

    hadoop集群搭建文档资料

    2. **Hadoop集群架构**:Hadoop集群通常包含一个NameNode(主节点),多个DataNode(数据节点)和一个Secondary NameNode(辅助NameNode)。NameNode负责元数据管理,DataNode存储实际数据,而Secondary NameNode...

    hadoop (多节点)环境搭建

    本文将详细介绍如何搭建多节点 Hadoop 环境,包括安装 Ubuntu 操作系统、安装 Hadoop 软件、配置 SSH 无密码登录、配置 Hadoop 集群等步骤。 一、安装 Ubuntu 操作系统 在开始搭建 Hadoop 环境之前,需要安装 ...

    Hadoop集群搭建(全)

    Hadoop集群搭建详解 Hadoop是一个开源的分布式计算平台,由 Apache 软件基金会开发,核心组件包括HDFS(Hadoop Distributed Filesystem)和MapReduce。HDFS是一个分布式文件系统,提供了对文件系统的命名空间和...

    Hadoop集群搭建详细简明教程

    通常,Hadoop集群由一台NameNode(主节点)和多台DataNode(工作节点)组成。NameNode负责管理文件系统的命名空间和块信息,而DataNode则存储实际的数据块。你需要确保所有机器之间有良好的网络连接,并分配足够的...

    Hadoop集群资源硬件建议

    ### Hadoop集群资源硬件建议 #### 一、Hadoop集群硬件配置的重要性 ...此外,随着技术的发展,未来Hadoop集群的硬件配置可能会出现新的趋势,例如采用更先进的存储技术和网络设备来进一步提高性能和降低成本。

Global site tag (gtag.js) - Google Analytics