`
winse
  • 浏览: 94393 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

hadoop集群增加节点

阅读更多

hadoop的集群的优势,其中之一就是可以灵活的增加数据节点,简简单单的实现扩容!

 

1、 最好安装统一的操作系统。安装的时刻把防火墙关了!

 

2、 在新节点使用root用户,修改系统的一些参数

修改时间。

date -s 12:00:00

 

设置IP地址。

vi /etc/sysconfig/network-scripts/ifcfg-eth0
service network restart

 

修改host。

vi /etc/sysconfig/network
## 设置完以后不能立即见效,可以先使用hostname命令生效
hostname datanode-00003

 

新增用户hadoop。

useradd hadoop
passwd hadoop

 

修改hosts。

vi /etc/hosts

 

3、 新datanode适配到namenode。

切换到namenode节点机器

如果没有域名解析服务,这里需要用root用户来修改namenode的hosts文件,添加新节点的hostname和ip的对应。

vi /etc/hosts

 

拷贝jdk到新节点(最好不要使用系统自带的版本) 。

scp -r /opt/java/jdk1.6.0_29 datanode-00003:/opt/java

 

然后,从root用户切换到hadoop用户

 

修改HADOOP_HOME/conf/slaves文件,添加新节点的hostname(为了以后start/stop 统一管理hadoop)

vi conf/slaves

 

namenode无密钥登录datanode,执行(为了以后start/stop 统一管理hadoop)。

ssh-copy-id -i .ssh/id-rsa.pub datanode-00003
#然后输入新节点hadoop用户的密码即可。

 

拷贝hadoop程序到新节点。

rsync -vaz --delete --exclude=logs --exclude=log hadoop-1.0.0 datanode-00003:~/

 

4、 使用hadoop用户登录到新节点datanode-00003。

修改环境变量。

cd
vi .bashrc
## 添加JAVA_HOME/bin到PATH路径
# export JAVA_HOME=/opt/java/jdk1.6.0_29
# export PATH=$JAVA_HOME/bin:$PATH

source .bashrc

 

创建必要的目录(把hadoop的进程的pids文件保存的自定义的目录下,如果防止在tmp下,一段时间过后会被清除)。

mkdir /opt/cloud
mkdir /home/hadoop/pids/hadoop/pids

 

5、 启动新节点,加入到集群

有很多文章说使用hadoop-daemon.sh来启动:

在新机器上进入hadoop安装目录 
  $bin/hadoop-daemon.sh start datanode 
  $bin/hadoop-daemon.sh start tasktracker

 

其实,大可不必,使用hadoop登录到namenode,在namenode上执行start-all.sh即可。

bin/start-all.sh

启动节点的时刻,会检查是否已经启动,只会启动未启动的服务。

 

如果希望节点的数据平均点,可以执行:

bin/start-balancer.sh

 

 

参考资料:

1、 shell脚本自动修改IP信息 http://kerry.blog.51cto.com/172631/517921

2、 http://a280606790.iteye.com/blog/867532

3、 http://eclecl1314-163-com.iteye.com/blog/987732

4、 http://running.iteye.com/blog/906585

 

 

分享到:
评论

相关推荐

    基于多元线性回归模型的Hadoop集群节点性能计算方法.pdf

    "基于多元线性回归模型的Hadoop集群节点性能计算方法" 本文档介绍了一种基于多元线性回归模型的Hadoop集群节点性能计算方法,该方法可以对Hadoop集群节点的性能进行准确的评估和优化。 什么是Hadoop集群节点性能...

    hadoop集群安装笔记

    在安装Hadoop集群时,需要关闭防火墙,以便Hadoop节点之间可以通信。关闭防火墙可以确保Hadoop集群的正常运行。 关闭SELinux SELinux是Linux操作系统的安全模块,用于控制访问控制和权限管理。在安装Hadoop集群时...

    hadoop (多节点)环境搭建

    本文将详细介绍如何搭建多节点 Hadoop 环境,包括安装 Ubuntu 操作系统、安装 Hadoop 软件、配置 SSH 无密码登录、配置 Hadoop 集群等步骤。 一、安装 Ubuntu 操作系统 在开始搭建 Hadoop 环境之前,需要安装 ...

    Hadoop集群构建实训报告.doc

    ### Hadoop集群构建实训知识点详解 #### 一、运行平台构建 在构建Hadoop集群之前,需要对各台服务器进行必要的配置,确保集群能够稳定运行。主要包括修改主机名称、配置域名解析规则、关闭防火墙以及配置免密登录...

    利用ansible 自动 安装Hadoop 集群

    在该目录下,创建`hosts`文件,列出所有Hadoop集群节点的IP地址或主机名,按照角色进行分组,例如,`namenode`、`datanode`等。 3. **编写Playbook**:创建`site.yml`或`hadoop-cluster.yml`文件,这是Ansible的...

    Hadoop集群架构搭建分析

    Hadoop 集群架构搭建分析 Hadoop 集群架构搭建分析是指设计和搭建一个高效、可靠、可扩展的 Hadoop 集群环境,以满足大数据处理和分析的需求。本文将从概述、环境准备、环境搭建三个方面对 Hadoop 集群架构搭建进行...

    Hadoop集群程序设计与开发教材最终代码.zip

    《Hadoop集群程序设计与开发教材最终代码》这个压缩包文件是针对学习和理解Hadoop分布式计算框架的重要教学资源。Hadoop是Apache软件基金会开发的一个开源项目,它为大规模数据处理提供了一种分布式、容错性强的解决...

    细细品味Hadoop_Hadoop集群(第9期)_MapReduce初级案例

    这个“细细品味Hadoop_Hadoop集群(第9期)_MapReduce初级案例”主题聚焦于Hadoop集群的核心组件——MapReduce,这是一种分布式计算模型,对于处理海量数据具有重要作用。 MapReduce的工作原理可以分为两个主要阶段...

    hadoop集群安装、配置、维护文档

    这个文档可能涵盖了向现有Hadoop集群添加新节点的过程。这涉及到几个步骤,如在新节点上安装Java环境,下载与集群版本匹配的Hadoop软件包,配置节点的`/etc/hosts`文件以确保网络通信,更新集群的配置文件(如`core...

    Hadoop集群搭建(全)

    Hadoop集群搭建详解 Hadoop是一个开源的分布式计算平台,由 Apache 软件基金会开发,核心组件包括HDFS(Hadoop Distributed Filesystem)和MapReduce。HDFS是一个分布式文件系统,提供了对文件系统的命名空间和...

    大数据教程之搭建Hadoop集群.zip_大数据环境搭建hadoop

    3. "细细品味Hadoop_Hadoop集群(第4期)_SecureCRT使用.pdf":SecureCRT是一款远程终端工具,用于SSH连接,文件可能教读者如何使用SecureCRT来管理Hadoop集群中的节点。 4. "细细品味Hadoop_Hadoop集群(第5期)_...

    hadoop集群搭建(超级详细)

    本文将详细讲解如何搭建一个Hadoop集群,包括虚拟机安装、环境配置、Hadoop和Zookeeper的安装及集群验证。以下是对每个步骤的详细说明: 一、虚拟机安装与配置 在搭建Hadoop集群之前,首先需要准备多台虚拟机。可以...

    Hadoop集群搭建部署与MapReduce程序关键点个性化开发.doc

    本文将详细阐述如何搭建Hadoop集群以及进行MapReduce程序的关键点个性化开发。 首先,我们来看任务1——Hadoop集群的部署。这一步至关重要,因为它为整个大数据处理系统提供了基础架构。在虚拟机中安装Ubuntu Kylin...

    Hadoop集群(zookeeper框架下)增加服役节点_step-b-step.docx

    本文档详细介绍了在Zookeeper集群管理下的Hadoop集群如何逐步添加服役节点,以实现集群扩容。 首先,我们需要了解当前的集群环境。在本例中,Hadoop集群由9个节点组成,其中包括2个主节点,而Zookeeper集群分布在3...

    Hadoop集群资源硬件建议

    Hadoop集群通常包含三种类型的节点:管理节点、数据节点和边缘节点。不同类型的节点对硬件的要求有所不同: - **管理节点**:负责提供关键的集群管理服务,如NameNode、JobTracker等。这些节点通常需要更高的可靠性...

    Hadoop集群搭建详细简明教程

    通常,Hadoop集群由一台NameNode(主节点)和多台DataNode(工作节点)组成。NameNode负责管理文件系统的命名空间和块信息,而DataNode则存储实际的数据块。你需要确保所有机器之间有良好的网络连接,并分配足够的...

    hadoop集群信息

    搭建高可用的Hadoop集群,基于NFS共享磁盘的namenode配置,使用zookeeper进行主节点推举

Global site tag (gtag.js) - Google Analytics