`
亦梦亦真
  • 浏览: 228327 次
  • 性别: Icon_minigender_1
  • 来自: 秦皇岛
社区版块
存档分类
最新评论

hadoop集群添加新节点

阅读更多
Hadoop添加节点的方法
1.将cluster停止。
2. 在新加的节点上配置好环境,包括ssh,jdk,并将其它datanode上的hadoop和hbase文件夹全部copy过去;
3. 将新的datanode的host加到集群namenode及其他datanode中去;
4. 将新的datanode的host加到master的conf/slaves中;
5. 再次启动cluster,在cluster中看到新的datanode节点;
5. 运行bin/start-balancer.sh,平衡数据。
备注:
1.balance是为了平衡数据,如果不执行该命令,cluster将会把新的数据都存放在新的datanode上,这样,造成分布不平衡,影响mr的工作效率。
2. start-balancer.sh和调用bin/shadoop balancer命令相似,也可加参数 -threshold 5(
   threshold 是平衡阈值,默认是10%,值越低各节点越平衡,但消耗时间也更长)。
3. balancer也可以在有mr job的cluster上运行,默认dfs.balance.bandwidthPerSec很低,为1M/s。在没有mr job时,可以提高该设置加快负载均衡时间。
4.如果cluster设置的副本数不为3(默认),需要先运行命令hadoop fs –setrep [-R] <path>
进行设置一个文件的副本系数。如果默认为3则不必。如果执行完平衡以后才改变副本数,会将新加入到新节点上的所有数据删除。
5.dfs.replication设置的副本系数只在文件系统写入时有效,并不影响在新添加节点时,平衡时的副本数
由于还有hbase数据库,因此,在运行完平衡以后,将hbase下的.META.文件删除(防止出错),启动hbase,执行hbase org.jruby.Main add_table /表名 来进行hbase表恢复
1
2
分享到:
评论
1 楼 Faeries 2013-07-20  

相关推荐

    hadoop集群安装、配置、维护文档

    这个文档可能涵盖了向现有Hadoop集群添加新节点的过程。这涉及到几个步骤,如在新节点上安装Java环境,下载与集群版本匹配的Hadoop软件包,配置节点的`/etc/hosts`文件以确保网络通信,更新集群的配置文件(如`core...

    利用ansible 自动 安装Hadoop 集群

    在该目录下,创建`hosts`文件,列出所有Hadoop集群节点的IP地址或主机名,按照角色进行分组,例如,`namenode`、`datanode`等。 3. **编写Playbook**:创建`site.yml`或`hadoop-cluster.yml`文件,这是Ansible的...

    基于多元线性回归模型的Hadoop集群节点性能计算方法.pdf

    "基于多元线性回归模型的Hadoop集群节点性能计算方法" 本文档介绍了一种基于多元线性回归模型的Hadoop集群节点性能计算方法,该方法可以对Hadoop集群节点的性能进行准确的评估和优化。 什么是Hadoop集群节点性能...

    Hadoop集群构建实训报告.doc

    ### Hadoop集群构建实训知识点详解 #### 一、运行平台构建 在构建Hadoop集群之前,需要对各台服务器进行必要的配置,确保集群能够稳定运行。主要包括修改主机名称、配置域名解析规则、关闭防火墙以及配置免密登录...

    Hadoop和Spark多节点集群搭建:从入门到进阶0基础!!易懂!!

    Hadoop和Spark多节点集群搭建Hadoop和Spark多节点集群搭建Hadoop和Spark多节点集群搭建Hadoop和Spark多节点集群搭建Hadoop和Spark多节点集群搭建Hadoop和Spark多节点集群搭建Hadoop和Spark多节点集群搭建Hadoop和...

    Hadoop集群架构搭建分析

    Hadoop 集群架构搭建分析 Hadoop 集群架构搭建分析是指设计和搭建一个高效、可靠、可扩展的 Hadoop 集群环境,以满足大数据处理和分析的需求。本文将从概述、环境准备、环境搭建三个方面对 Hadoop 集群架构搭建进行...

    Hadoop集群程序设计与开发教材最终代码.zip

    《Hadoop集群程序设计与开发教材最终代码》这个压缩包文件是针对学习和理解Hadoop分布式计算框架的重要教学资源。Hadoop是Apache软件基金会开发的一个开源项目,它为大规模数据处理提供了一种分布式、容错性强的解决...

    大数据教程之搭建Hadoop集群.zip_大数据环境搭建hadoop

    3. "细细品味Hadoop_Hadoop集群(第4期)_SecureCRT使用.pdf":SecureCRT是一款远程终端工具,用于SSH连接,文件可能教读者如何使用SecureCRT来管理Hadoop集群中的节点。 4. "细细品味Hadoop_Hadoop集群(第5期)_...

    Centos7.0系统配置Hadoop集群(以3节点为例)

    Centos7.0系统下配置Hadoop集群(以3节点为例)超详细过程

    细细品味Hadoop_Hadoop集群(第9期)_MapReduce初级案例

    这个“细细品味Hadoop_Hadoop集群(第9期)_MapReduce初级案例”主题聚焦于Hadoop集群的核心组件——MapReduce,这是一种分布式计算模型,对于处理海量数据具有重要作用。 MapReduce的工作原理可以分为两个主要阶段...

    hadoop (多节点)环境搭建

    本文将详细介绍如何搭建多节点 Hadoop 环境,包括安装 Ubuntu 操作系统、安装 Hadoop 软件、配置 SSH 无密码登录、配置 Hadoop 集群等步骤。 一、安装 Ubuntu 操作系统 在开始搭建 Hadoop 环境之前,需要安装 ...

    Hadoop集群(zookeeper框架下)增加服役节点_step-b-step.docx

    本文档详细介绍了在Zookeeper集群管理下的Hadoop集群如何逐步添加服役节点,以实现集群扩容。 首先,我们需要了解当前的集群环境。在本例中,Hadoop集群由9个节点组成,其中包括2个主节点,而Zookeeper集群分布在3...

    Hadoop集群搭建(全)

    Hadoop集群搭建详解 Hadoop是一个开源的分布式计算平台,由 Apache 软件基金会开发,核心组件包括HDFS(Hadoop Distributed Filesystem)和MapReduce。HDFS是一个分布式文件系统,提供了对文件系统的命名空间和...

    Hadoop集群搭建详细简明教程

    通常,Hadoop集群由一台NameNode(主节点)和多台DataNode(工作节点)组成。NameNode负责管理文件系统的命名空间和块信息,而DataNode则存储实际的数据块。你需要确保所有机器之间有良好的网络连接,并分配足够的...

    Hadoop集群资源硬件建议

    ### Hadoop集群资源硬件建议 #### 一、Hadoop集群硬件配置的重要性 ...此外,随着技术的发展,未来Hadoop集群的硬件配置可能会出现新的趋势,例如采用更先进的存储技术和网络设备来进一步提高性能和降低成本。

    hadoop集群搭建(超级详细)

    本文将详细讲解如何搭建一个Hadoop集群,包括虚拟机安装、环境配置、Hadoop和Zookeeper的安装及集群验证。以下是对每个步骤的详细说明: 一、虚拟机安装与配置 在搭建Hadoop集群之前,首先需要准备多台虚拟机。可以...

Global site tag (gtag.js) - Google Analytics