`

hadoop动态增加删除节点

 
阅读更多

在master的conf/hdfs-site.xml中加入

<property> <name>dfs.hosts.exclude</name> <value>excludes</value> </property>

在$HADOOP_HOME下创建exclueds文件

文件内容增加你想删除的节点,一行一个

/bin/hadoop dfsadmin -refreshNodes命令刷新datanode例表

/bin/hadoop dfsadmin -report查看结果

Datanodes available: 1 (1 total, 0 dead)


Name: 192.168.200.118:50010
Decommission Status : Decommission in progress
Configured Capacity: 211370565632 (196.85 GB)
DFS Used: 11459694592 (10.67 GB)
Non DFS Used: 187135799296 (174.28 GB)
DFS Remaining: 12775071744(11.9 GB)
DFS Used%: 5.42%
DFS Remaining%: 6.04%
Last contact: Wed Feb 22 23:51:48 PST 2012

在Decommission Status : Decommission in progress变为 Decommission Status : Decommission normal前mapreduce会异常

增加节点

在/conf/slaver文件中加入节点的hostname

在每个节点的hosts文件中加入新节点的hostname

在新节点的机器上执

/bin/./hadoop-daemon.sh start datanode

/bin/././hadoop-daemon.sh start tasktracker

 

数据负载均衡

1. 在Hadoop集群中新添加一个Datanode时,需要对集群数据进行负载均衡。

2. 在主节点运行bin/start-balancer.sh命令,可以添加参数-threshold 5,threshold是平衡阈值,默认是10%,值越小负载越均衡,但需要更长的时间去执行。

3. 添加s140到集群,执行负载均衡半个小时共负载了4G的数据

分享到:
评论

相关推荐

    2.Hadoop动态增加节点与删除节点

    Hadoop动态增加节点与删除节点,本人自己整理。。

    hadoop动态增加和删除节点方法介绍

    当面临数据量的增长或者硬件资源的变化时,动态增加和删除节点的能力是集群管理的关键。本篇文章将详细阐述如何在Hadoop集群中实现动态增加DataNode和删除DataNode的操作。 **一、动态增加DataNode** 在Hadoop集群...

    Hadoop集群中动态增加和减少机器

    ### Hadoop集群中动态增加和减少机器 #### 知识点一:Hadoop集群概述 - **定义**:Hadoop是一种能够对大量数据进行分布式处理的软件框架,它设计用于运行于由一般商用硬件构成的大规模集群之上。 - **组成**:主要...

    Cloudera Hadoop 5&amp;Hadoop高阶管理及调优课程

    1、Hadoop2.0高阶运维,包括Hadoop节点增加删除、HDFS和YARN的HA实现, HDFS Federation实现等 2、搭建本地Yum部署CDH5的重要组件和优化配置 3、Impala、Oozie和Hue的部署、使用操作及调优 4、Hadoop安全认证及授权...

    hbase安装,节点添加,移除,常见问题解决

    接下来是HBase节点的动态添加与移除: 1. 添加节点:在新节点上完成HBase的安装和配置,然后将该节点加入到Hadoop集群中。更新HBase的`regionservers`文件,添加新节点的主机名。重启HMaster服务,HBase会自动分配...

    hadoop节点问题.docx

    ### Hadoop节点问题详解 #### 一、问题背景与概述 在Hadoop集群环境中,启动过程中可能会遇到某些关键节点未能正常启动的问题。例如,在启动Hadoop集群时,可能会遇到NameNode无法正常启动的情况。此类问题可能由...

    大数据--Hadoop HDFS

    - **可扩展性**:支持动态添加或删除节点,以适应不同规模的数据处理需求。 - **高吞吐量**:适用于大数据的批量处理,提供了高效的读写性能。 - **支持流式数据访问**:非常适合处理大规模数据集,支持高速流式数据...

    hadoop2.8 window支持bin文件

    `HADOOP_HOME`指向你的Hadoop安装目录,`PATH`中添加`%HADOOP_HOME%\bin`,确保能直接运行bin目录下的命令,`JAVA_HOME`则是指向Java运行环境的路径,因为Hadoop是基于Java开发的。 对于Hadoop的本地模式(Local ...

    hadoop集群维护手册.pdf

    2. 在 Hadoop Namenode 的配置文件中添加新节点的主机名。 3. 执行 bin/start-all.sh 命令启动集群。 4. 等待数据平衡完成。 三、数据平衡 数据平衡是 Hadoop 集群维护的重要一步骤。可以使用 start-balancer.sh ...

    hadoop和hive调优个人总结

    2. 删除节点的Datanode服务。 二、 启动自动Balancer 自动Balancer是Hadoop集群中的一种负载均衡机制,可以根据集群中的数据分布情况,自动地将数据重新分布到不同的节点上,以提高集群的性能和可靠性。 启动...

    HADOOP安装过程

    - 删除`/home/hadoop/tmp`文件夹。 - 在Master节点上格式化NameNode。 - 启动Hadoop服务,检查服务状态。 **14. 验证集群状态:** - 在Master节点上查看Hadoop集群的状态。 - 重复运行WordCount程序测试。 #### ...

    hadoop—集群维护手册分享.pdf

    本文档旨在为 Hadoop 集群维护提供详细的操作指南,从集群启动和停止到数据平衡、节点添加、副本系数设置、平衡阈值调整、Hadoop 升级等多个方面,提供了实践操作步骤和注意事项。 一、集群启动和停止 Hadoop 集群...

    hadoop-2.7.4.tar.gz

    10. 集群扩展:Hadoop 2.7.4支持动态添加或删除节点,方便集群规模的灵活扩展,以适应不同规模的大数据处理需求。 总的来说,Hadoop 2.7.4是一个功能强大且稳定的分布式计算框架,对于理解大数据处理原理、学习...

    hadoop-3.3.1.tar.gz

    - **集群扩展**:添加更多节点以扩大Hadoop集群规模。 - **监控和调优**:使用Hadoop自带的监控工具,如JMX,监控系统性能,并根据需求进行调优。 7. **其他组件**:Hadoop生态系统还包括HBase、Spark、Hive等,...

    Hadoop 管理

    本章旨在帮助读者深入了解并掌握Hadoop的管理技巧,包括但不限于HDFS命令行工具的使用方法、如何有效地添加或删除节点、使用Ganglia进行集群性能监控以及利用Sqoop实现数据导入与导出等功能。 #### HDFS命令行工具 ...

    hadoop出错解决方法

    解决方法是:修改 conf/hadoop-env.sh 文件,增加 export HADOOP_HEAPSIZE=4000,这样可以增加 Hadoop 的堆大小,提高处理速度。 四、能够启动 datanode,但无法访问,也无法结束的错误 这个问题是由于 NameNode ...

    hadoop配置

    文档《linux创建用户、文件夹、用户组的添加和删除的命令及解说.docx》涵盖了这些基本操作,例如`useradd`、`groupadd`、`mkdir`、`rm`、`chown`、`chmod`等。 六、问题调试与优化 1. **日志查看**:通过检查...

    hadoop hbase 全jar包

    Hadoop和HBase是大数据处理领域中的重要组件,它们在分布式存储和实时数据访问方面扮演着关键角色。Hadoop是一个开源框架,主要用于处理和存储大量数据,而HBase是建立在Hadoop之上的非关系型数据库,提供高可靠性、...

    hadoop的操作有图片

    这是为了确保Hadoop节点之间能够正常通信。 ### 3. Java环境配置 - **创建Java目录**:使用**`sudomkdir jvm`**命令创建存放Java环境的目录。 - **移动Java库**:使用**`mv jdk1.8.0_144 //lib/jvm`**将JDK安装到/...

Global site tag (gtag.js) - Google Analytics