Hadoop节点热拔插 -

dajuezhao

浏览: 61750 次
性别:
来自: 北京

最近访客更多访客>>

wjboy49

jaydonluo

追求卓绝

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

Hadoop节点热拔插

博客分类：

hadoop

Hadoop Mapreduce XML F#

一、 Hadoop节点热拔插

在Hadoop集群中经常会进行增添节点操作，即实现节点的热拔插。在这些操作中不希望对集群进行重启。

2.在集群中添加节点：

a. 把新节点IP或者主机名字加入到主节点的slaves文件。

b. 登录到新节点，执行：

cd $HADOOP_HOME && bin/hadoop-daemon.sh start datanode && bin/hadoop-daemon.sh start tasktracker

3. 从集群中移走节点，且对移走节点的数据进行备份：

a. 在主节点的core-site.xml配置文件中添加

dfs.hosts.exclude

excludes

b. 在主节点的$HADOOP_HOME目录下新建文件excludes，每行为需要移走的节点，该例为s140。

c. 运行命令：hadoop dfsadmin -refreshNodes，该命令可以动态刷新dfs.hosts和dfs.hosts.exclude配置，无需重启NameNode。此刻datanode消失了，但是tasktracker还存在。

d. 然后通过 bin/hadoop dfsadmin -report查看，结果如下：
Name: 192.168.3.140:50010

Decommission Status : Decommission in progress

Configured Capacity: 310716715008 (289.38 GB)

DFS Used: 59891990052 (55.78 GB)

Non DFS Used: 20663939548 (19.24 GB)

DFS Remaining: 230160785408(214.35 GB)

DFS Used%: 19.28%

DFS Remaining%: 74.07%

Last contact: Fri Aug 13 10:17:20 GMT+08:00 2010

Name: 192.168.3.136:50010

Decommission Status : Normal

Configured Capacity: 487925370880 (454.42 GB)

DFS Used: 101679245034 (94.7 GB)

Non DFS Used: 55873218838 (52.04 GB)

DFS Remaining: 330372907008(307.68 GB)

DFS Used%: 20.84%

DFS Remaining%: 67.71%

Last contact: Fri Aug 13 10:17:21 GMT+08:00 2010

e. 在停掉节点Decommission Status不为Normal前, mapreduce操作会出现异常。

f. 节点移走64G数据需要十分钟左右。

二、数据负载均衡

1. 在Hadoop集群中新添加一个Datanode时，需要对集群数据进行负载均衡。

2. 在主节点运行bin/start-balancer.sh命令，可以添加参数-threshold 5，threshold是平衡阈值，默认是10%，值越小负载越均衡，但需要更长的时间去执行。

3. 添加s140到集群，执行负载均衡半个小时共负载了4G的数据。

分享到：

Hadoop集群中关于SSH认证权限的问题 | Eclipse下配置使用Hadoop插件

2010-10-27 09:32
浏览 2414
评论(0)
分类:企业架构
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Hadoop节点热拔插

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Hadoop节点热拔插

评论

发表评论

相关推荐

Hadoop的基准测试工具使用(部分转载)

分布式集群中的硬件选择

Map/Reduce的内存使用设置

Hadoop开发常用的InputFormat和OutputFormat(转)

SecondaryNamenode应用摘记

Zookeeper分布式安装手册

Hadoop分布式安装

Map/Reduce使用杂记

Hadoop中自定义计数器

Map/Reduce中的Partiotioner使用

Map/Reduce中的Combiner的使用

Hadoop中DBInputFormat和DBOutputFormat使用

Hadoop的MultipleOutputFormat使用

Map/Reduce中公平调度器配置

无法启动Datanode的问题

Map/Reduce的GroupingComparator排序简述

Map/Reduce中分区和分组的问题

关于Map和Reduce最大的并发数设置

关于集群数据负载均衡

Map/Reduce执行流程简述

最近访客更多访客>>