`
coderplay
  • 浏览: 578034 次
  • 性别: Icon_minigender_1
  • 来自: 广州杭州
社区版块
存档分类
最新评论

怎么停止和重新启用hadoop的DataNode

阅读更多

停止

比如我原来有10个节点的集群. 现在我想停掉2个,但数据不能丢失,只能让它们的数据转移到其它8台上.这道过程就是decommission. 我们不能直接把那2台停掉, 要在停掉之前把数据转移出去.

首先建立一个excludes文件.它是一个文本, 里面每行就是想要停掉的主机名.这里excludes 放在 $HADOOP_HOME下
例如
CS02
CS03
CS04
CS05
CS06
CS07
CS08
CS09
CS10
这样就表明要把9台机器给停了.


然后在conf/hadoop-site.xml添加这样的属性:
  <property>                                                                                                                       
        <name>dfs.hosts.exclude</name>                                                                                             
        <value>excludes</ value>                                                                                                    
  </property>  

做完这步, 用bin/hadoop dfsadmin -refreshNodes命令更新结点以及hadoop配置

然后你可以通过 bin/hadoop dfsadmin -report 就可以查看到类似这样的信息:
Name: 192.168.0.86:50010
State          : Decommission in progress
Total raw bytes: 30452150272 (28.36 GB)
Remaining raw bytes: 17727606637(16.51 GB)
Used raw bytes: 6480990208 (6.04 GB)
% used: 21.28%
Last contact: Thu Nov 27 02:25:40 CST 2008

Name: 192.168.0.89:50010
State          : Decommissioned
Total raw bytes: 0 (0 KB)
Remaining raw bytes: 0(0 KB)
Used raw bytes: 4703211520 (4.38 GB)
% used: ∞%
Last contact: Thu Jan 01 08:00:00 CST 1970

可以看到86在停止中, 89已经停止了.
在没停止之前, mapreduce会拒绝操作. 会出异常的

 

重新启用

 

分享到:
评论
5 楼 coolbaby1987 2009-09-01  
你好!请教一下:在作业执行时,如何动态增加datanode?或者我该看哪部分的源码?谢了
4 楼 coderplay 2009-01-18  
chinara 写道

你好,请问怎么重新添加DataNode?我其中一台slave机子重启了,上面的datanode就失效了,在master上./hadoop dfsadmin -report可以看到这个datanode,但可用容量都是0,我用./hadoop dfsadmin -refreshNodes也试了,还是一样,不知道怎么解决?

如果配置没有问题的话, 使用bin/start-dfs.sh试试
3 楼 chinara 2009-01-16  
你好,请问怎么重新添加DataNode?我其中一台slave机子重启了,上面的datanode就失效了,在master上./hadoop dfsadmin -report可以看到这个datanode,但可用容量都是0,我用./hadoop dfsadmin -refreshNodes也试了,还是一样,不知道怎么解决?
2 楼 coderplay 2008-12-12  
快发1.0版了, 还有节点数据的负载均衡等,逐渐完善中
1 楼 Arbow 2008-12-12  
看来Hadoop还是挺完备的啊,经过这么多年的发展功能都很全。
那Disco现在还是很简单,即使依赖着OTP这个神器,还有很长的路要走。

相关推荐

    大数据 hadoop-3.1.3 linux 安装包

    为了方便日常管理,还可以启用Hadoop的守护进程(daemon)服务。 为了验证Hadoop安装成功,可以运行一些简单的测试,如`hadoop fs -ls /`检查HDFS根目录,或者使用WordCount示例程序处理数据。Hadoop还提供了丰富的...

    Windows上安装Hadoop

    至此,你已经在Windows上成功安装了Hadoop并启用了SSH服务,可以开始在本地进行大数据处理了。不过,需要注意的是,Windows并不是Hadoop的最佳运行平台,生产环境中通常推荐使用Linux。如果你需要在多台机器上构建...

    hadoop运行winutils.exe

    4. **启动和停止Hadoop服务**: 在Windows上,可以使用`winutils.exe`来启动或停止DataNode、NameNode等Hadoop服务。 5. **Hive连接**: 对于使用Hive进行数据分析的用户,`winutils.exe`用于设置Hive Metastore的...

    hadoop-3.2.2.tar.gz

    10. **安全与高可用**:在生产环境中,通常需要启用Hadoop的安全模式,如Kerberos认证,以及设置高可用的NameNode和ResourceManager,以保证服务的稳定性和数据安全性。 综上所述,"hadoop-3.2.2.tar.gz"是一个包含...

    hadoop2.71 window环境下运行文件

    若要模拟分布式环境,可以启用伪分布式模式,其中NameNode、DataNode、ResourceManager和NodeManager都在同一台机器的不同Java进程中运行。 8. **启动与停止Hadoop**: 使用`start-dfs.cmd`和`start-yarn.cmd`命令...

    Hadoop3.2.2.zip

    启动Hadoop集群时,需要先启动NameNode、DataNode、Secondary NameNode等服务,然后启动YARN(Yet Another Resource Negotiator),它是Hadoop的资源管理器,负责调度MapReduce任务。此外,Hadoop 3.2.2还支持新的...

    win10下hadoop2.6.4 bin(含winutils.exe和hadoop.dll).zip

    8. **安全与性能优化**: 在Windows环境下,考虑到安全性,可能需要启用Hadoop的安全特性,如Kerberos认证。同时,针对Windows的性能优化也非常重要,如调整JVM堆大小、I/O缓冲区设置等。 9. **开发与调试**: 开发...

    hadoop配置文件默认配置

    2. **hadoop.security.authorization**: 如果设置为`true`,则启用Hadoop服务的权限验证。 3. **hadoop.security.authentication**: 默认的认证方式为`simple`,即用户名/密码认证。 4. **hadoop.logfile.size**: ...

    windows下安装hadoop所需要的winutil

    3. **启动和停止Hadoop服务**:在Windows上,我们可以使用`winutils.exe`来启动或停止DataNode、NameNode等Hadoop服务。 4. **安全认证**:在Hadoop集群中,如果启用了Kerberos安全模式,`winutils.exe`还可以用来...

    Hadoop简介及Apache Hadoop三种搭建方式

    2. **伪分布式模式(Pseudo-Distributed Mode)**:在一台机器上模拟分布式环境,每个Hadoop守护进程(如NameNode、DataNode、ResourceManager等)都在单独的Java进程中运行。这提供了一种在单一节点上验证Hadoop...

    hadoop2.7.2(Linux版本).zip

    3. 安全性保障:启用Hadoop的安全模式,如Kerberos认证,保护数据安全。 总之,Hadoop 2.7.2在Linux环境下的应用,不仅为我们提供了高效的数据存储和处理能力,还通过丰富的生态系统组件满足了多样化的大数据需求。...

    Hadoop2.7.7

    Hadoop2.7.7是Apache Hadoop发行的版本之一,专为Windows 7操作系统设计,使得用户在Windows环境下也能方便地搭建和运行Hadoop分布式文件系统(HDFS)和MapReduce计算框架。Hadoop是一个开源项目,由Apache软件基金...

    hadoop.dll-and-winutils.exe-for-hadoop2.9.0-on-windows_X64

    通过以上步骤,你已经成功在Windows 64位系统上配置了Hadoop 2.9.0,并启用了hadoop.dll和winutils.exe这两个关键组件。这使得你可以在Windows环境中进行大数据处理,进行MapReduce任务或者其他基于Hadoop生态的开发...

    Hadoop与HBase部署文档

    - **安全设置**:启用Hadoop的安全模式,如Kerberos认证,保护集群数据安全。 - **监控工具**:利用如Ambari、Ganglia等工具监控集群的资源使用情况和运行状态。 8. **数据迁移与备份** - **数据导入**:使用...

    centos6.7编译的hadoop2.7.2

    4. **安全性配置**:对于生产环境,考虑启用Hadoop的安全特性,如Kerberos认证。 ### 总结 在CentOS 6.7上编译Hadoop 2.7.2涉及多个步骤,包括环境准备、下载编译、配置以及启动服务。理解并正确配置这些步骤是成功...

    hadoop-2.7.5.tar.zip

    用户可以启用NameNode和DataNode的身份验证,以防止未经授权的访问。同时,Hadoop还引入了AccessControlList (ACLs) 和透明加密,进一步增强了数据保护。 性能方面,Hadoop 2.7.5对延迟敏感的应用进行了优化,例如...

    64位Hadoop2.4.1

    - **安全性**:在生产环境中,应启用Hadoop的安全特性,如Kerberos认证,保障数据安全。 - **监控与管理**:利用Ambari等工具对集群进行监控和管理,及时发现并解决问题。 - **性能调优**:根据实际负载情况调整...

    Hadoop 2.0部署配置文件示例.zip

    5. **slaves**:这个文件列出了集群中的所有DataNode和NodeManager节点,便于快速启动或停止服务。 6. **masters**:通常只包含一个条目,即主NameNode的主机名,用于高可用配置时的备用NameNode。 7. **fair-...

    Hadoop2.8.3 在windows下需要的hadoop.dll winutils.exe等文件

    6. **启动Hadoop服务**:使用`start-dfs.bat`和`start-yarn.bat`脚本启动Hadoop的NameNode、DataNode、ResourceManager和NodeManager等服务。 7. **测试运行**:运行`hadoop dfs -ls /`命令检查HDFS是否正常工作,...

    hadoop linux安装包

    - **SQuAD(Secure Quantum Access Daemon)**: 在安全环境中启用Hadoop的身份验证和授权。 总之,Hadoop-3.1.0的安装包为用户提供了在Linux环境下搭建Hadoop集群的基础。通过理解其架构,正确配置和使用,可以...

Global site tag (gtag.js) - Google Analytics