停止
比如我原来有10个节点的集群. 现在我想停掉2个,但数据不能丢失,只能让它们的数据转移到其它8台上.这道过程就是decommission. 我们不能直接把那2台停掉, 要在停掉之前把数据转移出去.
首先建立一个excludes文件.它是一个文本, 里面每行就是想要停掉的主机名.这里excludes 放在 $HADOOP_HOME下
例如
CS02
CS03
CS04
CS05
CS06
CS07
CS08
CS09
CS10
这样就表明要把9台机器给停了.
然后在conf/hadoop-site.xml添加这样的属性:
<property>
<name>dfs.hosts.exclude</name>
<value>excludes</ value>
</property>
做完这步, 用bin/hadoop dfsadmin -refreshNodes命令更新结点以及hadoop配置
然后你可以通过 bin/hadoop dfsadmin -report 就可以查看到类似这样的信息:
Name: 192.168.0.86:50010
State : Decommission in progress
Total raw bytes: 30452150272 (28.36 GB)
Remaining raw bytes: 17727606637(16.51 GB)
Used raw bytes: 6480990208 (6.04 GB)
% used: 21.28%
Last contact: Thu Nov 27 02:25:40 CST 2008
Name: 192.168.0.89:50010
State : Decommissioned
Total raw bytes: 0 (0 KB)
Remaining raw bytes: 0(0 KB)
Used raw bytes: 4703211520 (4.38 GB)
% used: ∞%
Last contact: Thu Jan 01 08:00:00 CST 1970
可以看到86在停止中, 89已经停止了.
在没停止之前, mapreduce会拒绝操作. 会出异常的
重新启用
分享到:
相关推荐
为了方便日常管理,还可以启用Hadoop的守护进程(daemon)服务。 为了验证Hadoop安装成功,可以运行一些简单的测试,如`hadoop fs -ls /`检查HDFS根目录,或者使用WordCount示例程序处理数据。Hadoop还提供了丰富的...
至此,你已经在Windows上成功安装了Hadoop并启用了SSH服务,可以开始在本地进行大数据处理了。不过,需要注意的是,Windows并不是Hadoop的最佳运行平台,生产环境中通常推荐使用Linux。如果你需要在多台机器上构建...
4. **启动和停止Hadoop服务**: 在Windows上,可以使用`winutils.exe`来启动或停止DataNode、NameNode等Hadoop服务。 5. **Hive连接**: 对于使用Hive进行数据分析的用户,`winutils.exe`用于设置Hive Metastore的...
10. **安全与高可用**:在生产环境中,通常需要启用Hadoop的安全模式,如Kerberos认证,以及设置高可用的NameNode和ResourceManager,以保证服务的稳定性和数据安全性。 综上所述,"hadoop-3.2.2.tar.gz"是一个包含...
若要模拟分布式环境,可以启用伪分布式模式,其中NameNode、DataNode、ResourceManager和NodeManager都在同一台机器的不同Java进程中运行。 8. **启动与停止Hadoop**: 使用`start-dfs.cmd`和`start-yarn.cmd`命令...
启动Hadoop集群时,需要先启动NameNode、DataNode、Secondary NameNode等服务,然后启动YARN(Yet Another Resource Negotiator),它是Hadoop的资源管理器,负责调度MapReduce任务。此外,Hadoop 3.2.2还支持新的...
8. **安全与性能优化**: 在Windows环境下,考虑到安全性,可能需要启用Hadoop的安全特性,如Kerberos认证。同时,针对Windows的性能优化也非常重要,如调整JVM堆大小、I/O缓冲区设置等。 9. **开发与调试**: 开发...
2. **hadoop.security.authorization**: 如果设置为`true`,则启用Hadoop服务的权限验证。 3. **hadoop.security.authentication**: 默认的认证方式为`simple`,即用户名/密码认证。 4. **hadoop.logfile.size**: ...
3. **启动和停止Hadoop服务**:在Windows上,我们可以使用`winutils.exe`来启动或停止DataNode、NameNode等Hadoop服务。 4. **安全认证**:在Hadoop集群中,如果启用了Kerberos安全模式,`winutils.exe`还可以用来...
2. **伪分布式模式(Pseudo-Distributed Mode)**:在一台机器上模拟分布式环境,每个Hadoop守护进程(如NameNode、DataNode、ResourceManager等)都在单独的Java进程中运行。这提供了一种在单一节点上验证Hadoop...
3. 安全性保障:启用Hadoop的安全模式,如Kerberos认证,保护数据安全。 总之,Hadoop 2.7.2在Linux环境下的应用,不仅为我们提供了高效的数据存储和处理能力,还通过丰富的生态系统组件满足了多样化的大数据需求。...
Hadoop2.7.7是Apache Hadoop发行的版本之一,专为Windows 7操作系统设计,使得用户在Windows环境下也能方便地搭建和运行Hadoop分布式文件系统(HDFS)和MapReduce计算框架。Hadoop是一个开源项目,由Apache软件基金...
通过以上步骤,你已经成功在Windows 64位系统上配置了Hadoop 2.9.0,并启用了hadoop.dll和winutils.exe这两个关键组件。这使得你可以在Windows环境中进行大数据处理,进行MapReduce任务或者其他基于Hadoop生态的开发...
- **安全设置**:启用Hadoop的安全模式,如Kerberos认证,保护集群数据安全。 - **监控工具**:利用如Ambari、Ganglia等工具监控集群的资源使用情况和运行状态。 8. **数据迁移与备份** - **数据导入**:使用...
4. **安全性配置**:对于生产环境,考虑启用Hadoop的安全特性,如Kerberos认证。 ### 总结 在CentOS 6.7上编译Hadoop 2.7.2涉及多个步骤,包括环境准备、下载编译、配置以及启动服务。理解并正确配置这些步骤是成功...
用户可以启用NameNode和DataNode的身份验证,以防止未经授权的访问。同时,Hadoop还引入了AccessControlList (ACLs) 和透明加密,进一步增强了数据保护。 性能方面,Hadoop 2.7.5对延迟敏感的应用进行了优化,例如...
- **安全性**:在生产环境中,应启用Hadoop的安全特性,如Kerberos认证,保障数据安全。 - **监控与管理**:利用Ambari等工具对集群进行监控和管理,及时发现并解决问题。 - **性能调优**:根据实际负载情况调整...
5. **slaves**:这个文件列出了集群中的所有DataNode和NodeManager节点,便于快速启动或停止服务。 6. **masters**:通常只包含一个条目,即主NameNode的主机名,用于高可用配置时的备用NameNode。 7. **fair-...
6. **启动Hadoop服务**:使用`start-dfs.bat`和`start-yarn.bat`脚本启动Hadoop的NameNode、DataNode、ResourceManager和NodeManager等服务。 7. **测试运行**:运行`hadoop dfs -ls /`命令检查HDFS是否正常工作,...
- **SQuAD(Secure Quantum Access Daemon)**: 在安全环境中启用Hadoop的身份验证和授权。 总之,Hadoop-3.1.0的安装包为用户提供了在Linux环境下搭建Hadoop集群的基础。通过理解其架构,正确配置和使用,可以...