Hadoop添加节点datanode - 奔跑的羚羊 - ITeye博客

`

奔跑的羚羊

浏览: 580540 次
性别:
来自: 北京

最近访客更多访客>>

sagadan

rayoo

yyq5369

linziyuu

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

yeruby：请教下，这个命令会将kube-scheduler的所有日志输出 ...
二、master的安装
107x：不错，谢谢！
kerberos安装配置
yhq1212：如何禁止NGINX先本地缓存呢
nginx upload在java中的应用
lcy651：写的很好、学习了
Nginx的安装
huangyunbin：楼主现在是做运维了吗
mysql的安装,CXXFLAGS

Hadoop添加节点datanode

博客分类：

hadoop

Hadoop SSH JDK XML 工作

阅读更多

1.部署hadoop
和普通的datanode一样。安装jdk，ssh
2.修改host
和普通的datanode一样。添加namenode的ip
3.修改namenode的配置文件conf/slaves
添加新增节点的ip或host
4.在新节点的机器上，启动服务

	[root@slave-004 hadoop]# ./bin/hadoop-daemon.sh start datanode
	[root@slave-004 hadoop]# ./bin/hadoop-daemon.sh start tasktracker

5.均衡block

[root@slave-004 hadoop]# ./bin/start-balancer.sh

这个会非常耗时
1）如果不balance，那么cluster会把新的数据都存放在新的node上，这样会降低mapred的工作效率
2）设置平衡阈值，默认是10%，值越低各节点越平衡，但消耗时间也更长
[root@slave-004 hadoop]# ./bin/start-balancer.sh -threshold 5
3）设置balance的带宽，默认只有1M/s

<property>
  <name>dfs.balance.bandwidthPerSec</name>
  <value>1048576</value>
  <description>
        Specifies the maximum amount of bandwidth that each datanode
        can utilize for the balancing purpose in term of
        the number of bytes per second.
  </description>
</property>

注意：
1. 必须确保slave的firewall已关闭;
2. 确保新的slave的ip已经添加到master及其他slaves的/etc/hosts中，反之也要将master及其他slave的ip添加到新的slave的/etc/hosts中

分享到：

Hadoop删除节点（Decommissioning Nodes） | Hadoop回收站trash

2011-02-15 11:39
浏览 6826
评论(1)
分类:编程语言
查看更多

评论

1 楼 chlhp 2013-04-17

跳过以下两个步骤，也是可以添加并运行成功的，为什么呢？
2.修改host
和普通的datanode一样。添加namenode的ip
3.修改namenode的配置文件conf/slaves
添加新增节点的ip或host

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Hadoop单节点部署指导: ### Hadoop单节点部署指导知识点详解 #### 一、实验目的 - **理解Hadoop原理机制**：深入了解Hadoop的工作原理及其背后的技术架构。 - **熟悉Hadoop集群体系结构**：掌握Hadoop集群中各组成部分的功能及其交互方式...

Hadoop集群datanode磁盘不均衡的解决方案: Hadoop的HDFS集群非常容易出现机器与机器之间磁盘利用率不平衡的情况，比如集群中添加新的数据节点，节点与节点之间磁盘大小不一样等等。当hdfs出现不平衡状况的时候，将引发很多问题，比如MR程序无法很好地利用本地...

hadoop （多节点）环境搭建: 2. 配置 Datanode 节点，使用命令 `ssh-keygen -t rsa`。 3. 配置 Hadoop 集群，使用命令 `hadoop`。搭建 Hadoop 环境需要安装 Ubuntu 操作系统、安装 Hadoop 软件、配置 SSH 无密码登录、配置 Hadoop 集群等步骤...

作业二-Mac版Hadoop三节点集群搭建.docx: 在每个节点上启动Hadoop服务，包括NameNode、DataNode、ResourceManager和NodeManager。启动顺序很重要，确保先启动NameNode，然后是DataNode，接着是ResourceManager和NodeManager。 2.7. 验证集群一旦所有节点都...

大数据之hadoop多节点集群搭建.docx: master 节点上主要运行 Namenode 和 Resourcemanager 进程，而 slave 节点上运行 Datanode 和 Nodemanager 进程。这种架构设计使得集群具有高度的可扩展性和灵活性。二、虚拟机配置由于大多数人只有一台计算机...

hadoop单节点安装.pdf: 在本文中，我们将深入探讨如何在Ubuntu 12.04 64位服务器上安装和配置Hadoop 2.2.0单节点环境。这个过程由雨水在2013年10月24日记录并发布在CSDN博客上。以下是详细的步骤：首先，确保你的环境准备就绪。这包括在...

mac上基于docker搭建hadoop集群: 对各个节点指定好功能 maseter为主节点，hadoop01 为从节点和datanode hadoop02 为yarn主节点负责各个节点的资源调度, hadoop02，hadoop03为datanode节点 OS hostname IP Centos8 hadoop-master ...

双节点hadoop安装文档: 【双节点Hadoop安装文档详解】在分布式计算领域，Hadoop是一个开源的框架，它允许在廉价硬件上处理大规模数据。对于初学者或小型测试环境，双节点Hadoop安装是一个理想的起点，因为其简单易懂，能快速理解Hadoop的...

hadoop单节点环境配置(最新)[整理].pdf: 在单节点环境中配置Hadoop，主要是为了学习和测试Hadoop的功能，而无需复杂的多节点集群设置。以下是配置Hadoop单节点环境的详细步骤： 1. **配置Java环境**：首先，确保你的系统中已经安装了Java开发工具包（JDK...

hadoop节点问题.docx: ### Hadoop节点问题详解 #### 一、问题背景与概述在Hadoop集群环境中，启动过程中可能会遇到某些关键节点未能正常启动的问题。例如，在启动Hadoop集群时，可能会遇到NameNode无法正常启动的情况。此类问题可能由...

hadoop动态增加和删除节点方法介绍: 上一篇文章中我们介绍了Hadoop编程基于MR程序实现倒排索引示例的有关内容，这里我们看看如何在Hadoop中动态地增加和删除节点（DataNode）。假设集群操作系统均为：CentOS 6.7 x64 Hadoop版本为：2.6.3 一、动态...

利用ansible 自动安装Hadoop 集群: 在该目录下，创建`hosts`文件，列出所有Hadoop集群节点的IP地址或主机名，按照角色进行分组，例如，`namenode`、`datanode`等。 3. **编写Playbook**：创建`site.yml`或`hadoop-cluster.yml`文件，这是Ansible的...

CDH5.9.0节点删除下线: 如果删除的节点是NameNode、DataNode或ResourceManager等关键角色的承载者，那么这些角色的服务可能需要手动重启或重新配置以适应新的集群状态。在进行节点删除时，务必谨慎操作，确保备份重要数据，以免造成不...

hadoop2.0 2个namenode 2个datanode 部署: Datanode 是 Hadoop 集群中的从节点，负责存储实际数据块。它从 Namenode 接收命令，执行读写操作，并将数据块存储在本地文件系统中。部署架构在这个部署中，我们将使用两个 Ubuntu 服务器，分别作为 Namenode...

Hadoop 2.x单节点部署学习。: 本教程将深入探讨如何在单节点环境中部署Hadoop 2.x版本，这对于初学者理解和测试Hadoop功能非常有帮助。我们将关注四个关键配置文件——core-site.xml、yarn-site.xml、hdfs-site.xml和mapred-site.xml，它们是...

多节点Hadoop配置.doc: 在本教程中，我们将深入探讨如何在Ubuntu Linux上配置一个多节点的Hadoop集群，使用Hadoop分布式文件系统（HDFS）。如果你正在寻找单节点集群的教程，请参考相应内容。Hadoop是一个用Java编写的框架，用于在大规模的...

基于zookeeper的hadoop ha集群安装过程: * 需要确保Hadoop NameNode和DataNode的高可用性，以便于Hadoop HA集群的正常运行。 * 需要配置Hadoop HA集群，以实现高可用性和可扩展性。基于ZooKeeper的Hadoop HA集群可以提供高可用性和可扩展性，满足企业对大...

Global site tag (gtag.js) - Google Analytics