测试Hadoop的启动顺序及遇到的问题

ajax

浏览: 254655 次
性别:
来自: 上海

最近访客更多访客>>

lzyboy

流氓兔斯基

ghssniewind

nathanlw

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

hadoop

测试环境：

一个namenode

一个secondary namenode，以实现namenode的HA

三个datanode节点

两个RM，以实现Resource Manager的HA

共部署了7个虚拟机，操作系统是Ubuntu 14. 所有虚拟机是在本机加载，所以为了节省资源，Zookeeper分别部署在三个datanode节点上。

Hadoop的sbin目录下的start-all.sh已经不建议使用，代替的是单独启动各个命令，比如start-dfs.sh, start-yarn.sh. 但是从学习的角度看，使用start-all.sh,可以直接看出正确的启动顺序。

运行start-dfs.sh:

- namenode

- secondary namenode (HA node)

- all datanodes

- all journalnodes

- ZK Failover Controllers (on namenode and sceondary node)

运行start-yarn.sh

- resource manager

- all nodemanager

注意：我的测试环境里Zookeeper是单独配置的，所以在上面两个命令启动前启动，找到Zookeeper的安装目录/bin，运行./zkServer.sh start.

另外，碰到一个奇怪的问题，因为RM是配置了HA，并且放在单独的两台机器上，第一次配置好了以后，在namenode下，如果启动yarn，比如start-yarn.sh，resource manager能够自动启动起来，但只启动一个，网上有资料说这个是bug。但是过了一段时间后，resource manager通过上述方式完全启动不起来，查看namenode的log，会报下面的异常：

2016-05-02 02:38:47,523 FATAL org.apache.hadoop.yarn.server.resourcemanager.ResourceManager: Error starting ResourceManager
org.apache.hadoop.yarn.exceptions.YarnRuntimeException: Invalid configuration! Can not find valid RM_HA_ID. None of yarn.resourcemanager.address.rm1 yarn.resourcemanager.address.rm2 are matching the local address OR yarn.resourcemanager.ha.id is not specified in HA Configuration

解决办法也比较简单，直接登录到Resource Manager所在的机器上，单独启动RM即可，使用的命令如下：

yarn-daemon.sh start resourcemanager

分享到：

给公司研发部门培训的HDFS的PPT文档及问题 ...

2016-05-02 20:30
浏览 3949
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Ambari-Doris服务安装启动顺序设置: 通常，Ambari会按照服务间的依赖关系自动设定启动顺序，但有时我们需要手动调整以满足特定需求或解决特殊问题。在安装Doris之前，确保已安装并配置好所有必要的前置服务，如HDFS、YARN、Zookeeper等。这些服务为...

Hadoop 从零开始（1） ——CentOS 安装配置: 测试Hadoop** 创建一个测试文件，使用`hadoop fs -put`命令将文件上传到HDFS。然后，使用`hadoop fs -ls`查看文件是否成功上传，再用`hadoop fs -get`将文件下载回来，验证HDFS的读写功能。 **10. 高可用性配置**...

Hadoop伪分布式搭建配置文件: 按照以下顺序启动Hadoop服务： 1. 启动DataNode：`hadoop datanode` 2. 启动NameNode：`hadoop namenode` 3. 启动YARN的ResourceManager：`yarn resourcemanager` 4. 启动YARN的NodeManager：`yarn nodemanager` 5. ...

Hadoop2.5.1的HA+Federation的详细配置: 以上就是Hadoop 2.5.1版本HA+Federation的详细配置过程，实践中可能会遇到各种问题，需要根据具体情况进行调试和优化。通过理解这些配置细节，你可以构建出一个具备高可用性和可扩展性的Hadoop集群，满足大规模数据...

win7安装hadoop及eclipse调试mapreduce的配置方法: 【标题】: "win7环境下Hadoop安装及Eclipse调试MapReduce配置教程" 【描述】: "本教程详细讲解在Windows 7操作系统中如何安装Hadoop，并配置Eclipse进行MapReduce程序的调试，涵盖可能出现的问题及其解决方案。" ...

hadoop-Apache2.7.3+Spark2.0集群搭建: - 详细描述了服务启动顺序、进程解析、关闭顺序及查看服务状态的方法。 13. 错误集合： - 列出了在搭建集群过程中可能遇到的错误，例如Mysql、Hbase、HDFS连接集群、NameNode等相关的错误及解决办法。综上所述，...

hadoop集群安装: - 按顺序启动Hadoop的各个守护进程（如NameNode、DataNode、SecondaryNameNode、JobTracker、TaskTracker）。 - 启动Zookeeper和HBase Master。 - 启动Hive Metastore服务。 - 使用Hadoop命令行工具和HBase的...

大数据面试题: ### 大数据面试题知识点详解 #### 一、HDFS数据存储...通过以上知识点的梳理，我们不仅了解了Hadoop的基本架构和运行机制，还深入探讨了面试中可能会遇到的各种问题及其解决方案，有助于更好地准备相关的技术面试。

linux安装详解: - 进入计算机的BIOS或UEFI设置，将启动顺序调整为优先从USB或DVD启动。 4. **启动安装程序**： - 重启电脑，进入Ubuntu的试用环境，此时可以选择安装或试用系统。 5. **选择安装类型**： - 安装过程中，选择...

Task11:“:Japanese_symbol_for_beginner:11.1使用Ansible Playbook配置Hadoop并启动集群服务:Japanese_symbol_for_beginner:11.2创建有关行业如何使用Ansible解决挑战的文章，博客或视频。:Japanese_symbol_for_beginner:11.3重新启动HTTPD服务本质上不是等幂的，而且也消耗了更多资源，这是一种纠正方法Ansible剧本中的挑战”: 在Ansible剧本中，重启HTTPD服务可能会遇到的问题包括： - **非幂等性问题**：幂等性意味着多次执行同一操作应产生相同的结果。如果HTTPD服务重启可能导致数据丢失或状态不一致，则称其为非幂等操作。 - **资源消耗...

Oozie的安装与配置.docx: - 如果遇到Maven内存溢出的问题，可以增加MAVEN_OPTS环境变量，例如`export MAVEN_OPTS="-Xmx512m -XX:MaxPermSize=128m"`，然后重新编译。 5. **安装Oozie**： - 解压缩Oozie的发行版，例如`tar -zxvf oozie-...

ambari upgrade: 在升级的过程中，可能会遇到一些特殊的注意事项，例如特定版本间的依赖关系或者版本兼容性问题，这些都是需要注意的地方。对于任何升级，建议充分测试升级脚本和相关升级后的功能，在生产环境升级之前，最好先在测试...

azkaban-3.38安装包: - 如果遇到性能问题，考虑优化Azkaban的配置，如增大内存分配或调整并发度。 7. **社区与文档**： - Azkaban有一个活跃的社区，可以在官方论坛或GitHub上寻求帮助。 - 官方文档提供了详细的安装、配置和使用指南...

seatunnel 2.1.3版本bin包: - 对于遇到的问题，用户可以通过查阅官方文档、参与社区讨论或提交Issue获取支持。总之，Seatunnel 2.1.3版本bin包为用户提供了完整的运行环境，使得大数据预处理变得更加便捷。通过灵活配置，用户可以构建出满足...

2011百度笔试题: - **问题描述**：给定N个任务及其依赖关系，设计算法确定任务的执行顺序。 - **解决方案**： 1. **拓扑排序**：构建一个图来表示任务间的依赖关系，然后使用拓扑排序找到一个合法的任务执行序列。 2. **时间复杂度...

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论