`
ajax
  • 浏览: 253711 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

测试Hadoop的启动顺序及遇到的问题

 
阅读更多

测试环境:

一个namenode

一个secondary namenode,以实现namenode的HA

三个datanode节点

两个RM,以实现Resource Manager的HA

共部署了7个虚拟机,操作系统是Ubuntu 14. 所有虚拟机是在本机加载,所以为了节省资源,Zookeeper分别部署在三个datanode节点上。

 

Hadoop的sbin目录下的start-all.sh已经不建议使用,代替的是单独启动各个命令,比如start-dfs.sh, start-yarn.sh. 但是从学习的角度看,使用start-all.sh,可以直接看出正确的启动顺序。

运行start-dfs.sh:

- namenode

- secondary namenode (HA node)

- all datanodes

- all journalnodes

- ZK Failover Controllers (on namenode and sceondary node)

 

 运行start-yarn.sh

- resource manager

- all nodemanager

 

注意:我的测试环境里Zookeeper是单独配置的,所以在上面两个命令启动前启动,找到Zookeeper的安装目录/bin,运行./zkServer.sh start.

 

另外,碰到一个奇怪的问题,因为RM是配置了HA,并且放在单独的两台机器上,第一次配置好了以后,在namenode下,如果启动yarn,比如start-yarn.sh,resource manager能够自动启动起来,但只启动一个,网上有资料说这个是bug。但是过了一段时间后,resource manager通过上述方式完全启动不起来,查看namenode的log,会报下面的异常:

2016-05-02 02:38:47,523 FATAL org.apache.hadoop.yarn.server.resourcemanager.ResourceManager: Error starting ResourceManager
org.apache.hadoop.yarn.exceptions.YarnRuntimeException: Invalid configuration! Can not find valid RM_HA_ID. None of yarn.resourcemanager.address.rm1 yarn.resourcemanager.address.rm2  are matching the local address OR yarn.resourcemanager.ha.id is not specified in HA Configuration

 

解决办法也比较简单,直接登录到Resource Manager所在的机器上,单独启动RM即可,使用的命令如下:

yarn-daemon.sh start resourcemanager

 

分享到:
评论

相关推荐

    Ambari-Doris服务安装启动顺序设置

    通常,Ambari会按照服务间的依赖关系自动设定启动顺序,但有时我们需要手动调整以满足特定需求或解决特殊问题。在安装Doris之前,确保已安装并配置好所有必要的前置服务,如HDFS、YARN、Zookeeper等。这些服务为...

    Hadoop 从零开始(1) ——CentOS 安装配置

    测试Hadoop** 创建一个测试文件,使用`hadoop fs -put`命令将文件上传到HDFS。然后,使用`hadoop fs -ls`查看文件是否成功上传,再用`hadoop fs -get`将文件下载回来,验证HDFS的读写功能。 **10. 高可用性配置**...

    Hadoop伪分布式搭建配置文件

    按照以下顺序启动Hadoop服务: 1. 启动DataNode:`hadoop datanode` 2. 启动NameNode:`hadoop namenode` 3. 启动YARN的ResourceManager:`yarn resourcemanager` 4. 启动YARN的NodeManager:`yarn nodemanager` 5. ...

    Hadoop2.5.1的HA+Federation的详细配置

    以上就是Hadoop 2.5.1版本HA+Federation的详细配置过程,实践中可能会遇到各种问题,需要根据具体情况进行调试和优化。通过理解这些配置细节,你可以构建出一个具备高可用性和可扩展性的Hadoop集群,满足大规模数据...

    win7安装hadoop及eclipse调试mapreduce的配置方法

    【标题】: "win7环境下Hadoop安装及Eclipse调试MapReduce配置教程" 【描述】: "本教程详细讲解在Windows 7操作系统中如何安装Hadoop,并配置Eclipse进行MapReduce程序的调试,涵盖可能出现的问题及其解决方案。" ...

    hadoop-Apache2.7.3+Spark2.0集群搭建

    - 详细描述了服务启动顺序、进程解析、关闭顺序及查看服务状态的方法。 13. 错误集合: - 列出了在搭建集群过程中可能遇到的错误,例如Mysql、Hbase、HDFS连接集群、NameNode等相关的错误及解决办法。 综上所述,...

    hadoop集群安装

    - 按顺序启动Hadoop的各个守护进程(如NameNode、DataNode、SecondaryNameNode、JobTracker、TaskTracker)。 - 启动Zookeeper和HBase Master。 - 启动Hive Metastore服务。 - 使用Hadoop命令行工具和HBase的...

    大数据面试题

    ### 大数据面试题知识点详解 #### 一、HDFS数据存储...通过以上知识点的梳理,我们不仅了解了Hadoop的基本架构和运行机制,还深入探讨了面试中可能会遇到的各种问题及其解决方案,有助于更好地准备相关的技术面试。

    linux安装详解

    - 进入计算机的BIOS或UEFI设置,将启动顺序调整为优先从USB或DVD启动。 4. **启动安装程序**: - 重启电脑,进入Ubuntu的试用环境,此时可以选择安装或试用系统。 5. **选择安装类型**: - 安装过程中,选择...

    Task11:“:Japanese_symbol_for_beginner:11.1使用Ansible Playbook配置Hadoop并启动集群服务:Japanese_symbol_for_beginner:11.2创建有关行业如何使用Ansible解决挑战的文章,博客或视频。:Japanese_symbol_for_beginner:11.3重新启动HTTPD服务本质上不是等幂的,而且也消耗了更多资源,这是一种纠正方法Ansible剧本中的挑战”

    在Ansible剧本中,重启HTTPD服务可能会遇到的问题包括: - **非幂等性问题**:幂等性意味着多次执行同一操作应产生相同的结果。如果HTTPD服务重启可能导致数据丢失或状态不一致,则称其为非幂等操作。 - **资源消耗...

    Oozie的安装与配置.docx

    - 如果遇到Maven内存溢出的问题,可以增加MAVEN_OPTS环境变量,例如`export MAVEN_OPTS="-Xmx512m -XX:MaxPermSize=128m"`,然后重新编译。 5. **安装Oozie**: - 解压缩Oozie的发行版,例如`tar -zxvf oozie-...

    ambari upgrade

    在升级的过程中,可能会遇到一些特殊的注意事项,例如特定版本间的依赖关系或者版本兼容性问题,这些都是需要注意的地方。对于任何升级,建议充分测试升级脚本和相关升级后的功能,在生产环境升级之前,最好先在测试...

    azkaban-3.38安装包

    - 如果遇到性能问题,考虑优化Azkaban的配置,如增大内存分配或调整并发度。 7. **社区与文档**: - Azkaban有一个活跃的社区,可以在官方论坛或GitHub上寻求帮助。 - 官方文档提供了详细的安装、配置和使用指南...

    seatunnel 2.1.3版本bin包

    - 对于遇到的问题,用户可以通过查阅官方文档、参与社区讨论或提交Issue获取支持。 总之,Seatunnel 2.1.3版本bin包为用户提供了完整的运行环境,使得大数据预处理变得更加便捷。通过灵活配置,用户可以构建出满足...

    2011百度笔试题

    - **问题描述**:给定N个任务及其依赖关系,设计算法确定任务的执行顺序。 - **解决方案**: 1. **拓扑排序**:构建一个图来表示任务间的依赖关系,然后使用拓扑排序找到一个合法的任务执行序列。 2. **时间复杂度...

Global site tag (gtag.js) - Google Analytics