`
流氓阿飞
  • 浏览: 18635 次
社区版块
存档分类
最新评论

Spark2.x基于Zookeeper的高可用配置

阅读更多

  

  基于前一篇:Spark2.x安装配置http://liumangafei.iteye.com/blog/2322672

 

  1、修改spark-env.sh

 

export SCALA_HOME=/usr/scala/scala-2.11.8
export JAVA_HOME=/usr/java/jdk1.8.0_91
export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=hadoop2:2181,hadoop3:2181,hadoop4:2181 -Dspark.deploy.zookeeper.dir=/spark"
export SPARK_WORKER_MEMORY=1g
export HADOOP_CONF_DIR=/usr/hadoop/hadoop-2.6.4/etc/hadoop

 

  2、启动所有服务

 

  

sbin/start-all.sh  // 会启动当前的master和对应的worker

 

  启动另一台机器上的master

 

/sbin/start-master.sh

 

  3、测试是否高可用

 

  查看对应的两个master的8080端口,看是否运行成功,一个alive、一个standby

  关闭alive的master,等待几十秒(郁闷的延迟同步)会看到standby变为alive

 

 

sbin/start-master.sh  // 启动master
sbin/stop-master.sh   // 关闭master
 

 

分享到:
评论

相关推荐

    关于大数据的面试题,包括hadoop、hbase、hive、spark、storm、zookeeper、kafka、.zip

    Spark提供了多个组件,如Spark Core、Spark SQL、Spark Streaming、MLlib(机器学习库)和GraphX,适用于批处理、交互式查询、流处理和图计算。 5. **Storm**: Storm是Twitter开源的实时计算系统,用于处理无界...

    Spark运维实战

    独立模式又分为无高可用(HA)、单点恢复以及基于ZooKeeper的HA配置。在安装Spark时,可以通过SBT或MAVEN工具进行编译,但是这两种方式生成的包比较大,不适合部署使用。官方通常提供一个较小的tgz包以满足部署需求...

    zookeeper-3.4.10.tar.gz和jdk-8u171-linux-x64.gz

    它提供了一个高可用、高性能的命名服务、配置管理、群组服务、分布式同步等关键功能。Zookeeper的设计理念基于一致性模型,使得多节点之间能够协同工作,确保数据的一致性和完整性。在3.4.10版本中,Zookeeper已经...

    Hadoop+Spark生态详解.zip

    在Hadoop集群中,Zookeeper帮助维护集群状态的一致性,确保高可用性和稳定性。 HBase是基于Hadoop的数据库,设计为分布式、列式存储的NoSQL数据库,适用于实时读写大数据。它提供随机访问和强一致性,特别适合于半...

    Spark2.3.0-Hadoop2.7.4集群部署

    ##### 2.2 YARN HA高可用配置 - **配置YARN HA**: 编辑`yarn-site.xml`文件,添加`yarn.resourcemanager.ha.enabled true`等关键参数。 - **ResourceManager配置**: 为每个ResourceManager节点配置`yarn....

    HADOOP+KAFKA+SPARK

    它基于分布式文件系统HDFS(Hadoop Distributed File System),能够将数据分布在多台廉价服务器上,实现高可用性和容错性。Hadoop的核心思想是MapReduce,这是一种并行计算模型,将大型数据集分割成小块,通过...

    大数据方向面试题大全.pdf

    34. Spark实现高可用性:High Availability:通过Zookeeper或Leader选举等机制保证Spark集群的高可用性。 35. Spark资源判定:Spark通过资源管理器动态分配资源,依据任务量和资源需求进行分配。 以上是大数据方向...

    用Hadoop搭建分布式存储和分布式运算集群.zip )

    标题中的“用Hadoop搭建分布式存储和分布式运算集群”指的是使用Apache Hadoop这一开源框架来构建大规模、高可用的分布式系统。Hadoop是基于Java实现的,它主要由两个核心组件构成:Hadoop Distributed File System ...

    基于Hadoop的大数据处理关键技术综述.rar

    6. **Zookeeper** - 用于分布式系统的协调服务,管理配置信息、命名服务、分布式同步和组服务。 **大数据处理流程** 在Hadoop环境下处理大数据通常包括数据摄入、数据清洗、数据转换、数据分析和数据可视化等步骤...

    清华大学精品大数据之系统运维课程PPT课件(17页)含习题 第8章 升级管理.pptx

    在集群模式下,升级Zookeeper需要确保所有节点的一致性和高可用性。单机模式的升级较为直接,而集群模式则需要更细致的规划和操作,以防止服务中断。 这些升级管理的知识对于大数据系统的运维人员来说是必不可少的...

    大数据课程体系.docx

    9. **Zookeeper**:作为分布式协调服务,Zookeeper在高可用性集群中扮演关键角色。课程会涵盖其与RMI(Remote Method Invocation)、Redis的高可用性监控,以及Netty异步IO通信框架的集成。 10. **Kafka**:Kafka是...

    大数据学习笔记

    - **高可用性**:支持容错机制,可以在集群环境中运行。 - **扩展性**:可以轻松地扩展到数千个节点的集群。 - **19.3 HIVE架构** - **架构设计**:介绍了Hive的架构设计,包括元数据存储、执行引擎等关键组件。...

    hbase-1.2.0-cdh5.14.0.tar.gz

    Zookeeper确保HBase的高可用性和一致性。 9. **MapReduce集成** HBase与Hadoop的MapReduce框架紧密集成,允许用户编写复杂的批处理作业来分析存储在HBase中的数据。 10. **HBase Shell** HBase提供了一个命令行...

    【面试宝典】2021年超全超详细的最新大数据开发面试题,附答案解析(一版).pdf

    - 可通过Zookeeper等工具实现高可用配置,减少单点故障的影响。 **7. NameNodeHA中的脑裂问题** - 脑裂是指两个NameNode同时认为自己是活跃状态。 - 解决方法:通过Zookeeper或Quorum Journal Manager(QJM)确保...

    Hadoop. The Definitive Guide

    YARN是Hadoop 2.x及更高版本中的核心组件,它从MapReduce中分离出资源调度功能,使得Hadoop平台可以支持更多的计算框架,如Spark、Flink等。YARN通过全局资源管理和作业调度,实现了更高效的集群资源利用率和任务...

    hadoe2ee2e2e2

    4.5 ZooKeeper:分布式协调服务,用于维护和同步分布式应用的数据,解决命名服务、配置管理等问题。 总结,Hadoop2以其强大的分布式计算能力和丰富的生态系统,为大数据处理提供了全面的解决方案。YARN的引入改善了...

    30种java技术框架-方案架构图汇总.zip

    29. **Akka**:基于Actor模型的并发框架,用于构建高可用、反应式系统。 30. **Vert.x**:轻量级事件驱动的Java开发平台,适用于构建高性能的分布式应用。 以上30种Java技术框架涵盖了Web开发、持久层、测试、...

    Hadoop权威指南第三版

    6. ZooKeeper:分布式协调服务,支持命名服务、配置管理、组服务等。 五、数据处理与分析 书中涵盖了数据预处理、数据清洗、数据分析和挖掘等多个环节,讲解如何利用Hadoop工具进行复杂的数据处理任务。同时,还...

    各企业的大数据面试真题

    - **扩展性增强**: Hadoop 2.x 支持更多的计算框架,如 Spark 和 Flink,使得大数据平台更加灵活。 #### 三、YARN **资源调度**: YARN 是 Hadoop 2.x 的核心组件之一,主要负责资源管理和作业调度。 **调度策略**...

    大数据之Kafka学习

    Kafka以其高吞吐量、低延迟和容错性著称,其设计基于分区和副本的概念,以确保数据的可靠性和可用性。 ### 安装Kafka 在安装Kafka之前,需要先确保ZooKeeper环境已经就绪。Kafka依赖ZooKeeper进行集群协调。以下是...

Global site tag (gtag.js) - Google Analytics