Spark2.x基于Zookeeper的高可用配置 - 流氓阿飞 - ITeye博客

`

流氓阿飞

浏览: 18792 次

最近访客更多访客>>

byym

teclick

tianxizhong

paladin1988

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

Spark2.x基于Zookeeper的高可用配置

博客分类：

Spark

Spark HA Spark高可用

阅读更多

基于前一篇：Spark2.x安装配置http://liumangafei.iteye.com/blog/2322672

1、修改spark-env.sh

export SCALA_HOME=/usr/scala/scala-2.11.8
export JAVA_HOME=/usr/java/jdk1.8.0_91
export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=hadoop2:2181,hadoop3:2181,hadoop4:2181 -Dspark.deploy.zookeeper.dir=/spark"
export SPARK_WORKER_MEMORY=1g
export HADOOP_CONF_DIR=/usr/hadoop/hadoop-2.6.4/etc/hadoop

2、启动所有服务

sbin/start-all.sh  // 会启动当前的master和对应的worker

启动另一台机器上的master

/sbin/start-master.sh

3、测试是否高可用

查看对应的两个master的8080端口，看是否运行成功，一个alive、一个standby

关闭alive的master，等待几十秒（郁闷的延迟同步）会看到standby变为alive

sbin/start-master.sh  // 启动master
sbin/stop-master.sh   // 关闭master

分享到：

Spark2.x基于Intellij IDEA开发 | Spark2.x安装配置

2016-09-09 16:37
浏览 785
评论(0)
分类:开源软件
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

关于大数据的面试题，包括hadoop、hbase、hive、spark、storm、zookeeper、kafka、.zip: Spark提供了多个组件，如Spark Core、Spark SQL、Spark Streaming、MLlib（机器学习库）和GraphX，适用于批处理、交互式查询、流处理和图计算。 5. **Storm**： Storm是Twitter开源的实时计算系统，用于处理无界...

Spark运维实战: 独立模式又分为无高可用（HA）、单点恢复以及基于ZooKeeper的HA配置。在安装Spark时，可以通过SBT或MAVEN工具进行编译，但是这两种方式生成的包比较大，不适合部署使用。官方通常提供一个较小的tgz包以满足部署需求...

zookeeper-3.4.10.tar.gz和jdk-8u171-linux-x64.gz: 它提供了一个高可用、高性能的命名服务、配置管理、群组服务、分布式同步等关键功能。Zookeeper的设计理念基于一致性模型，使得多节点之间能够协同工作，确保数据的一致性和完整性。在3.4.10版本中，Zookeeper已经...

Hadoop＋Spark生态详解.zip: 在Hadoop集群中，Zookeeper帮助维护集群状态的一致性，确保高可用性和稳定性。 HBase是基于Hadoop的数据库，设计为分布式、列式存储的NoSQL数据库，适用于实时读写大数据。它提供随机访问和强一致性，特别适合于半...

Spark2.3.0-Hadoop2.7.4集群部署: ##### 2.2 YARN HA高可用配置 - **配置YARN HA**: 编辑`yarn-site.xml`文件，添加`yarn.resourcemanager.ha.enabled true`等关键参数。 - **ResourceManager配置**: 为每个ResourceManager节点配置`yarn....

HADOOP+KAFKA+SPARK: 它基于分布式文件系统HDFS（Hadoop Distributed File System），能够将数据分布在多台廉价服务器上，实现高可用性和容错性。Hadoop的核心思想是MapReduce，这是一种并行计算模型，将大型数据集分割成小块，通过...

大数据方向面试题大全.pdf: 34. Spark实现高可用性：High Availability：通过Zookeeper或Leader选举等机制保证Spark集群的高可用性。 35. Spark资源判定：Spark通过资源管理器动态分配资源，依据任务量和资源需求进行分配。以上是大数据方向...

用Hadoop搭建分布式存储和分布式运算集群.zip ): 标题中的“用Hadoop搭建分布式存储和分布式运算集群”指的是使用Apache Hadoop这一开源框架来构建大规模、高可用的分布式系统。Hadoop是基于Java实现的，它主要由两个核心组件构成：Hadoop Distributed File System ...

基于Hadoop的大数据处理关键技术综述.rar: 6. **Zookeeper** - 用于分布式系统的协调服务，管理配置信息、命名服务、分布式同步和组服务。 **大数据处理流程** 在Hadoop环境下处理大数据通常包括数据摄入、数据清洗、数据转换、数据分析和数据可视化等步骤...

清华大学精品大数据之系统运维课程PPT课件（17页）含习题第8章升级管理.pptx: 在集群模式下，升级Zookeeper需要确保所有节点的一致性和高可用性。单机模式的升级较为直接，而集群模式则需要更细致的规划和操作，以防止服务中断。这些升级管理的知识对于大数据系统的运维人员来说是必不可少的...

大数据课程体系.docx: 9. **Zookeeper**：作为分布式协调服务，Zookeeper在高可用性集群中扮演关键角色。课程会涵盖其与RMI（Remote Method Invocation）、Redis的高可用性监控，以及Netty异步IO通信框架的集成。 10. **Kafka**：Kafka是...

大数据学习笔记: - **高可用性**：支持容错机制，可以在集群环境中运行。 - **扩展性**：可以轻松地扩展到数千个节点的集群。 - **19.3 HIVE架构** - **架构设计**：介绍了Hive的架构设计，包括元数据存储、执行引擎等关键组件。...

hbase-1.2.0-cdh5.14.0.tar.gz: Zookeeper确保HBase的高可用性和一致性。 9. **MapReduce集成** HBase与Hadoop的MapReduce框架紧密集成，允许用户编写复杂的批处理作业来分析存储在HBase中的数据。 10. **HBase Shell** HBase提供了一个命令行...

【面试宝典】2021年超全超详细的最新大数据开发面试题，附答案解析(一版).pdf: - 可通过Zookeeper等工具实现高可用配置，减少单点故障的影响。 **7. NameNodeHA中的脑裂问题** - 脑裂是指两个NameNode同时认为自己是活跃状态。 - 解决方法：通过Zookeeper或Quorum Journal Manager（QJM）确保...

Hadoop. The Definitive Guide: YARN是Hadoop 2.x及更高版本中的核心组件，它从MapReduce中分离出资源调度功能，使得Hadoop平台可以支持更多的计算框架，如Spark、Flink等。YARN通过全局资源管理和作业调度，实现了更高效的集群资源利用率和任务...

hadoe2ee2e2e2: 4.5 ZooKeeper：分布式协调服务，用于维护和同步分布式应用的数据，解决命名服务、配置管理等问题。总结，Hadoop2以其强大的分布式计算能力和丰富的生态系统，为大数据处理提供了全面的解决方案。YARN的引入改善了...

30种java技术框架-方案架构图汇总.zip: 29. **Akka**：基于Actor模型的并发框架，用于构建高可用、反应式系统。 30. **Vert.x**：轻量级事件驱动的Java开发平台，适用于构建高性能的分布式应用。以上30种Java技术框架涵盖了Web开发、持久层、测试、...

Hadoop权威指南第三版: 6. ZooKeeper：分布式协调服务，支持命名服务、配置管理、组服务等。五、数据处理与分析书中涵盖了数据预处理、数据清洗、数据分析和挖掘等多个环节，讲解如何利用Hadoop工具进行复杂的数据处理任务。同时，还...

各企业的大数据面试真题: - **扩展性增强**: Hadoop 2.x 支持更多的计算框架，如 Spark 和 Flink，使得大数据平台更加灵活。 #### 三、YARN **资源调度**: YARN 是 Hadoop 2.x 的核心组件之一，主要负责资源管理和作业调度。 **调度策略**...

大数据之Kafka学习: Kafka以其高吞吐量、低延迟和容错性著称，其设计基于分区和副本的概念，以确保数据的可靠性和可用性。 ### 安装Kafka 在安装Kafka之前，需要先确保ZooKeeper环境已经就绪。Kafka依赖ZooKeeper进行集群协调。以下是...

Global site tag (gtag.js) - Google Analytics