spark1.3 状态改变
Driver:
状态是 错误、完成、被杀掉、失败 将其从 缓存中移除,
向completedDriver中添加Driver,
设置Driver的state、exception ,
将Driver所在的worker移除driver
调用Schedule()方法
executor:
-->找到executor对应的 app
-->获取app的executors缓存中的executor信息
-->设置executor的当前状态
-->向Driver发送 executorUpdated消息
-->若 executor完成了
--> 从app的缓存中移除executor
--> 从executor的worker的缓存中移除 executor
--> 若 executor的退出状态是非正常的
--> 判断application的重试次数 是否达到了最大值
--> 若没有达到最大值 则重新进行调度-- 调用 Schedule()
--> 否则进行 removeApplication 操作---executor反复调度都是失败 就是为app失败了
相关推荐
Spark-Core文档是本人经三年总结笔记汇总而来,对于自我学习Spark核心基础知识非常方便,资料中例举完善,内容丰富。具体目录如下: 目录 第一章 Spark简介与计算模型 3 1 What is Spark 3 2 Spark简介 3 3 Spark...
根据“Spark笔记1”的描述,要在Hadoop集群上运行Spark任务,首先需要确保Spark能够正确识别到Hadoop集群。这通常涉及到一些环境变量的设置,例如: - `YARN_HOME`: 指定Hadoop的安装路径。 - `YARN_CONF_DIR`: 指定...
### 大数据学习笔记知识点概览 #### 第一部分:Spark学习 ##### 第1章:Spark介绍 - **1.1 Spark简介与发展** - **背景**:随着大数据处理需求的增长,传统的Hadoop MapReduce框架虽然提供了强大的计算能力,但...
SparkMLlib学习笔记 SparkMLlib是 Apache Spark 机器学习库,提供了一个统一的 API,用于机器学习任务的开发。SparkMLlib 提供了多种数据类型,包括 Vector、LabeledPoint 和 Matrix 等。这些数据类型是机器学习...
第一部分 Spark学习 ....................................................................................................................... 6 第1章 Spark介绍 ..............................................
### 西电分布式计算课程(PPT总结版)笔记知识点详解 #### 一、通信技术 **1.1 分布式计算基础** - **通信技术的重要性:** 在分布式计算领域,节点之间的高效通信是实现高性能计算的核心。文档重点介绍了几种...
1.3 Stateful Processing:Flink允许状态化的计算,这意味着它可以存储中间结果,这对于窗口、聚合等操作至关重要。 二、数据流模型 2.1 DataStream API:DataStream API用于处理无界和有界数据流,提供了丰富的...
**Kafka学习指南** 在IT领域,Apache Kafka是一款广泛使用的分布式流处理平台,它由LinkedIn开发并贡献给了Apache软件基金会。Kafka的核心功能是作为消息队列,提供高吞吐量、低延迟的消息传递,使其成为大数据实时...