`

spark-学习笔记--16 spark1.3 状态改变

 
阅读更多

spark1.3  状态改变

 

 

Driver:

状态是 错误、完成、被杀掉、失败    将其从 缓存中移除,  

向completedDriver中添加Driver, 

设置Driver的state、exception  ,

将Driver所在的worker移除driver

调用Schedule()方法

 

 

executor:

-->找到executor对应的 app

-->获取app的executors缓存中的executor信息

-->设置executor的当前状态

-->向Driver发送 executorUpdated消息

-->若 executor完成了

   --> 从app的缓存中移除executor

   --> 从executor的worker的缓存中移除 executor

   --> 若 executor的退出状态是非正常的

       --> 判断application的重试次数 是否达到了最大值

       --> 若没有达到最大值  则重新进行调度-- 调用 Schedule()

 

   --> 否则进行 removeApplication 操作---executor反复调度都是失败  就是为app失败了

 

 

 

分享到:
评论

相关推荐

    Spark-Core学习知识笔记整理

    Spark-Core文档是本人经三年总结笔记汇总而来,对于自我学习Spark核心基础知识非常方便,资料中例举完善,内容丰富。具体目录如下: 目录 第一章 Spark简介与计算模型 3 1 What is Spark 3 2 Spark简介 3 3 Spark...

    Spark笔记1

    根据“Spark笔记1”的描述,要在Hadoop集群上运行Spark任务,首先需要确保Spark能够正确识别到Hadoop集群。这通常涉及到一些环境变量的设置,例如: - `YARN_HOME`: 指定Hadoop的安装路径。 - `YARN_CONF_DIR`: 指定...

    大数据学习笔记

    ### 大数据学习笔记知识点概览 #### 第一部分:Spark学习 ##### 第1章:Spark介绍 - **1.1 Spark简介与发展** - **背景**:随着大数据处理需求的增长,传统的Hadoop MapReduce框架虽然提供了强大的计算能力,但...

    sparkMlib学习1

    SparkMLlib学习笔记 SparkMLlib是 Apache Spark 机器学习库,提供了一个统一的 API,用于机器学习任务的开发。SparkMLlib 提供了多种数据类型,包括 Vector、LabeledPoint 和 Matrix 等。这些数据类型是机器学习...

    大数据学习笔记.pdf

    第一部分 Spark学习 ....................................................................................................................... 6 第1章 Spark介绍 ..............................................

    西电分布式计算课程(PPT总结版)笔记

    ### 西电分布式计算课程(PPT总结版)笔记知识点详解 #### 一、通信技术 **1.1 分布式计算基础** - **通信技术的重要性:** 在分布式计算领域,节点之间的高效通信是实现高性能计算的核心。文档重点介绍了几种...

    笔记.zip

    1.3 Stateful Processing:Flink允许状态化的计算,这意味着它可以存储中间结果,这对于窗口、聚合等操作至关重要。 二、数据流模型 2.1 DataStream API:DataStream API用于处理无界和有界数据流,提供了丰富的...

    Kafka_learn_kafka_

    **Kafka学习指南** 在IT领域,Apache Kafka是一款广泛使用的分布式流处理平台,它由LinkedIn开发并贡献给了Apache软件基金会。Kafka的核心功能是作为消息队列,提供高吞吐量、低延迟的消息传递,使其成为大数据实时...

Global site tag (gtag.js) - Google Analytics