spark-学习笔记--16 spark1.3 状态改变 - 杨中磊的博客 - ITeye博客

`

05rjyzl11

浏览: 151106 次
性别:
来自: 北京

最近访客更多访客>>

breezylee

laopo521anping

wolfwell

gzjhqh

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

isaiah282485068：怎么不出书出来啊，市场上好却这方面的书啊
mule in action翻译1 : 第一部分 mule 核心

spark-学习笔记--16 spark1.3 状态改变

博客分类：

spark

阅读更多

spark1.3 状态改变

Driver：

状态是错误、完成、被杀掉、失败将其从缓存中移除，

向completedDriver中添加Driver，

设置Driver的state、exception ，

将Driver所在的worker移除driver

调用Schedule()方法

executor：

-->找到executor对应的 app

-->获取app的executors缓存中的executor信息

-->设置executor的当前状态

-->向Driver发送 executorUpdated消息

-->若 executor完成了

--> 从app的缓存中移除executor

--> 从executor的worker的缓存中移除 executor

--> 若 executor的退出状态是非正常的

--> 判断application的重试次数是否达到了最大值

--> 若没有达到最大值则重新进行调度-- 调用 Schedule()

--> 否则进行 removeApplication 操作---executor反复调度都是失败就是为app失败了

分享到：

spark-学习笔记--17 spark1.3 资源调度 | spark-学习笔记--15 master注册机制

2018-11-06 11:25
浏览 352
评论(0)
分类:编程语言
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Spark-Core学习知识笔记整理: Spark-Core文档是本人经三年总结笔记汇总而来，对于自我学习Spark核心基础知识非常方便，资料中例举完善，内容丰富。具体目录如下：目录第一章 Spark简介与计算模型 3 1 What is Spark 3 2 Spark简介 3 3 Spark...

Spark笔记1: 根据“Spark笔记1”的描述，要在Hadoop集群上运行Spark任务，首先需要确保Spark能够正确识别到Hadoop集群。这通常涉及到一些环境变量的设置，例如： - `YARN_HOME`: 指定Hadoop的安装路径。 - `YARN_CONF_DIR`: 指定...

大数据学习笔记: ### 大数据学习笔记知识点概览 #### 第一部分：Spark学习 ##### 第1章：Spark介绍 - **1.1 Spark简介与发展** - **背景**：随着大数据处理需求的增长，传统的Hadoop MapReduce框架虽然提供了强大的计算能力，但...

sparkMlib学习1: SparkMLlib学习笔记 SparkMLlib是 Apache Spark 机器学习库，提供了一个统一的 API，用于机器学习任务的开发。SparkMLlib 提供了多种数据类型，包括 Vector、LabeledPoint 和 Matrix 等。这些数据类型是机器学习...

大数据学习笔记.pdf: 第一部分 Spark学习 ....................................................................................................................... 6 第1章 Spark介绍 ..............................................

西电分布式计算课程（PPT总结版）笔记: ### 西电分布式计算课程（PPT总结版）笔记知识点详解 #### 一、通信技术 **1.1 分布式计算基础** - **通信技术的重要性：** 在分布式计算领域，节点之间的高效通信是实现高性能计算的核心。文档重点介绍了几种...

笔记.zip: 1.3 Stateful Processing：Flink允许状态化的计算，这意味着它可以存储中间结果，这对于窗口、聚合等操作至关重要。二、数据流模型 2.1 DataStream API：DataStream API用于处理无界和有界数据流，提供了丰富的...

Kafka_learn_kafka_: **Kafka学习指南** 在IT领域，Apache Kafka是一款广泛使用的分布式流处理平台，它由LinkedIn开发并贡献给了Apache软件基金会。Kafka的核心功能是作为消息队列，提供高吞吐量、低延迟的消息传递，使其成为大数据实时...

Global site tag (gtag.js) - Google Analytics