`

spark内核揭秘-13-Worker中Executor启动过程源码分析

阅读更多

进入Worker类源码:


 


可以看出Worker本身是Akka中的一个Actor。

 

进入Worker类的LaunchExecutor:



从源代码可以看出Worker节点上要分配CPU和Memory给新的Executor,首先需要创建一个ExecutorRunner:

ExecutorRunner是用于维护executor进程的:

 

 

1、进入ExecutorRunner 的start方法:


1.1、进入fetchAndRunExecutor()方法(核心方法):



2、进入 master ! ExecutorStateChanged(appId, execId, manager.state, None, None)方法:

发送消息给Master:



我们再回到到launchExecutor方法:

 

进入ExecutorAdded方法:


上面代码利用Akka 发送ExecutorStateChanged方法给Master

 

进入 Master 的ExecutorStateChanged方法:


PS:感觉代码分析的有点乱,不是很理想,希望大家知道,谢谢

进入Worker类的LaunchExecutor:



1、进入ExecutorRunner 的start方法:


2、进入fetchAndRunExecutor()方法:



0
1
分享到:
评论

相关推荐

    Spark-内核源码解析.docx

    为了深入了解 Spark 的内部机制,我们需要对其内核源码进行深入分析。 Application/App 在 Spark 中,Application 指的是用户编写的 Spark 应用程序/代码,包含了 Driver 功能代码和分布在集群中多个节点上运行的 ...

    【Spark内核篇01】Spark通信架构和集群启动流程1

    Spark内核篇01主要探讨的是Spark的通信架构和集群启动流程,这对于理解Spark如何高效地处理大数据至关重要。首先,我们需要了解Spark的核心组件——Driver和Executor。 Driver是Spark作业的控制中心,它执行用户...

    Spark2.2版本内核源码深度剖析.zip

    `Worker原理剖析与源码分析.html`(9)会介绍Spark集群中的Worker节点,它是任务执行的物理实体,负责启动executor进程并管理其生命周期。源码分析将深入到Worker如何接收和执行任务,以及如何报告状态。 最后,`...

    【Spark内核篇02】Spark模式运行机制1

    在Spark内核篇02中,我们主要讨论了Spark在三种不同模式下的运行机制:Yarn模式、Yarn-Client模式和Standalone模式,包括这两种运行模式下的Cluster和Client模式。 首先,我们来看Yarn模式的运行流程: 1. 用户通过...

    Spark技术内幕深入解析Spark内核架构设计与实现原理

    《Spark技术内幕深入解析Spark内核架构设计与实现原理》这本书是Spark技术研究的重要参考资料,由张安站编著,提供了全面的Spark内核解析,包括详细的架构设计和实现原理。Spark作为当前大数据处理领域的重要工具,...

    Spark原理及源码剖析1

    理解Spark的内核原理和源码分析对于开发者来说至关重要,有助于优化应用性能,定位并解决问题。通过深入学习Spark的Master、Worker、Driver和Executor的工作方式,以及不同集群部署模式,可以更好地理解和利用Spark...

    Spark技术内幕深入解析Spark内核架构设计与实现原理.pdf

    《Spark技术内幕深入解析Spark内核架构设计与实现原理》这本书深入探讨了Apache Spark这一分布式计算框架的核心架构和实现机制,对于理解Spark的工作原理及其在大数据处理中的应用具有极高的价值。以下是对其中主要...

    Spark技术内幕 深入解析Spark内核架构设计与实现原理 高清 完整书签

    《Spark技术内幕:深入解析Spark内核架构设计与实现原理》是一本专注于Spark技术深度剖析的书籍,旨在帮助读者理解Spark的核心架构、设计理念以及其实现机制。这本书高清完整,包含了完整的书签,方便读者查阅和学习...

    Spark快速大数据分析(更多IT教程 微信dtygxmb).docx

    - **性能优化**: 持续改进Spark内核以提升计算效率。 - **云原生集成**: 更紧密地集成到云平台中,支持多云环境下的部署。 - **AI与大数据融合**: 将深度学习等先进技术与Spark结合,提高数据分析的智能化水平。 ##...

    Spark总体架构和运行流程

    Spark 运行架构如图 1 所示,包括集群资源管理器(Cluster Manager)、多个运行作业任务的工作结点(Worker Node)、每个应用的任务控制结点(Driver)和每个工作结点上负责具体任务的执行进程(Executor)。...

    大数据开发面试学习指南

    在面试中,可能会被问及 Spark 的架构原理、RDD 模型及 Spark SQL 等知识点。 - **架构原理**:Master-Worker 架构;Driver Program 负责提交作业并监控执行情况;Executor 运行具体任务。 - **RDD 模型**:弹性...

Global site tag (gtag.js) - Google Analytics