进入Worker类源码:
可以看出Worker本身是Akka中的一个Actor。
进入Worker类的LaunchExecutor:
从源代码可以看出Worker节点上要分配CPU和Memory给新的Executor,首先需要创建一个ExecutorRunner:
ExecutorRunner是用于维护executor进程的:
1、进入ExecutorRunner 的start方法:
1.1、进入fetchAndRunExecutor()方法(核心方法):
2、进入 master ! ExecutorStateChanged(appId, execId, manager.state, None, None)方法:
发送消息给Master:
我们再回到到launchExecutor方法:
进入ExecutorAdded方法:
上面代码利用Akka 发送ExecutorStateChanged方法给Master
进入 Master 的ExecutorStateChanged方法:
PS:感觉代码分析的有点乱,不是很理想,希望大家知道,谢谢
进入Worker类的LaunchExecutor:
1、进入ExecutorRunner 的start方法:
2、进入fetchAndRunExecutor()方法:
相关推荐
为了深入了解 Spark 的内部机制,我们需要对其内核源码进行深入分析。 Application/App 在 Spark 中,Application 指的是用户编写的 Spark 应用程序/代码,包含了 Driver 功能代码和分布在集群中多个节点上运行的 ...
Spark内核篇01主要探讨的是Spark的通信架构和集群启动流程,这对于理解Spark如何高效地处理大数据至关重要。首先,我们需要了解Spark的核心组件——Driver和Executor。 Driver是Spark作业的控制中心,它执行用户...
`Worker原理剖析与源码分析.html`(9)会介绍Spark集群中的Worker节点,它是任务执行的物理实体,负责启动executor进程并管理其生命周期。源码分析将深入到Worker如何接收和执行任务,以及如何报告状态。 最后,`...
在Spark内核篇02中,我们主要讨论了Spark在三种不同模式下的运行机制:Yarn模式、Yarn-Client模式和Standalone模式,包括这两种运行模式下的Cluster和Client模式。 首先,我们来看Yarn模式的运行流程: 1. 用户通过...
《Spark技术内幕深入解析Spark内核架构设计与实现原理》这本书是Spark技术研究的重要参考资料,由张安站编著,提供了全面的Spark内核解析,包括详细的架构设计和实现原理。Spark作为当前大数据处理领域的重要工具,...
理解Spark的内核原理和源码分析对于开发者来说至关重要,有助于优化应用性能,定位并解决问题。通过深入学习Spark的Master、Worker、Driver和Executor的工作方式,以及不同集群部署模式,可以更好地理解和利用Spark...
《Spark技术内幕深入解析Spark内核架构设计与实现原理》这本书深入探讨了Apache Spark这一分布式计算框架的核心架构和实现机制,对于理解Spark的工作原理及其在大数据处理中的应用具有极高的价值。以下是对其中主要...
《Spark技术内幕:深入解析Spark内核架构设计与实现原理》是一本专注于Spark技术深度剖析的书籍,旨在帮助读者理解Spark的核心架构、设计理念以及其实现机制。这本书高清完整,包含了完整的书签,方便读者查阅和学习...
- **性能优化**: 持续改进Spark内核以提升计算效率。 - **云原生集成**: 更紧密地集成到云平台中,支持多云环境下的部署。 - **AI与大数据融合**: 将深度学习等先进技术与Spark结合,提高数据分析的智能化水平。 ##...
Spark 运行架构如图 1 所示,包括集群资源管理器(Cluster Manager)、多个运行作业任务的工作结点(Worker Node)、每个应用的任务控制结点(Driver)和每个工作结点上负责具体任务的执行进程(Executor)。...
在面试中,可能会被问及 Spark 的架构原理、RDD 模型及 Spark SQL 等知识点。 - **架构原理**:Master-Worker 架构;Driver Program 负责提交作业并监控执行情况;Executor 运行具体任务。 - **RDD 模型**:弹性...