`

spark-学习笔记--24 TaskScheduler

 
阅读更多

TaskScheduler

 

 

 

 

1、stage创建 taskSet  提交给--> taskScheduler --> 分配给 executor 执行

 

2、org.apache.spark.scheduler.TaskSchedulerImpl 的 submitTasks 是入口

 

3、每个taskSet 创建一个 TaskSetManager对象--负责taskSet的监视管理

 

4、taskSchedulerImpl 的  resourceOffer 执行任务分配算法 将各个task 分配到executor上去

 

    4.1  将可用的 executor 随机打乱--目的是为了负载均衡

4.2  提交的taskSet放入到调度池    执行调度分配算法时 会从调度池取出 排好序的taskSet

4.3  本地化级别:

                 PROCESS_LOCAL 进程本地化----- RDD的 partition 和task   进入一个executor内

                 NODE_LOCAL    节点本地化----- RDD的 partition 和task   不在一个executor内  在同一个woker节点上

                 NO_PREF       无本地化

                 RACK_LOCAL    机架本地化

                 ANY           任意

 

        

尝试以最优的 本地化级别 启动 taskset

 

 

 

 

5、分配 task到 executor上之后 执行 launchTask() 方法  

 

   将分配的task发送launchTask消息到对应的executor上去   由executor启动并执行task

分享到:
评论

相关推荐

    apache-dolphinscheduler-3.1.4-bin.tar.gz

    apache-dolphinscheduler-3.1.4-bin.tar.gzapache-dolphinscheduler-3.1.4-bin.tar.gzapache-dolphinscheduler-3.1.4-bin.tar.gzapache-dolphinscheduler-3.1.4-bin.tar.gzapache-dolphinscheduler-3.1.4-bin.tar....

    spark-2.4.0-bin-without-hadoop.tgz

    最后,Spark 的调度系统(Scheduler)在 2.4.0 版本中也有所优化,它能更有效地分配资源,提高整体的运行效率。YARN 和 Mesos 等资源管理器与 Spark 的集成也得到了增强。 总的来说,Spark 2.4.0 是一个功能强大且...

    spark-2.4.4-bin-hadoop2.6.tgz

    Spark使用FIFO和Fair Scheduler,根据作业优先级和资源需求进行任务调度。 9. **安全性**: Spark 2.4.4增加了对Kerberos等安全协议的支持,增强了集群的安全性。 10. **监控和调优**: Spark提供了Web UI来...

    light-task-scheduler-1.7.0.zip

    《light-task-scheduler-1.7.0:深入解析分布式定时任务系统》 在现代的互联网应用中,定时任务扮演着至关重要的角色,它能够帮助我们实现自动化处理、数据同步、周期性报告等功能。"light-task-scheduler"是这样一...

    apache-dolphinscheduler-3.1.4-src.tar.gz

    apache-dolphinscheduler-3.1.4-src.tar.gzapache-dolphinscheduler-3.1.4-src.tar.gzapache-dolphinscheduler-3.1.4-src.tar.gzapache-dolphinscheduler-3.1.4-src.tar.gzapache-dolphinscheduler-3.1.4-src.tar....

    spark-2.4.0源码

    8. **DAGScheduler和TaskScheduler**:Spark的调度系统,DAGScheduler将用户作业转化为Stage,而TaskScheduler负责将Stage分解为任务并在Executor上执行。 9. **YARN和Mesos集成**:Spark可以运行在Hadoop的YARN或...

    TaskScheduler-适用于Arduino+ESPx+STM32+nRF+其他微控制器的协作多任务处理器-优质嵌入式项目

    标题中的“TaskScheduler”指的是一个专门用于微控制器的协作多任务...通过下载和学习提供的"优质嵌入式项目分享.zip"文件,开发者可以深入理解如何在实际项目中有效利用TaskScheduler,提高代码的组织结构和整体效率。

    apache-dolphinscheduler-1.3.2-dolphinscheduler-bin.tar.gz

    这个压缩包“apache-dolphinscheduler-1.3.2-dolphinscheduler-bin.tar.gz”是DolphinScheduler的1.3.2版本的二进制发行版,包含了运行和配置DolphinScheduler所需的所有基本文件。 **1. DolphinScheduler的核心...

    light-task-scheduler-master.zip

    light-task-scheduler-master.zip

    PSO-Task-scheduler-master_粒子群算法_粒子群调度_PSO_资源调度优化_优化调度_

    在“PSO-Task-scheduler-master”项目中,开发者已经实现了这样一个基于粒子群优化的调度器,通过分析其代码结构和算法实现,我们可以学习到如何将PSO理论应用于实际问题,解决复杂的资源调度优化挑战。 总结,粒子...

    A-Deeper-Understanding-of-Spark-Internals-Aaron-Davidson

    - **任务调度器(Task Scheduler)**:负责将DAG中的任务分配到集群中的各个节点上执行。 ##### 3. Shuffle操作 Shuffle操作在Spark中是指数据重新分布的过程,尤其是在执行如`groupByKey`、`reduceByKey`等操作时...

    light-task-scheduler, Distributed Scheduled Job Framework.zip

    《light-task-scheduler:分布式调度任务框架解析》 在当今的云计算和大数据时代,分布式系统已经成为企业级应用的主流架构。其中,分布式调度任务框架在处理大规模数据处理、任务执行和资源管理方面扮演着至关重要...

    Arduino-TaskScheduler.zip

    Arduino-TaskScheduler.zip,Arduino、ESPX和STM32微控制器任务调度器的协同多任务处理,Arduino是一家开源软硬件公司和制造商社区。Arduino始于21世纪初,深受电子制造商的欢迎,Arduino通过开源系统提供了很多灵活性...

    海豚调度,dolphinscheduler-data-quality-dev-SNAPSHOT最新版本3.1.1

    DolphinScheduler(海豚调度) dolphinscheduler-data-quality-dev-SNAPSHOT数据质量jar包添加配置信息:<server-name>/conf/common.propertiesdata-quality.jar.name=dolphinscheduler-data-quality-dev-SNAPSHOT.jar...

    apache-dolphinscheduler-incubating-1.2.0-dolphinscheduler-backend-bin.tar.gz

    在“apache-dolphinscheduler-incubating-1.2.0-dolphinscheduler-backend-bin.tar.gz”这个压缩包中,包含了DS分布式工作流的后台服务组件,这个稳定版本为1.2.0,是DolphinScheduler在Apache孵化器项目中的一个...

    apache-dolphinscheduler-3.0.0-bin.tar.gz

    2. 任务(Task):工作流中的基本单元,可以是SQL查询、Shell脚本、Spark作业等。 3. 节点(Node):任务在工作流中的呈现形式,分为依赖节点、并行节点和决策节点等。 4. 图形化界面:提供拖拽式设计,用户可以通过...

    apache-dolphinscheduler-incubating-1.2.0-dolphinscheduler-front-bin.tar.gz

    标题中的"apache-dolphinscheduler-incubating-1.2.0-dolphinscheduler-front-bin.tar.gz"表示的是DS的1.2.0稳定版本的前端(front)部分的源码包,它被打包成tar.gz格式,这是一种常见的Linux系统下的压缩文件格式...

    apache-dolphinscheduler-3.1.4-bin

    在这个“apache-dolphinscheduler-3.1.4-bin”安装包中,包含了一系列用于安装和运行DolphinScheduler所需的文件。 首先,让我们详细了解Apache DolphinScheduler的核心功能: 1. **工作流设计**:Dolphin...

    apache-dolphinscheduler-3.2.1-src.tar.gz、bin.tar.gz

    在这个场景中,我们有两个压缩包文件:"apache-dolphinscheduler-3.2.1-src.tar.gz" 和 "apache-dolphinscheduler-3.2.1-bin.tar.gz"。 1. **Apache DolphinScheduler源码包(apache-dolphinscheduler-3.2.1-src....

    kubernetes之kube-scheduler下载

    2. **下载二进制**:找到对应版本的发布页面,通常会有`binaries`部分,下载适用于你的操作系统的`kube-scheduler`二进制文件,如`kube-scheduler-linux-amd64.tar.gz`。 3. **解压**:使用`tar -zxvf kube-...

Global site tag (gtag.js) - Google Analytics