阅读全文
http://click.aliyun.com/m/23308/
大数据开发过程中常遇到不同运行周期的任务进行依赖,常见 天任务依赖小时任务、 小时任务依赖分钟任务 。那么如何通过大数据开发套件开发这两种场景呢?
本文将从这两个场景出发,结合调度依赖/参数/调度执行等,介绍不同周期调度依赖的最佳操作实践。
再此之前,我们先明确几个概念:
业务日期:业务数据产生的日期,这里指完整一天的业务数据。在大数据开发套件里任务每天能处理的最近的完整一天业务数据是昨天的数据,所以业务日期=日常调度日期-1天。
依赖关系:依赖关系是描述两个或多个节点/工作流之间的语义连接关系,其中上游节点/工作流的运行状态可以影响下游节点/工作流的运行状态,反之则不成立。
调度实例:大数据开发套件的调度系统对周期任务进行调度执行时,会先根据任务的配置进行实例化,每个实例带上具体的定时时间、状态、上下游依赖等属性。
注意:目前数加大数据开发套件每天自动调度的实例都是在昨天晚上23:30生成。
调度规则:调度任务是否能运行起来要满足的条件:
上游任务实例是否都运行成功。若所有上游任务实例都运行成功则触发任务进入等待时间状态。
任务实例定时时间是否已经到。任务实例进入等待时间状态后会check本身定时时间是否到,如果时间到了则进入等待资源状态;
当前调度资源是否充足。任务实例进入等待资源状态后,check当前本项目调度资源是否充足,若充足则可以运行起来。
天任务依赖小时任务
业务场景
系统需求统计截止到每小时的业务数据增量,然后在最后一个小时的数据汇总完成后需要一个任务进行一整天的汇总 。
需求分析
1)每个小时的增量,即每整点起任务统计上个小时时间段的数据量 。需要配置一个每天每整点调度一次的任务,每天最后一个小时的数据是在第二天第一个实例进行统计 。
2)最后的汇总任务为每天执行一次,且必须是在每天最后一个小时的数据统计完成之后才能执行,那么需要配置一个天任务,依赖小时任务的第一个实例 。
分析得出的调度形态如下图:
全文连接
http://click.aliyun.com/m/23308/
分享到:
相关推荐
该平台能够提供数据仓库的构建、多样化抽取任务调度配置、数据血缘分析、数据仓库数据高效的检索等功能,使用户能够更有效地利用数据构建核心系统,加速业务创新。 一站式大数据平台的实现需要考虑到三个方面:统一...
本段内容详细介绍了几个不同的大数据开发项目,每个项目都围绕着特定的业务背景,并涉及到了一系列大数据技术的使用。 1. 游戏运营指标分析项目 该项目主要负责为某款游戏提供运营指标分析,以帮助游戏运营商了解...
本实例对 Altera 提供的 DDR2 控制器 IP 核模块进行操作,每 1.78 秒执 行一次 DDR2 的写入和读出操作。先是从 0 地址开始遍历写 256*64bits 数 据到 DDR2 的地址 0-1023 中;在执行完写入后,执行一次相同地址的读...
7. 自助式开发套件ALPS:ALPS提供了自助服务开发环境,助力用户快速构建自己的应用和服务。 8. 基于Consul的自动化运维架构:Consul作为核心组件,提供了配置管理、监控报警、作业平台等功能。Consul是一个服务发现...
"藏经阁-阿里云大数据技术开发——DT时代的技术进化" 本文档介绍了阿里云大数据技术开发的DT时代的技术进化,涵盖了数据1.0、数据2.0和数据3.0三个阶段的技术架构和发展历程。 数据1.0阶段,阿里云提出基于数据...
《Xscript开发套件2.1.5.0——打造高效手游辅助的神器》 Xscript是一款专为Lua脚本语言爱好者和手游开发者设计的移动脚本开发平台,其核心功能在于模拟人工操作,帮助用户自动化执行一系列任务,极大地提高了手游...
WeDataSphere是微众银行的一套金融级、一站式、开源开放的大数据平台套件。基础平台由数据交换、数据分发、计算、存储四大层次组成,关注底层数据传输计算存储能力;功能平台由平台工具、数据工具、应用工具三大层次...
配置操作系统安装依赖包是指在鲲鹏开发套件中配置操作系统安装依赖包,以便确保鲲鹏性能分析工具的正确安装和运行。开发者可以通过命令行方式或图形化界面来实现此操作。 十二、配置 JDK 配置 JDK 是指在鲲鹏开发...
北斗开发套件是一款专为开发者设计的硬件平台,它提供了集成北斗卫星导航系统功能的模块,使得用户可以方便地进行定位、导航以及其他相关应用的开发。在这个特定的案例中,我们关注的是一个基于北斗开发套件的火灾...
这个是周立功官网给出的USBCAN二次开发套件库。内含文件ControlCAN.dll等
总之,STM32 USB开发套件是STM32初学者和专业开发者进行USB应用开发的理想平台,它提供了从基础学习到项目实践的全套资源,能够帮助开发者快速掌握STM32F103的USB功能,并实现各种USB设备的开发。
该解决方案包括四款核心产品:大数据计算服务MaxCompute、分析型数据库AnalyticDB、大数据开发套件DataWorks,以及关系网络分析I Plus。 大数据计算服务MaxCompute: * 提供标准API开发接口,兼容开源协议软件 * ...
由于具体的一指禅内容未给出,我们无法深入讨论这一部分,但可以推测它可能是鲲鹏开发套件中的一个重要组成部分,可能是用于简化或加速特定开发任务的一个工具或者是一套专门的开发流程指导。 总的来说,鲲鹏开发...
鲲鹏开发套件最佳实践(性能分析工具调优实践) 基于鲲鹏开发套件的性能分析工具调优实践旨在帮助开发者和数据库管理员对 MySQL 数据库进行优化,以提高数据库性能和系统整体性能。本篇文章将详细介绍 MySQL 调优...
《HiSpark_WiFi_IoT智能开发套件——基于硬件与无线物联网的创新实践》 HiSpark_WiFi_IoT智能开发套件是一款专为物联网(IoT)应用设计的开发工具,旨在帮助开发者快速搭建并实现WiFi连接的智能设备。这款套件包含了...
DSP/BIOS 开发套件 DDK1.1 是一个专为数字信号处理(DSP)应用设计的实时操作系统(RTOS)开发工具集。这个套件提供了丰富的资源和例程,帮助开发者高效地利用TI(Texas Instruments)的DSP处理器进行软件开发。在...
BigDataBench:来自Web搜索引擎的大数据基准套件