`

oozie: Workflow

 
阅读更多

Workflow Definition

A workflow definition is a DAG with control flow nodes (start, end, decision, fork, join, kill) or action nodes (map-reduce, pig, etc.), nodes are connected by transitions arrows.

The workflow definition language is XML based and it is called hPDL (Hadoop Process Definition Language).

Oozie does not support cycles in workflow definitions, workflow definitions must be a strict DAG.

Workflow Nodes

Workflow nodes are classified in control flow nodes and action nodes:

  • Control flow nodes: nodes that control the start and end of the workflow and workflow job execution path.
  • Action nodes: nodes that trigger the execution of a computation/processing task.

Node names and transitions must be conform to the following pattern =[a-zA-Z][\-_a-zA-Z0-0]*=, of up to 20 characters long.

 

 

 

 

 

 

 

 

 

Reference

https://oozie.apache.org/docs/4.0.1/WorkflowFunctionalSpec.html

  • 大小: 145.3 KB
分享到:
评论

相关推荐

    oozie使用整理

    <workflow-app name="foo-wf" xmlns="uri:oozie:workflow:0.1"> </workflow-app> ``` 2. **End 控制节点**:表示工作流的成功结束。当工作流中的一个任务到达 end 节点时,其他正在执行的任务会被终止。示例...

    Oozie调度SparkSQL样例代码_oozie_hive_

    <workflow-app name="spark-sql-workflow" xmlns="uri:oozie:workflow:0.5"> <spark xmlns="uri:oozie:spark-action:0.2"> ${jobTracker} ${nameNode} <name>spark.master <value>yarn-cluster ...

    oozie-workflow-generator

    通过使用oozie-workflow-generator,开发者可以更加高效地构建和维护复杂的工作流定义,减少手动编写XML配置文件的繁琐工作。 Oozie工作流主要由一系列动作(如Hadoop MapReduce、Pig、Hive、Sqoop等)和控制流程...

    OOZIE 配置和调度流程(1).doc

    * 相关文件说明:coordinator.xml 是 OOZIE coord 定时调度文件,workflow.xml 是 OOZIE 作业执行文件,job_h.properties 是作业按小时调度相关参数配置文件,job_test.properties 是测试 OOZIE 是否可以正常调度...

    oozie-to-airflow:Oozie从Workflow到Airflow DAG的迁移工具

    Oozie自气流 一种在工作流程和工作流程之间轻松转换的工具。 该程序的目标是Apache Airflow> = 1.10和Apache Oozie 1.0 XML模式。 如果您想为该项目做出贡献,请查看目录背景Apache Airflow是由AirBnB在2014年开发的...

    12_离线计算系统_第12天(辅助系统).docx

    <workflow-app name="myWorkflow" xmlns="uri:oozie:workflow:0.5"> <sqoop xmlns="uri:oozie:sqoop-action:0.2"> ${jobTracker} ${nameNode} <name>mapred.job.queue.name <value>default <arg>...

    Oozie - The Workflow Scheduler for Hadoop

    - **工作流(Workflow)**:Oozie的工作流是一系列按照指定顺序执行的Hadoop作业(如MapReduce、Pig、Hive等)的集合。 - **数据管道(Data Pipeline)**:一个工作流能够构成数据处理的管道,确保数据按照既定的...

    oozie-4.3.1.tar.gz

    1. 工作流(Workflow):Oozie的核心是基于XML的工作流定义,它描述了作业流程的顺序和条件。工作流可以包含多个动作,如执行Hive查询、运行MapReduce任务等。 2. 协调器(Coordinator):协调器负责根据时间或数据...

    oozie-workflow-checker:验证复杂的Apache Oozie Hadoop工作流程-开源

    库验证了复杂的Oozie工作流程(http://oozie.apache.org/)。 两种使用方案:1)使用指定的参数执行工作流程,结果得到传递的节点的列表。 注意:在所有工作流程函数中,现在仅支持“ wf:conf”。 2)检查被调用的...

    Apache Oozie_ The Workflow Scheduler for Hadoop

    Apache Oozie是Hadoop生态系统中的一个关键组件,主要用于调度和管理工作流,是管理大数据作业的先进工具。Oozie可以调度一系列作业,这些作业可以是MapReduce任务,也可以是Hive查询或者Pig脚本等。它支持定时调度...

    尚硅谷大数据技术之Oozie1

    1. **Workflow**:Workflow是Oozie的核心部分,负责定义任务的执行流程。它按照预设的顺序执行各个节点,并且支持`fork`和`join`操作。`fork`允许任务分支成多个并行执行的子任务,而`join`则将这些子任务的结果合并...

    oozie_workflow_status_check:Nagios 插件 - 专为 Hortonworks 数据平台 2.1 设计

    ###Hortonworks 数据平台 2.1 Nagios 插件 - Oozie 工作流状态 此插件将识别和提醒 Oozie 工作流的状态。 ###News 更新了 HDP 2.1 Nagios 集成。 此插件现在仅报告过去满足管理员指定时间范围标准的固定数量的作业...

    Apache Ooize Workflow Scheduler for Hadoop

    Apache Oozie是一个专为管理Hadoop作业而设计的工作流调度系统。本书为读者提供了一个实践性的指南,通过两个经验丰富的Hadoop实践者的亲身传授,深入讲解了这个功能强大且灵活的平台。读者在搭建Oozie服务器后,将...

    oozie介绍及使用详解

    Oozie工作流是以XML格式定义的,称为WDL(Workflow Definition Language)。一个工作流通常由一系列动作组成,这些动作可以是Hadoop作业,也可以是控制流程的动作,如决策节点、分支和合并节点。 1. **控制节点**:...

    Oozie安装部署及任务定义说明

    - 编写作业定义文件(如workflow.xml),指定作业的执行流程。 - 将作业依赖的库文件(JARs)上传到HDFS。 - 创建job.properties文件,包含作业配置信息。 - 使用oozie客户端命令提交作业,如`oozie job -submit...

    oozie_demo

    1. **Oozie工作流程定义**:Oozie的工作流程是以XML格式定义的,文件通常命名为`workflow.xml`。在ooziedemo中,这个文件会包含一系列的行动(actions)和决策节点(decision nodes),描述了任务的执行顺序和条件。...

    Apache Hadoop---Oozie.docx

    5. Oozie 提供了多种服务,包括Workflow Engine(工作流引擎)、Coordinator Engine(协调引擎)、Bundle Engine(捆绑引擎)和SLA(服务水平协议),这些服务使得Oozie能够实现定时触发、数据驱动和作业执行监控。...

    大数据技术之Oozie.doc

    1. **Workflow**:工作流模块是Oozie的基础,它定义了一系列有序的任务节点,通过控制流节点(如start、end、kill、decision、fork、join)和动作节点(如MapReduce、Pig、Hive、Shell等)来实现任务的顺序执行和...

    大数据技术之Oozie入门到精通.txt

    工作流(Workflow)** - 工作流是Oozie中最基本的概念之一,它定义了一组相互依赖的任务集合。 - 每个任务都是一个原子操作,如运行MapReduce作业、执行Hive查询等。 - 工作流可以通过XML文件定义,其中包含了任务...

Global site tag (gtag.js) - Google Analytics