`

Oozie

 
阅读更多

#hadoop

export HADOOP_HOME=/home/oozie/hadoop-2.7.3

export PATH=$PATH:$HADOOP_HOME/bin

 

#oozie

export OOZIE_HOME=/home/oozie/oozie-5.1.0

export OOZIE_CONFIG=$OOZIE_HOME/conf

export CLASSPATH=$CLASSPATH:$OOZIE_HOME/bin

export PATH=$PATH:$OOZIE_HOME/bin

export OOZIE_URL=http://hadoop-senior.guppy.com:11000/oozie

 

wget http://archive.cloudera.com/gplextras/misc/ext-2.2.zip

wget https://www-us.apache.org/dist/oozie/5.1.0/oozie-5.1.0.tar.gz

tar -zxvf /home/software/oozie-5.1.0.tar.gz -C /home/oozie/

bin/mkdistro.sh -DskipTests -Puber

mv oozie-5.1.0 oozie-5.1.0_

tar -zxvf oozie-5.1.0_/distro/target/oozie-5.1.0-distro.tar.gz  -C /home/oozie/

cd oozie-5.1.0

cp /opt/software/ext-2.2.zip libext/

cd conf/

mkdir spark-conf

cd spark-conf/

vim spark-defaults.conf

# spark on yarn log
spark.yarn.historyServer   http://xx:18080
spark.eventLog.dir      hdfs://xx:9000/spark/historyLog
spark.eventLog.enabled    true

 

vim oozie-site.xml

<property>
   <name>oozie.service.ProxyUserService.proxyuser.root.hosts</name>
   <value>*</value>
</property>
<property>
<name>oozie.service.ProxyUserService.proxyuser.root.groups</name>
  <value>*</value>
</property>
<property>
 <name>oozie.service.JPAService.create.db.schema</name>
 <value>false</value>
</property>
<property>
<name>oozie.service.JPAService.jdbc.driver</name>
<value>com.mysql.jdbc.Driver</value>
</property>
<property>
        <name>oozie.service.JPAService.jdbc.url</name>
        <value>jdbc:mysql://192.168.0.189:3306/oozie?createDatabaseIfNotExist=true</value>
</property>
<property>
        <name>oozie.service.JPAService.jdbc.username</name>
        <value>oozie</value>
</property>
<property>
        <name>oozie.service.JPAService.jdbc.password</name>
        <value>123456</value>
</property>
<property>
        <name>oozie.service.HadoopAccessorService.hadoop.configurations</name>
        <value>*=/home/oozie/hadoop-2.7.3/etc/hadoop</value>
 </property>
<property>
        <name>oozie.service.HadoopAccessorService.action.configurations</name>
        <value>*=/home/oozie/hadoop-2.7.3/etc/hadoop</value>
</property>
<property>
         <name>oozie.service.SparkConfigurationService.spark.configurations</name>
         <value>*=spark-conf</value>
</property>
<property>
         <name>oozie.service.WorkflowAppService.system.libpath</name>
         <value>/user/root/share/lib</value>
</property>
<property>
        <name>oozie.use.system.libpath</name>
        <value>true</value>
</property>
<property>
        <name>oozie.subworkflow.classpath.inheritance</name>
        <value>true</value>
</property>

 

tar -zxvf /home/software/hadoop-2.7.3.tar.gz -C /home/oozie/

cd hadoop-2.7.3/

vim etc/hadoop/hadoop-env.sh 

export JAVA_HOME=/etc/alternatives/java_sdk_1.8.0/

 

vim etc/hadoop/hdfs-site.xml

     <!-- 指定HDFS副本的数量 -->
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>

    <property>
        <name>dfs.secondary.http.address</name>
        <value>192.168.0.189:50090</value>
    </property>

 

vim etc/hadoop/core-site.xml

    <!-- 指定HADOOP所使用的文件系统schema(URI),HDFS的老大(NameNode)的地址 -->
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://192.168.0.189:9000</value>
    </property>
    <!-- 指定hadoop运行时产生文件的存储目录 -->
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/home/hadoop/hadoop-2.7.3/tmp</value>
    </property>
<!-- OOZIE -->
<property>
<name>hadoop.proxyuser.root.hosts</name>
<value>master</value>
</property>
<property>
<name>hadoop.proxyuser.root.groups</name>
<value>*</value>
</property>

 

bin/hdfs namenode -format

sbin/start-all.sh

 

bin/hadoop dfs -mkdir /user/root/examples

bin/hadoop dfs -put /home/oozie/oozie-5.1.0/examples/* /user/root/examples

 

vim oozie-5.1.0/conf/oozie-site.xml

bin/oozie-setup.sh

 

bin/oozie-setup.sh sharelib create -fs hdfs://192.168.0.189:9000 -locallib oozie-sharelib-5.1.0.tar.gz

cp /opt/modules/hive-2.3.6/lib/mysql-connector-java-5.1.46.jar ./lib

bin/ooziedb.sh create -sqlfile oozie.sql -run

bin/oozied.sh start

tar zxvf oozie-examples.tar.gz

vim examples/apps/spark/job.properties

vim examples/apps/spark/workflow.xml

bin/oozie job -oozie http://192.168.0.189:11000/oozie -config examples/apps/spark/job.properties -run

 

分享到:
评论

相关推荐

    oozie-5.2.1-distro.tar.gz

    Apache Oozie 是一个工作流调度系统,用于管理和协调Hadoop生态系统中的作业。Oozie 5.2.1是该软件的一个版本,提供了一系列改进和修复,旨在提高稳定性和性能。这个"oozie-5.2.1-distro.tar.gz"文件是一个压缩包,...

    oozie oozie

    在Hadoop生态系统中,Oozie是一个工作流调度系统,用于管理Hadoop作业。它允许用户定义、调度和协调各种Hadoop相关任务,如MapReduce、Pig、Hive、Sqoop等。当遇到“Table ‘oozie.VALIDATE_CONN’ doesn’t exist”...

    Oozie大数据调度系统从入门到精通视频教程

    从零开始讲解大数据调度系统构成,集成大数据计算任务构建大数据工作流,基于Oozie构建实现企业级自动化任务开发 课程亮点 1,知识体系完备,从小白到大神各阶段读者均能学有所获。 2,生动形象,化繁为简,讲解...

    oozie-branch-4.1.zip

    《Apache Oozie 4.1 源码解析与Hadoop集成详解》 Apache Oozie 是一个工作流调度系统,用于管理 Hadoop 生态系统中的作业执行。它允许用户定义、调度和协调各种类型的任务,如 MapReduce、Pig、Hive、Spark 等,...

    hue平台oozie工作流操作sqoop,把mysql.pdf

    本文主要讲述在Hue平台使用Oozie工作流操作Sqoop工具将MySQL数据库的数据传输到HDFS中,并最终导入到Hive表中的经验。以下是详细知识点: 1. Hue平台和Oozie工作流简介: Hue是一种开源的用户界面,用于简化与...

    Oozie调度SparkSQL样例代码_oozie_hive_

    在大数据处理领域,Oozie和Hive是两个重要的组件。Oozie是Apache Hadoop的一个工作流调度系统,用于管理Hadoop作业的生命周期,而Hive则是一种基于Hadoop的数据仓库工具,允许用户使用SQL(称为HQL)对大规模数据...

    Oozie安装部署及任务定义说明

    **Oozie安装部署** Oozie是Apache Hadoop生态系统中的一个工作流调度系统,用于管理Hadoop作业的生命周期。以下是对Oozie安装和部署的详细步骤: 1. **Maven安装** - 下载Maven的tar包,如maven-3.3.2,并解压至/...

    oozie的控制台用ext依赖

    在IT行业中,Oozie是Apache Hadoop生态系统中的一个工作流调度系统,它用于管理和调度Hadoop相关的任务。Hue则是一个用户界面套件,旨在提供对Hadoop生态系统的友好操作界面,包括对Oozie的工作流进行可视化操作。当...

    oozie所需的ext下载

    在大数据处理领域,Oozie是一个非常重要的工作流调度系统,它被广泛应用于Hadoop生态系统中,用于管理和调度Hadoop相关的任务,如MapReduce、Pig、Hive、Sqoop等。Oozie的核心功能是协调工作流程,监控作业状态,并...

    OozieWeb界面需要的组件

    **OozieWeb界面及其组件详解** 在大数据处理领域,Oozie是一个非常重要的工作流管理系统,主要用于协调Hadoop生态系统中的各种任务。OozieWeb界面是Oozie的用户交互部分,允许用户通过Web浏览器进行工作流的提交、...

    OOZIE 配置和调度流程(1).doc

    * OOZIE 系统时区配置:在 CM OOZIE 的配置界面,oozie-site.xml 的 Oozie Server 高级配置代码段(安全阀)这一栏配置如下属性,然后重启 OOZIE 服务:&lt;property&gt; &lt;name&gt;oozie.processing.timezone&lt;/name&gt; &lt;value&gt;...

    oozie调度脚本.docx

    标题中的"oozie调度脚本.docx"指出我们要讨论的核心技术是Apache Oozie,一个在Hadoop生态系统中用于管理工作流的工具。Oozie提供了对多种Hadoop任务(如MapReduce、HDFS操作、Shell命令、Hive查询等)的集中式、...

    大数据技术之Oozie入门到精通.txt

    ### 大数据技术之Oozie入门到精通 #### 一、Oozie简介与应用场景 **Oozie**是一款开源的工作流调度系统,主要用于在Hadoop生态系统中管理和执行复杂的数据处理任务。它通过定义一系列有依赖关系的操作来实现工作流...

    oozie控制台ext jar包.zip

    《oozie控制台ext jar包.zip》是一款专用于oozie web控制台的扩展包,它包含了一组必要的jar文件,能够极大地丰富和优化oozie控制台的功能与用户体验。该压缩包的主要目标是提供一个增强版的oozie web界面,使得在...

    oozie介绍及使用详解

    **Oozie简介** Oozie是Apache Hadoop项目中的一个工作流调度系统,用于管理Hadoop生态系统中的批处理作业。它支持Hadoop MapReduce、Pig、Hive、Sqoop等多种工具的任务调度,同时也可扩展到其他自定义Java或Shell...

    尚硅谷大数据技术之Oozie1

    【Oozie简介】 Oozie是Apache项目中的一个工作流管理系统,专门设计用于管理和协调Hadoop生态系统中的任务。它的名字"Oozie"来源于驯象人,寓意其能够像驯象一样管理复杂的分布式任务。Oozie由Cloudera公司贡献给...

    Apache Hadoop---Oozie.docx

    Apache Hadoop 中,Oozie 是一个至关重要的组件,它是一个开源的工作流调度引擎,专门设计用于管理和协调在Hadoop生态系统中的各种作业。Oozie 由Cloudera公司贡献给Apache社区,它是一个基于工作流引擎的系统,能够...

    oozie配置文件

    **Oozie配置文件详解** 在Hadoop生态系统中,Oozie是一个工作流调度系统,用于管理和协调Hadoop作业,包括Hive、Pig、MapReduce、Spark等。Oozie与Hadoop集群的其他组件紧密集成,提供了一种集中式的方式来管理作业...

    调度器GUI调研(Azkaban&Oozie&Airflow)

    【调度器GUI调研(Azkaban&Oozie&Airflow)】 调度器在IT行业中扮演着至关重要的角色,主要用于自动化任务执行,确保数据处理、分析以及其他业务流程按预定的时间表和顺序进行。本文将深入探讨三个流行的调度器——...

    ext-2.2.zip oozie

    在下载并解压`ext-2.2.zip`后,你需要将解压得到的文件夹放置到Oozie服务器的正确目录下,通常是`oozie-server/webapps/oozie/WEB-INF/lib`或者`oozie/sharelib`目录,具体位置取决于Oozie的版本和你的配置。...

Global site tag (gtag.js) - Google Analytics