`
michaellou
  • 浏览: 56377 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

oozie 4.0.0 on hadoop2.4.1安装笔记(完整版)

 
阅读更多

oozie版本:4.0.0(开始在官网下载4.0.1的版本,编译一直无法通过,报错说oozie-hadoop-4.0.1的jar,换4.0.0竟然没报错,不解)

hadoop 2.4.1 由于测试集群用了改版本,无奈,原本github上有编译好的oozie,但是最高才3.0,只能支持hadoop 2.0

==================================华丽的分割====================================

1.下载oozie源码[http://archive.apache.org/dist/oozie/4.0.0/]

2.下载ext2.2.zip【http://oozie.apache.org/docs/4.0.1/DG_QuickStart.html】

3.下载http-client和http-core(oozie.war 需要该包,否则server起来后,访问页面会报错)

 

4.解压oozie包后修改pom.xml,jdk改为1.7,hadoop.version改为2.4.1(其它hbase,pig等相应修改)

5.添加环境变量;

------------------------------------------------------------------------------------------------------------------------------

export HADOOP_HOME=/usr/local/hadoop

export HADOOP_INSTALL=/usr/local/hadoop

export HADOOP_MAPRED_HOME=$HADOOP_INSTALL

export HADOOP_COMMON_HOME=$HADOOP_INSTALL

export HADOOP_HDFS_HOME=$HADOOP_INSTALL

export YARN_HOME=$HADOOP_INSTALL

export OOZIE_HOME=/opt/oozie

export OOZIE_CONFIG=/opt/oozie/conf

 

PATH=$PATH:$HOME/bin:/usr/local/zookeeper-3.4.6/bin:$HADOOP_HOME/bin:$OOZIE_HOME/bin

------------------------------------------------------------------------------------------------------------------------------

6.编译oozie,进入bin,执行【mkdistro.sh -DskipTests】,进入漫长的编译过程,中间卡住,退出重新编译,直至全部success

7.将编译好的oozie-4.0.0-distro.tar.gz拷出来,解压,创建软链ln -s oozie-4.0.0 oozie[个人习惯,直接使用oozie-4.0.0也可以]

8.进入bin目录,打包可用war:

addtowar.sh -inputwar /opt/oozie/oozie.war -outputwar /opt/oozie/oozie-server/webapps/oozie.war -hadoop 2.4.1 /usr/local/hadoop -extjs /app/oozie/ext-2.2.zip

9.初始化db:

/ooziedb.sh create -sqlfile oozie.sql 

接着执行如下命令,执行oozie数据库脚本文件,初始数据库

 

./oozie-setup.sh db create -run  -sqlfile ./oozie.sql 

10.启动oozie服务:

oozie-run.sh 或者 oozied.sh start

11.访问 http://localhost:11000/oozie/,应该会报错,将之前下载的httpclient和httpcore包拷到oozie-server/webapps/WEB_INF/lib下,重新启动,可以访问到页面了

===========================================测试oozie自带examples=============================

12.将oozie/oozie-examples.tar.gz 解压,这里我们测试shell示例,将job.propertis文件打开,修改下面两个参数:

nameNode=hdfs://hadoop6:9000

 

jobTracker=hadoop6:8032

改之前可以telnet下端口是否可用,不可用检查hadoop的配置

13.修改hadoop的core-site.xml配置,添加:(如果不是root用户,改成当前使用的用户)

<property>

     <name>hadoop.proxyuser.root.hosts</name> 

     <value>*</value>

</property>

<property>

     <name>hadoop.proxyuser.root.groups</name>

     <value>root</value>

 

</property>

14.修改oozie下的配置,如下配置添加到【oozie/conf/hadoop-conf/core-site.xml】:(在hadoop的hadoop/etc/hadoop/mapred-site.xml中找到对应配置)

<property>

        <name>mapreduce.jobhistory.address</name>

        <value>hadoop6:10020</value>

 

    </property>

检查下改端口是否可用,不可用的话,登录到jobtracker所在机器,启动hadoop的服务:【mr-jobhistory-daemon.sh start historyserver】

15.重启下oozie-server服务,将shell下的文件put到hadoop上对应目录【oozie.wf.application.path=${nameNode}/user/${user.name}/${examplesRoot}/apps/shell】

16.在命令行下提交oozie任务:【oozie job -oozie http://192.168.69.16:11000/oozie/ -config /app/tmp/shell/job.properties -run】

web界面上应该产生了一条job记录!不出意外,应该可以执行成功!

 

分享到:
评论

相关推荐

    hadoop2.4.1

    此外,Hadoop 2.4.1还可能包含对其他组件如Oozie(工作流调度系统)、Zookeeper(分布式协调服务)和Sqoop(数据导入导出工具)的升级,以提供更好的功能和稳定性。这些组件共同构成了Hadoop生态系统,为企业的大...

    oozie-5.0.0.tar.gz

    使用`oozie-5.0.0.tar.gz`压缩包,用户可以获取到完整的Oozie 5.0.0安装包,包括所有必要的文件和配置,以便在自己的Hadoop集群上部署和运行。解压后,按照官方文档的指导进行安装、配置和测试,即可开始享受Oozie...

    oozie安装详细文档

    本文详细介绍了如何在 Hadoop 环境下安装和配置 Oozie,包括解压 Oozie、配置 Hadoop 环境变量、解压 Hadoop 库、复制 jar 包、修改配置文件、复制 MySQL 驱动以及启动 Hadoop 和分发 Oozie 共享库等关键步骤。...

    oozie在hadoop中配置代理

    oozie在hadoop中配置代理,内有相关链接及实际配置信息

    Oozie的安装与配置.docx

    【Oozie的安装与配置】是Hadoop生态系统中的一个重要环节,Oozie是一个工作流调度系统,用于管理和协调Hadoop集群上的各种作业,如MapReduce、Pig、Hive、Spark等。以下是对Oozie安装配置过程的详细解释: 1. **所...

    oozie最简单的安装说明+ExtJS-2.2包【亲测100%成功】

    2. Hadoop:Oozie依赖于Hadoop,你需要安装Hadoop并确保其正常运行。 3. Hive、Pig、Sqoop(可选):如果你的作业流程包含这些组件的任务,那么也需要安装相应的软件。 **Oozie依赖的ExtJS** Oozie的Web界面使用了...

    Hadoop+Spark+Hive+HBase+Oozie+Kafka+Flume+Flink+ES+Redash等详细安装部署

    在大数据领域,构建一个完整的生态系统是至关重要的,其中包括多个组件,如Hadoop、Spark、Hive、HBase、Oozie、Kafka、Flume、Flink、Elasticsearch和Redash。这些组件协同工作,提供了数据存储、处理、调度、流...

    大数据运维技术第2章 Hadoop平台安装课件.pptx

    Hadoop平台安装技术 Hadoop是一个大数据处理技术生态圈,包括众多软件框架。它起源于Apache Nutch项目,创始人为Doug Cutting。Hadoop的主要组件包括HDFS、MapReduce、YARN、HBase、Sqoop、Flume、Kafka、Storm、...

    Hadoop学习笔记.pdf

    - Oozie:是一个用于管理Hadoop作业的工作流调度系统。 - Avro:是一种数据序列化系统,用于高效的跨语言数据交换。 - HDFS Federation:是Hadoop 2.x版本的一个新特性,用于解决单个NameNode的扩展性限制。 Hadoop...

    hadoop权威指南第四版高清 pdf下载

    此外,书中还详细讲解了Hadoop的安装和配置,包括单机模式、伪分布式模式和完全分布式模式,帮助读者在实际环境中搭建和管理Hadoop集群。关于Hadoop生态系统的其他组件,如Hive(数据仓库工具)、Pig(数据流语言和...

    Oozie安装部署及任务定义说明

    通过以上步骤,你可以成功地在你的Hadoop集群上安装、配置并部署Oozie,然后定义和调度各种类型的Hadoop作业。Oozie提供了集中管理和监控作业的强大功能,使得大数据处理工作流更加有序和高效。

    Hadoop权威指南中文版(第二版)+Hadoop in Action

    3. **Hadoop安装与配置**:涵盖单机模式、伪分布式模式和完全分布式模式的安装步骤,以及集群配置、安全性设置和故障排查技巧。 4. **MapReduce编程**:理解Map函数和Reduce函数的实现,以及Combiner、Partitioner...

    win10下搭建Hadoop环境(jdk+mysql+hadoop+scala+hive+spark) 3.docx

    Hadoop 2.8.4的安装包括下载解压、替换`hadooponwindows-master`文件、配置环境变量以及配置Hadoop的配置文件如`core-site.xml`、`hdfs-site.xml`、`yarn-site.xml`和`mapred-site.xml`。在这些文件中指定HDFS的名称...

    Oozie - The Workflow Scheduler for Hadoop

    Apache Oozie是一款专为管理Hadoop作业而设计的工作流调度系统。作为Hadoop生态系统的重要组件,Oozie允许用户创建包含多个任务的复杂数据处理工作流,并按预设的计划执行。本文将详细阐释Oozie的基本概念、安装配置...

    Apache Hadoop---Oozie.docx

    Apache Hadoop 中,Oozie 是一个至关重要的组件,它是一个开源的工作流调度引擎,专门设计用于管理和协调在Hadoop生态系统中的各种作业。Oozie 由Cloudera公司贡献给Apache社区,它是一个基于工作流引擎的系统,能够...

    oozie配置mysql:表结构详解

    oozie配置mysql所需表结构。Apache Oozie是用于Hadoop平台的一种工作流调度引擎。

    快速学习-Oozie的使用

    [atguigu@hadoop102 oozie-4.0.0-cdh5.3.6]$ tar -zxvf oozie-examples.tar.gz 2)创建工作目录 [atguigu@hadoop102 oozie-4.0.0-cdh5.3.6]$ mkdir oozie-apps/ 3)拷贝任务模板到oozie-apps/目录 [atguigu@hadoop...

    HADOOP学习笔记

    【HADOOP学习笔记】 Hadoop是Apache基金会开发的一个开源分布式计算框架,是云计算领域的重要组成部分,尤其在大数据处理方面有着广泛的应用。本学习笔记将深入探讨Hadoop的核心组件、架构以及如何搭建云计算平台。...

    ext-2.2.zip Oozie的web界面安装所需要的包

    标题中的"ext-2.2.zip"是一个压缩文件,它包含了Oozie web界面安装所需的组件。Oozie是Apache Hadoop项目的一部分,是一个工作流调度系统,用于管理Hadoop作业。这个压缩包的版本号为2.2,通常表明它是针对特定版本...

Global site tag (gtag.js) - Google Analytics