`

oozie 4.0.x and hadoop 2.x.0

 
阅读更多
  • Download
1.download the latest tarball from http://www.apache.org/dyn/closer.cgi/oozie/4.0.0
2.#tar -xzvf  oozie-4.0.4.tar.gz

 

  • Build

 According to official document, when run build command

$ bin/mkdistro.sh

there are some errors.  By default it builds against Hadoop 1.1.1 and the build configuration enforces that JDK 1.6.* is being used to compile and run the testcases.

 

So do the following steps to fix the problem(You should replace 2.x.0 to your hadoop version)

#cd oozie-4.0.0/
#find . -name pom.xml | xargs sed -ri 's/(2.2.0\-SNAPSHOT)/2.x.0/'
//or you should alter pom.xml manually
//java 1.6 
mvn -DskipTests=true -P hadoop-2 clean package assembly:single

 

//java 1.7
$ mvn clean package assembly:single -Dhadoop.version=2.x.0 \
-DjavaVersion=1.7 -DtargetJavaVersion=1.7 -DskipTests -Dpig.version=0.12.0 \
-DgenerateDocs

 

Note: I can build oozie4.0.1 succesfully by the following steps

#tar -xzf oozie-4.0.1.tar.gz

#cd oozie-4.0.1

#mvn clean package assembly:single -Dhadoop.version=2.3.0 \
-DjavaVersion=1.7 -DtargetJavaVersion=1.7 -DskipTests -Dpig.version=0.12.0 \
-DgenerateDocs

 

You should change your system language to english, otherwise some pom or jar cannot download from

couldera site.

 

Server Installation

#cd oozie-4.0.1/distro/target

#cp oozie-4.0.1-distro.tar.gz  /path/to/oozie-install-dir

#cp oozie-4.0.1/hadooplibs/target/oozie-4.0.1-hadooplibs.tar.gz /path/to/oozie-install-dir

#cd /path/to/oozie-install-dir

#tar -xzf oozie-4.0.1-distro.tar.gz

#tar -xzf oozie-4.0.1-hadooplibs.tar.gz

 

#cd oozie-4.0.1/

#mkdir  libext

#cp hadooplibs/hadooplib-2.3.0.oozie-4.0.1/*      libext/

#cp /path/to/ext-2.2.zip   libext/

#cp /path/to/mysql-connector-java-5.1.29-bin.jar   libext/

#tree -L 1   

 

 

#bin/oozie-setup.sh  prepare-war
#bin/oozie-setup.sh sharelib create -fs hdfs://192.168.122.1:2014
#bin/oozie-setup.sh db create -run

Expand the oozie-sharelib TAR.GZ file bundled with the distribution.

The share/ directory must be copied to the Oozie HOME directory in HDFS:

$ hadoop fs -put share share

IMPORTANT: This must be done using the Oozie Hadoop (HDFS) user. If a share directory already exists in HDFS, it must be deleted before copying it again.

 

$ bin/oozied.sh start

 

$ bin/oozied.sh run

 

$ bin/oozie admin -oozie http://localhost:11000/oozie -status

 

    http://zhj-c0:11000/oozie/

 

Client Installation

expand the oozie-client TAR.GZ file bundled with the distribution. Add the bin/ directory to the PATH .

#oozie

 

 

ref:

https://oozie.apache.org/docs/4.0.1/DG_QuickStart.html

http://oozie.apache.org/docs/4.0.0/DG_QuickStart.html

https://oozie.apache.org/docs/4.0.0/ENG_Building.html

 http://archive.cloudera.com/cdh/3/oozie/AG_Install.html

http://stackoverflow.com/questions/22077120/install-oozie-on-hadoop-2-2

grepalex.com/2014/02/16/oozie-and-hadoop-2.2/

 

http://mail-archives.apache.org/mod_mbox/oozie-user/201312.mbox/%3CCEDDEB80.76815%25chitnis@yahoo-inc.com%3E

 

http://www.hadoopinrealworld.com/building-running-and-testing-apache-oozie-4-0-0-2/

https://issues.apache.org/jira/browse/OOZIE-1551

 

https://issues.apache.org/jira/

分享到:
评论

相关推荐

    oozie-branch-4.1.zip

    - **Hadoop 兼容性**:Oozie 4.1 支持 Hadoop 2.x 版本,这意味着它可以与 YARN 集成,利用 YARN 的资源管理和调度能力。 - **改进的性能**:在这一版本中,Oozie 对作业提交和调度进行了优化,减少了延迟,提高了...

    oozie-5.1.0.tar.gz(3)

    oozie-5.1.0.tar.gz 编译结果,受限上传大小,文件分3部分

    hadoop-2.7.4.tar.gz

    3. **YARN**:Yet Another Resource Negotiator(YARN)是Hadoop 2.x引入的重要改进,它将资源管理和任务调度功能从MapReduce中分离出来,提高了资源利用率和系统的整体性能。ResourceManager全局协调集群资源,...

    oozie-4.3.1.tar.gz

    8. 启动Oozie服务器:`start-oozie.sh` 五、Oozie使用技巧 1. 工作流设计:熟练掌握DAG(有向无环图)结构,合理规划任务间依赖关系。 2. 错误处理:利用Oozie的错误节点和重试策略,提高作业的健壮性。 3. 日志...

    oozie-4.1.0.tar.gz

    Oozie 是一个针对Apache Hadoop生态系统的开源工作流调度系统,用于管理和协调Hadoop集群中的各种作业和任务。在4.1.0版本中,Oozie提供了一个灵活、可扩展的框架,允许用户定义和执行复杂的作业流程,支持多种类型...

    【hive on spark Error】return code 30041 from org.apache.hadoop.hive.ql.exec.spark.SparkTask.

    ERROR : FAILED: Execution Error, return code 30041 from org.apache.hadoop.hive.ql.exec.spark.SparkTask. 前言报错信息异常分析配置改动后记 前言 在成功消除Cloudare管理界面上那些可恶的警告之后,我又对yarn...

    Hadoop中级教程(2.x)(PDF).rar

    《Hadoop中级教程(2.x)》是一份深入学习Hadoop技术的重要资料,涵盖了Hadoop在2.x版本中的核心概念、配置以及实际操作。这份教程包括了多个子文件,如B01_Eclipse的Hadoop插件安装与使用、B02_Hadoop2.x Namenode...

    hadoop-2.6.0-cdh5.7.0.tar.gz

    Hadoop 2.6.0是Hadoop发展过程中的一个重要版本,它在Hadoop 2.x系列中引入了许多改进和优化,包括提升系统性能、增强容错性和稳定性,以及提供了更丰富的功能。CDH(Cloudera Distribution Including Apache Hadoop...

    09.大数据工作流引擎Oozie.pptx.pptx

    Oozie由Cloudera公司贡献给Apache的基于工作流引擎的开源框架,是用于Hadoop平台的开源的工作流调度引擎,是用来管理Hadoop作业,属于web应用程序,

    hadoop 2.6.0 安装包

    - **Oozie**:工作流调度系统,管理Hadoop作业和协调其他Hadoop相关的工具。 6. **监控与维护** - **Ambari**:一个Web界面,用于Hadoop集群的安装、配置、管理和监控。 - **Ganglia**或**Nagios**:监控系统,...

    oozie-5.0.0.tar.gz

    2. **调度器**:Oozie 提供了一个强大的调度引擎,可以按照时间间隔、数据触发或其他条件自动启动工作流。用户可以通过CRON表达式定义定时任务,实现对Hadoop作业的精确调度。 3. **工作流监控**:Oozie 提供了Web...

    hadoop jar包.rar

    - **Oozie**:工作流管理系统,协调Hadoop作业的执行。 4. **Hadoop的安装与配置**: - **环境变量配置**:设置HADOOP_HOME、PATH等环境变量,指向Hadoop安装目录。 - **配置文件修改**:如core-site.xml、hdfs-...

    Apache Hadoop---Oozie.docx

    Apache Hadoop 中,Oozie 是一个至关重要的组件,它是一个开源的工作流调度引擎,专门设计用于管理和协调在Hadoop生态系统中的各种作业。Oozie 由Cloudera公司贡献给Apache社区,它是一个基于工作流引擎的系统,能够...

    Apache Oozie Essentials(PACKT,2015)

    By the end of the book, you will have a good knowledge of Apache Oozie. You will be capable of using Oozie to handle large Hadoop workflows and even improve the availability of your Hadoop environment...

    oozie配置文件

    例如,`oozie.service.JPAService.jdbc.url`用于指定Oozie数据库的URL,`oozie.service.HadoopAccessorService.hadoop.configurations.*.configuration`用于配置Oozie访问不同Hadoop版本的安全设置。 2. **oozie-...

    oozie -4.3.0 .tar for linux.64

    linux.64 下的 oozie-4.3.0.tar.gz 源码包 解压后编译即可 注意对应的版本 cd bin ./mkdistro.sh -Phadoop-2 -Dhadoop.auth.version=2.8.2 -Ddistcp.version=2.8.2 -Dhadoop.version=2.8.2 -Dsqoop.version=1.4.6 -...

Global site tag (gtag.js) - Google Analytics