oozie版本:4.0.0(开始在官网下载4.0.1的版本,编译一直无法通过,报错说oozie-hadoop-4.0.1的jar,换4.0.0竟然没报错,不解)
hadoop 2.4.1 由于测试集群用了改版本,无奈,原本github上有编译好的oozie,但是最高才3.0,只能支持hadoop 2.0
==================================华丽的分割====================================
1.下载oozie源码[http://archive.apache.org/dist/oozie/4.0.0/]
2.下载ext2.2.zip【http://oozie.apache.org/docs/4.0.1/DG_QuickStart.html】
3.下载http-client和http-core(oozie.war 需要该包,否则server起来后,访问页面会报错)
4.解压oozie包后修改pom.xml,jdk改为1.7,hadoop.version改为2.4.1(其它hbase,pig等相应修改)
5.添加环境变量;
------------------------------------------------------------------------------------------------------------------------------
export HADOOP_HOME=/usr/local/hadoop
export HADOOP_INSTALL=/usr/local/hadoop
export HADOOP_MAPRED_HOME=$HADOOP_INSTALL
export HADOOP_COMMON_HOME=$HADOOP_INSTALL
export HADOOP_HDFS_HOME=$HADOOP_INSTALL
export YARN_HOME=$HADOOP_INSTALL
export OOZIE_HOME=/opt/oozie
export OOZIE_CONFIG=/opt/oozie/conf
PATH=$PATH:$HOME/bin:/usr/local/zookeeper-3.4.6/bin:$HADOOP_HOME/bin:$OOZIE_HOME/bin
------------------------------------------------------------------------------------------------------------------------------
6.编译oozie,进入bin,执行【mkdistro.sh -DskipTests】,进入漫长的编译过程,中间卡住,退出重新编译,直至全部success
7.将编译好的oozie-4.0.0-distro.tar.gz拷出来,解压,创建软链ln -s oozie-4.0.0 oozie[个人习惯,直接使用oozie-4.0.0也可以]
8.进入bin目录,打包可用war:
addtowar.sh -inputwar /opt/oozie/oozie.war -outputwar /opt/oozie/oozie-server/webapps/oozie.war -hadoop 2.4.1 /usr/local/hadoop -extjs /app/oozie/ext-2.2.zip
9.初始化db:
/ooziedb.sh create -sqlfile oozie.sql
接着执行如下命令,执行oozie数据库脚本文件,初始数据库
./oozie-setup.sh db create -run -sqlfile ./oozie.sql
10.启动oozie服务:
oozie-run.sh 或者 oozied.sh start
11.访问 http://localhost:11000/oozie/,应该会报错,将之前下载的httpclient和httpcore包拷到oozie-server/webapps/WEB_INF/lib下,重新启动,可以访问到页面了
===========================================测试oozie自带examples=============================
12.将oozie/oozie-examples.tar.gz 解压,这里我们测试shell示例,将job.propertis文件打开,修改下面两个参数:
nameNode=hdfs://hadoop6:9000
jobTracker=hadoop6:8032
改之前可以telnet下端口是否可用,不可用检查hadoop的配置
13.修改hadoop的core-site.xml配置,添加:(如果不是root用户,改成当前使用的用户)
<property>
<name>hadoop.proxyuser.root.hosts</name>
<value>*</value>
</property>
<property>
<name>hadoop.proxyuser.root.groups</name>
<value>root</value>
</property>
14.修改oozie下的配置,如下配置添加到【oozie/conf/hadoop-conf/core-site.xml】:(在hadoop的hadoop/etc/hadoop/mapred-site.xml中找到对应配置)
<property>
<name>mapreduce.jobhistory.address</name>
<value>hadoop6:10020</value>
</property>
检查下改端口是否可用,不可用的话,登录到jobtracker所在机器,启动hadoop的服务:【mr-jobhistory-daemon.sh start historyserver】
15.重启下oozie-server服务,将shell下的文件put到hadoop上对应目录【oozie.wf.application.path=${nameNode}/user/${user.name}/${examplesRoot}/apps/shell】
16.在命令行下提交oozie任务:【oozie job -oozie http://192.168.69.16:11000/oozie/ -config /app/tmp/shell/job.properties -run】
web界面上应该产生了一条job记录!不出意外,应该可以执行成功!
相关推荐
此外,Hadoop 2.4.1还可能包含对其他组件如Oozie(工作流调度系统)、Zookeeper(分布式协调服务)和Sqoop(数据导入导出工具)的升级,以提供更好的功能和稳定性。这些组件共同构成了Hadoop生态系统,为企业的大...
使用`oozie-5.0.0.tar.gz`压缩包,用户可以获取到完整的Oozie 5.0.0安装包,包括所有必要的文件和配置,以便在自己的Hadoop集群上部署和运行。解压后,按照官方文档的指导进行安装、配置和测试,即可开始享受Oozie...
本文详细介绍了如何在 Hadoop 环境下安装和配置 Oozie,包括解压 Oozie、配置 Hadoop 环境变量、解压 Hadoop 库、复制 jar 包、修改配置文件、复制 MySQL 驱动以及启动 Hadoop 和分发 Oozie 共享库等关键步骤。...
oozie在hadoop中配置代理,内有相关链接及实际配置信息
【Oozie的安装与配置】是Hadoop生态系统中的一个重要环节,Oozie是一个工作流调度系统,用于管理和协调Hadoop集群上的各种作业,如MapReduce、Pig、Hive、Spark等。以下是对Oozie安装配置过程的详细解释: 1. **所...
2. Hadoop:Oozie依赖于Hadoop,你需要安装Hadoop并确保其正常运行。 3. Hive、Pig、Sqoop(可选):如果你的作业流程包含这些组件的任务,那么也需要安装相应的软件。 **Oozie依赖的ExtJS** Oozie的Web界面使用了...
在大数据领域,构建一个完整的生态系统是至关重要的,其中包括多个组件,如Hadoop、Spark、Hive、HBase、Oozie、Kafka、Flume、Flink、Elasticsearch和Redash。这些组件协同工作,提供了数据存储、处理、调度、流...
Hadoop平台安装技术 Hadoop是一个大数据处理技术生态圈,包括众多软件框架。它起源于Apache Nutch项目,创始人为Doug Cutting。Hadoop的主要组件包括HDFS、MapReduce、YARN、HBase、Sqoop、Flume、Kafka、Storm、...
- Oozie:是一个用于管理Hadoop作业的工作流调度系统。 - Avro:是一种数据序列化系统,用于高效的跨语言数据交换。 - HDFS Federation:是Hadoop 2.x版本的一个新特性,用于解决单个NameNode的扩展性限制。 Hadoop...
此外,书中还详细讲解了Hadoop的安装和配置,包括单机模式、伪分布式模式和完全分布式模式,帮助读者在实际环境中搭建和管理Hadoop集群。关于Hadoop生态系统的其他组件,如Hive(数据仓库工具)、Pig(数据流语言和...
通过以上步骤,你可以成功地在你的Hadoop集群上安装、配置并部署Oozie,然后定义和调度各种类型的Hadoop作业。Oozie提供了集中管理和监控作业的强大功能,使得大数据处理工作流更加有序和高效。
3. **Hadoop安装与配置**:涵盖单机模式、伪分布式模式和完全分布式模式的安装步骤,以及集群配置、安全性设置和故障排查技巧。 4. **MapReduce编程**:理解Map函数和Reduce函数的实现,以及Combiner、Partitioner...
Hadoop 2.8.4的安装包括下载解压、替换`hadooponwindows-master`文件、配置环境变量以及配置Hadoop的配置文件如`core-site.xml`、`hdfs-site.xml`、`yarn-site.xml`和`mapred-site.xml`。在这些文件中指定HDFS的名称...
Apache Oozie是一款专为管理Hadoop作业而设计的工作流调度系统。作为Hadoop生态系统的重要组件,Oozie允许用户创建包含多个任务的复杂数据处理工作流,并按预设的计划执行。本文将详细阐释Oozie的基本概念、安装配置...
Apache Hadoop 中,Oozie 是一个至关重要的组件,它是一个开源的工作流调度引擎,专门设计用于管理和协调在Hadoop生态系统中的各种作业。Oozie 由Cloudera公司贡献给Apache社区,它是一个基于工作流引擎的系统,能够...
oozie配置mysql所需表结构。Apache Oozie是用于Hadoop平台的一种工作流调度引擎。
[atguigu@hadoop102 oozie-4.0.0-cdh5.3.6]$ tar -zxvf oozie-examples.tar.gz 2)创建工作目录 [atguigu@hadoop102 oozie-4.0.0-cdh5.3.6]$ mkdir oozie-apps/ 3)拷贝任务模板到oozie-apps/目录 [atguigu@hadoop...
【HADOOP学习笔记】 Hadoop是Apache基金会开发的一个开源分布式计算框架,是云计算领域的重要组成部分,尤其在大数据处理方面有着广泛的应用。本学习笔记将深入探讨Hadoop的核心组件、架构以及如何搭建云计算平台。...
标题中的"ext-2.2.zip"是一个压缩文件,它包含了Oozie web界面安装所需的组件。Oozie是Apache Hadoop项目的一部分,是一个工作流调度系统,用于管理Hadoop作业。这个压缩包的版本号为2.2,通常表明它是针对特定版本...