#hadoop
export HADOOP_HOME=/home/oozie/hadoop-2.7.3
export PATH=$PATH:$HADOOP_HOME/bin
#oozie
export OOZIE_HOME=/home/oozie/oozie-5.1.0
export OOZIE_CONFIG=$OOZIE_HOME/conf
export CLASSPATH=$CLASSPATH:$OOZIE_HOME/bin
export PATH=$PATH:$OOZIE_HOME/bin
export OOZIE_URL=http://hadoop-senior.guppy.com:11000/oozie
wget http://archive.cloudera.com/gplextras/misc/ext-2.2.zip
wget https://www-us.apache.org/dist/oozie/5.1.0/oozie-5.1.0.tar.gz
tar -zxvf /home/software/oozie-5.1.0.tar.gz -C /home/oozie/
bin/mkdistro.sh -DskipTests -Puber
mv oozie-5.1.0 oozie-5.1.0_
tar -zxvf oozie-5.1.0_/distro/target/oozie-5.1.0-distro.tar.gz -C /home/oozie/
cd oozie-5.1.0
cp /opt/software/ext-2.2.zip libext/
cd conf/
mkdir spark-conf
cd spark-conf/
vim spark-defaults.conf
# spark on yarn log spark.yarn.historyServer http://xx:18080 spark.eventLog.dir hdfs://xx:9000/spark/historyLog spark.eventLog.enabled true
vim oozie-site.xml
<property> <name>oozie.service.ProxyUserService.proxyuser.root.hosts</name> <value>*</value> </property> <property> <name>oozie.service.ProxyUserService.proxyuser.root.groups</name> <value>*</value> </property> <property> <name>oozie.service.JPAService.create.db.schema</name> <value>false</value> </property> <property> <name>oozie.service.JPAService.jdbc.driver</name> <value>com.mysql.jdbc.Driver</value> </property> <property> <name>oozie.service.JPAService.jdbc.url</name> <value>jdbc:mysql://192.168.0.189:3306/oozie?createDatabaseIfNotExist=true</value> </property> <property> <name>oozie.service.JPAService.jdbc.username</name> <value>oozie</value> </property> <property> <name>oozie.service.JPAService.jdbc.password</name> <value>123456</value> </property> <property> <name>oozie.service.HadoopAccessorService.hadoop.configurations</name> <value>*=/home/oozie/hadoop-2.7.3/etc/hadoop</value> </property> <property> <name>oozie.service.HadoopAccessorService.action.configurations</name> <value>*=/home/oozie/hadoop-2.7.3/etc/hadoop</value> </property> <property> <name>oozie.service.SparkConfigurationService.spark.configurations</name> <value>*=spark-conf</value> </property> <property> <name>oozie.service.WorkflowAppService.system.libpath</name> <value>/user/root/share/lib</value> </property> <property> <name>oozie.use.system.libpath</name> <value>true</value> </property> <property> <name>oozie.subworkflow.classpath.inheritance</name> <value>true</value> </property>
tar -zxvf /home/software/hadoop-2.7.3.tar.gz -C /home/oozie/
cd hadoop-2.7.3/
vim etc/hadoop/hadoop-env.sh
export JAVA_HOME=/etc/alternatives/java_sdk_1.8.0/
vim etc/hadoop/hdfs-site.xml
<!-- 指定HDFS副本的数量 --> <property> <name>dfs.replication</name> <value>1</value> </property> <property> <name>dfs.secondary.http.address</name> <value>192.168.0.189:50090</value> </property>
vim etc/hadoop/core-site.xml
<!-- 指定HADOOP所使用的文件系统schema(URI),HDFS的老大(NameNode)的地址 --> <property> <name>fs.defaultFS</name> <value>hdfs://192.168.0.189:9000</value> </property> <!-- 指定hadoop运行时产生文件的存储目录 --> <property> <name>hadoop.tmp.dir</name> <value>/home/hadoop/hadoop-2.7.3/tmp</value> </property> <!-- OOZIE --> <property> <name>hadoop.proxyuser.root.hosts</name> <value>master</value> </property> <property> <name>hadoop.proxyuser.root.groups</name> <value>*</value> </property>
bin/hdfs namenode -format
sbin/start-all.sh
bin/hadoop dfs -mkdir /user/root/examples
bin/hadoop dfs -put /home/oozie/oozie-5.1.0/examples/* /user/root/examples
vim oozie-5.1.0/conf/oozie-site.xml
bin/oozie-setup.sh
bin/oozie-setup.sh sharelib create -fs hdfs://192.168.0.189:9000 -locallib oozie-sharelib-5.1.0.tar.gz
cp /opt/modules/hive-2.3.6/lib/mysql-connector-java-5.1.46.jar ./lib
bin/ooziedb.sh create -sqlfile oozie.sql -run
bin/oozied.sh start
tar zxvf oozie-examples.tar.gz
vim examples/apps/spark/job.properties
vim examples/apps/spark/workflow.xml
bin/oozie job -oozie http://192.168.0.189:11000/oozie -config examples/apps/spark/job.properties -run
相关推荐
Apache Oozie 是一个工作流调度系统,用于管理和协调Hadoop生态系统中的作业。Oozie 5.2.1是该软件的一个版本,提供了一系列改进和修复,旨在提高稳定性和性能。这个"oozie-5.2.1-distro.tar.gz"文件是一个压缩包,...
在Hadoop生态系统中,Oozie是一个工作流调度系统,用于管理Hadoop作业。它允许用户定义、调度和协调各种Hadoop相关任务,如MapReduce、Pig、Hive、Sqoop等。当遇到“Table ‘oozie.VALIDATE_CONN’ doesn’t exist”...
从零开始讲解大数据调度系统构成,集成大数据计算任务构建大数据工作流,基于Oozie构建实现企业级自动化任务开发 课程亮点 1,知识体系完备,从小白到大神各阶段读者均能学有所获。 2,生动形象,化繁为简,讲解...
《Apache Oozie 4.1 源码解析与Hadoop集成详解》 Apache Oozie 是一个工作流调度系统,用于管理 Hadoop 生态系统中的作业执行。它允许用户定义、调度和协调各种类型的任务,如 MapReduce、Pig、Hive、Spark 等,...
本文主要讲述在Hue平台使用Oozie工作流操作Sqoop工具将MySQL数据库的数据传输到HDFS中,并最终导入到Hive表中的经验。以下是详细知识点: 1. Hue平台和Oozie工作流简介: Hue是一种开源的用户界面,用于简化与...
在大数据处理领域,Oozie和Hive是两个重要的组件。Oozie是Apache Hadoop的一个工作流调度系统,用于管理Hadoop作业的生命周期,而Hive则是一种基于Hadoop的数据仓库工具,允许用户使用SQL(称为HQL)对大规模数据...
**Oozie安装部署** Oozie是Apache Hadoop生态系统中的一个工作流调度系统,用于管理Hadoop作业的生命周期。以下是对Oozie安装和部署的详细步骤: 1. **Maven安装** - 下载Maven的tar包,如maven-3.3.2,并解压至/...
在IT行业中,Oozie是Apache Hadoop生态系统中的一个工作流调度系统,它用于管理和调度Hadoop相关的任务。Hue则是一个用户界面套件,旨在提供对Hadoop生态系统的友好操作界面,包括对Oozie的工作流进行可视化操作。当...
在大数据处理领域,Oozie是一个非常重要的工作流调度系统,它被广泛应用于Hadoop生态系统中,用于管理和调度Hadoop相关的任务,如MapReduce、Pig、Hive、Sqoop等。Oozie的核心功能是协调工作流程,监控作业状态,并...
**OozieWeb界面及其组件详解** 在大数据处理领域,Oozie是一个非常重要的工作流管理系统,主要用于协调Hadoop生态系统中的各种任务。OozieWeb界面是Oozie的用户交互部分,允许用户通过Web浏览器进行工作流的提交、...
* OOZIE 系统时区配置:在 CM OOZIE 的配置界面,oozie-site.xml 的 Oozie Server 高级配置代码段(安全阀)这一栏配置如下属性,然后重启 OOZIE 服务:<property> <name>oozie.processing.timezone</name> <value>...
标题中的"oozie调度脚本.docx"指出我们要讨论的核心技术是Apache Oozie,一个在Hadoop生态系统中用于管理工作流的工具。Oozie提供了对多种Hadoop任务(如MapReduce、HDFS操作、Shell命令、Hive查询等)的集中式、...
### 大数据技术之Oozie入门到精通 #### 一、Oozie简介与应用场景 **Oozie**是一款开源的工作流调度系统,主要用于在Hadoop生态系统中管理和执行复杂的数据处理任务。它通过定义一系列有依赖关系的操作来实现工作流...
《oozie控制台ext jar包.zip》是一款专用于oozie web控制台的扩展包,它包含了一组必要的jar文件,能够极大地丰富和优化oozie控制台的功能与用户体验。该压缩包的主要目标是提供一个增强版的oozie web界面,使得在...
**Oozie简介** Oozie是Apache Hadoop项目中的一个工作流调度系统,用于管理Hadoop生态系统中的批处理作业。它支持Hadoop MapReduce、Pig、Hive、Sqoop等多种工具的任务调度,同时也可扩展到其他自定义Java或Shell...
【Oozie简介】 Oozie是Apache项目中的一个工作流管理系统,专门设计用于管理和协调Hadoop生态系统中的任务。它的名字"Oozie"来源于驯象人,寓意其能够像驯象一样管理复杂的分布式任务。Oozie由Cloudera公司贡献给...
Apache Hadoop 中,Oozie 是一个至关重要的组件,它是一个开源的工作流调度引擎,专门设计用于管理和协调在Hadoop生态系统中的各种作业。Oozie 由Cloudera公司贡献给Apache社区,它是一个基于工作流引擎的系统,能够...
**Oozie配置文件详解** 在Hadoop生态系统中,Oozie是一个工作流调度系统,用于管理和协调Hadoop作业,包括Hive、Pig、MapReduce、Spark等。Oozie与Hadoop集群的其他组件紧密集成,提供了一种集中式的方式来管理作业...
【调度器GUI调研(Azkaban&Oozie&Airflow)】 调度器在IT行业中扮演着至关重要的角色,主要用于自动化任务执行,确保数据处理、分析以及其他业务流程按预定的时间表和顺序进行。本文将深入探讨三个流行的调度器——...
在下载并解压`ext-2.2.zip`后,你需要将解压得到的文件夹放置到Oozie服务器的正确目录下,通常是`oozie-server/webapps/oozie/WEB-INF/lib`或者`oozie/sharelib`目录,具体位置取决于Oozie的版本和你的配置。...