`

Oozie: sqoop 1.4.4 sharelib

 
阅读更多

ENV :  oozie4.0.1 hadoop2.3.0  sqoop1.4.4

When run sqoop example with command

 

oozie job --oozie http://localhost:11000/oozie --config examples/apps/sqoop/job.properties -run

 some errors produced due to the default sqoop sharelib is not targeted to hadoop2.x when I compile oozie

 

with commands

 

mvn clean package assembly:single -Dhadoop.version=2.3.0 \
-DjavaVersion=1.7 -DtargetJavaVersion=1.7 -DskipTests -DgenerateDocs

 

 

So, I update the sharelib for sqoop maually by following steps:

a. download sqoop-1.4.4.bin__hadoop-2.0.4-alpha.tar.gz   and untar it

b. bakeup jar in oozie-4.0.1/share/lib/sqoop  to  sqoopjar

c. delete jars in  oozie-4.0.1/share/lib/sqoop

d. cp all jars in sqoop-1.4.4.bin__hadoop-2.0.4-alpha/lib  to  oozie-4.0.1/share/lib/sqoop

e. cp  jar sqoop-1.4.4.bin__hadoop-2.0.4-alpha/sqoop-1.4.4.jar  to oozie-4.0.1/share/lib/sqoop

f. cp jar sqoopjar/oozie-sharelib-sqoop-4.0.1.jar    to    oozie-4.0.1/share/lib/sqoop

g. delete share/lib/sqoop in hdfs and update it by

oozie-setup.sh sharelib upgrade -fs hdfs://192.168.122.1:2014 -locallib share/

 

 If you should use mysql jdbc driver, don't forget to update mysql jdbc driver to sharelib

分享到:
评论

相关推荐

    sqoop 1.4.4

    10. **Oozie整合**:Sqoop作业可以被集成到Oozie工作流中,作为更复杂的大数据处理流程的一部分。 总的来说,Sqoop 1.4.4是Hadoop生态中一个强大的工具,为数据迁移提供了便利,帮助用户充分利用Hadoop的分布式计算...

    sqoop-1.4.4-cdh5.0.6.tar

    - Oozie:可以将 Sqoop 任务作为 Oozie 工作流的一部分,实现自动化数据同步。 - Pig:结合 Pig,可以在导入数据后进行复杂的数据分析。 6. **最佳实践**: - 定期数据同步:通过计划任务定期执行 Sqoop 导入...

    hue平台oozie工作流操作sqoop,把mysql.pdf

    本文主要讲述在Hue平台使用Oozie工作流操作Sqoop工具将MySQL数据库的数据传输到HDFS中,并最终导入到Hive表中的经验。以下是详细知识点: 1. Hue平台和Oozie工作流简介: Hue是一种开源的用户界面,用于简化与...

    oozie-sqoop2

    【oozie-sqoop2】是Apache Oozie的一个扩展,它允许用户在Oozie工作流中直接集成和执行Apache Sqoop2的任务。Oozie是一个工作流调度系统,用于管理和协调Hadoop生态系统中的作业,如MapReduce、Pig、Hive、Spark等。...

    oozie-4.3.1.tar.gz

    Apache Oozie 是一个用于管理Hadoop作业的工作流调度系统,它能够协调Hadoop生态系统中的各种任务,如MapReduce、Pig、Hive、Sqoop等。本文将深入探讨Oozie 4.3.1版本的源码,解析其核心功能,并提供编译安装的详细...

    OOZIE 配置和调度流程(1).doc

    在 job.properties 文件中配置 oozie.use.system.libpath=true,以便使用 OOZIE 调度 sqoop。 5. 注意事项: * 程序本地可以正常执行,使用 OOZIE 提交到集群后不能正常执行。可能原因:OOZIE 提交的作业由 YARN ...

    sqoop的原理及概念

    Sqoop 的架构非常简单,整合了 Hive、Hbase 和 Oozie,通过 map-reduce 任务来传输数据,从而提供并发特性和容错。 二、Sqoop 的工作流程 Sqoop 的工作流程可以分为以下几个步骤: 1. 读取要导入数据的表结构,...

    hadoop-oozie:具有Oozie的映像,该映像是为Hadoop 2.x构建的(带有2.7.0库)

    andlaz/hadoop-oozie su oozie -c 'oozie-setup.sh sharelib create -fs hdfs://namenode:8020' 启动Ooozie docker run -d --name oozie -p 0.0.0.0:11000 -p 0.0.0.0:11001:11001 \ andlaz/hadoop-oozie su oozie ...

    sqoop-1.4.2.bin__hadoop-2.0.0-alpha.tar

    此外,还可以与 Oozie 集成,将 Sqoop 作业作为 Oozie 工作流的一部分。 总的来说,"sqoop-1.4.2.bin__hadoop-2.0.0-alpha.tar" 提供了一个与 Hadoop 2.0.0-alpha 兼容的 Sqoop 实例,是进行大数据分析前数据预处理...

    sqoop-1.4.6-cdh5.9.3

    7. **作业调度**:通过整合与 Apache Oozie 或 Apache Airflow 等工作流管理系统,Sqoop 作业可以被安排在预定的时间执行,实现自动化数据同步。 8. **元数据保留**:Sqoop 可以将数据库元数据(如表结构、列信息等...

    尚硅谷 大数据 hive oozie sqoop kalfa flume zk hbase Hadoop

    尚硅谷 大数据 hive oozie sqoop kalfa flume zk hbase Hadoop

    oozie:Apache Oozie的镜子

    阿帕奇·奥兹(Apache Oozie)什么是Oozie Oozie是一个可扩展,可扩展且可靠的系统,用于通过Web服务定义,管理,调度和执行复杂的Hadoop工作负载。 更具体地说,这包括: 基于XML的声明性框架,用于指定作业或相关...

    sqoop-1.4.6-cdh5.12.0.tar.gz

    8. 自动化:用户可以通过脚本或 Oozie 工作流自动化 Sqoop 任务,提高数据处理的效率。 在使用 "sqoop-1.4.6-cdh5.12.0" 这个版本时,需要注意以下几点: 1. 确保你的集群运行的是 CDH 5.12.0 或与其兼容的版本,...

    oozie最简单的安装说明+ExtJS-2.2包【亲测100%成功】

    5. 创建ShareLib:Oozie的ShareLib包含了各种作业类型(如Hive、Pig等)的库,执行`bin/oozie-setup.sh sharelib create -fs <hdfs_path>`命令创建ShareLib,并将其上传到HDFS。 6. 配置Hadoop:在Hadoop的配置文件...

    oozie 入门

    oozie 入门 oozie概述:oozie能干什么 oozie格式:怎么用oozie oozie执行:怎么运行oozie

    sqoop2-1.99.5-cdh5.6.0.tar.gz

    3. **工作流和调度**:用户可以通过Sqoop2创建复杂的工作流程,包括多个导入导出步骤,并能与Hadoop的其他组件(如Oozie)集成进行定时调度。 4. **并行性和分片**:Sqoop2 支持并行导入导出,通过将大任务划分为多...

    BigData:Sqoop+Hive+MySQL 纽约证券交易所数据集

    用于导入、数据操作和导出的 Oozie 脚本 从 mysql 输出中读取信息并报告数据的 UI。 ================================================== ================== 文件信息 NYSE hadoop word 文档包含导入和导出数据...

    sqoop-1.4.6-cdh5.16.2.tar.gz

    8. **与 Oozie 集成**:Sqoop 可以作为 Oozie 工作流的一部分,实现自动化数据抽取任务的调度和执行。 9. **安全性**:在 CDH 5.16.2 中,Sqoop 支持 Kerberos 认证,以满足企业级的安全需求。 10. **优化的性能**...

    oozie使用整理

    ### Oozie 使用详解 #### 一、Oozie 概述 Oozie 是一个用于管理工作流和协调数据处理任务的开源工具,主要用于在 Hadoop 生态系统中实现复杂的工作流调度。它通过定义一系列任务及其之间的依赖关系来自动化执行大...

    12_离线计算系统_第12天(辅助系统).docx

    <sqoop xmlns="uri:oozie:sqoop-action:0.2"> ${jobTracker} ${nameNode} <name>mapred.job.queue.name <value>default <arg>import <arg>--connect <arg>jdbc:mysql://localhost/mydb <arg>--...

Global site tag (gtag.js) - Google Analytics