`
Taoo
  • 浏览: 294545 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

用oozie执行pigAction与hiveAction的问题

 
阅读更多
===============================
问题分析:

oozie执行action时锁涉及到的jar包,都是用的oozie.libpath指定的sharelib路径中的jar包。

而pig和hive都依赖了antlr-x.x.x.jar。
最要命的是,他们两个还依赖的是不同版本的antlr。

我用的是pig-0.10.0和hive-0.8.1。
pig的jar包中,包含了antlr的runtime包,得先把这个删除。

然后,pig和hive的jar里面都没有antlr了。

pig兼容antlr-3.4-complete.jar.
hive兼容antlr-3.0.1.jar

所以,不能简单的把antlr的jar包放在sharelib路径中。


=============================
问题解决:
1,把pig的jar包中的antlr部分删除,前文讲过了。
2,sharelib中不要放antlr的jar包。
3,在hdfs中建立一个路径,我这里是/user/hadoop/Oozie/libext,把antlr-3.4-complete.jar和antlr-3.0.1.jar放到这个路径里。
4,A,在启动pigAction时,在action的定义中加入:
   <file>/user/hadoop/Oozie/libext/antlr-3.4-complete.jar</file>
   B,在启动hiveAction时,在action的定义中加入:
   <file>/user/hadoop/Oozie/libext/antlr-3.0.1.jar</file>
5,然后就没有然后了,pigAction和hiveAction都正常。



分享到:
评论
1 楼 blackproof 2013-04-10  
oozie 跑 pig udf
不知道你用过吗

oozie3.1 cdh4的

相关推荐

    Oozie调度SparkSQL样例代码_oozie_hive_

    Oozie是Apache Hadoop的一个工作流调度系统,用于管理Hadoop作业的生命周期,而Hive则是一种基于Hadoop的数据仓库工具,允许用户使用SQL(称为HQL)对大规模数据进行查询和分析。本文将详细介绍如何在华为大数据平台...

    Oozie之JavaAction测试实例

    Oozie支持多种类型的Hadoop任务,包括MapReduce、Pig、Hive、Sqoop等,同时也支持通过Java Action执行自定义的Java程序。 **JavaAction**是Oozie提供的一个特殊功能,允许用户编写Java程序来实现自定义逻辑,这些...

    oozie oozie

    当遇到“Table ‘oozie.VALIDATE_CONN’ doesn’t exist”这样的错误时,通常意味着Oozie在尝试访问或执行与数据库相关的操作时,找不到预定义的数据表。在这种情况下,我们需要确保已经正确地配置了Oozie的元数据...

    Oozie的安装与配置.docx

    【Oozie的安装与配置】是Hadoop生态系统中的一个重要环节,Oozie是一个工作流调度系统,用于管理和协调Hadoop集群上的各种作业,如MapReduce、Pig、Hive、Spark等。以下是对Oozie安装配置过程的详细解释: 1. **所...

    oozie 入门

    oozie 入门 oozie概述:oozie能干什么 oozie格式:怎么用oozie oozie执行:怎么运行oozie

    oozie介绍及使用详解

    - **Action Node**:执行实际任务,如MapReduce Job Node、Pig Action Node、Hive Action Node等。 - **Control Node**:控制流程的走向,如Start Node、End Node、Decision Node、Fork Node和Join Node。 理解...

    Oozie-JavaAction

    oozie 提交任务参数传递到下一个任务节点 oozie 提交任务参数传递到下一个任务节点

    大数据技术之Oozie入门到精通.txt

    - 使用Oozie定义一个工作流,该工作流包括从HDFS读取原始数据、使用MapReduce进行预处理、再通过Hive进行聚合分析等多个步骤。 - 通过命令行工具或API提交该工作流定义至Oozie Server。 - 监控工作流的执行进度和...

    OOZIE 配置和调度流程(1).doc

    run.sh 是执行用 shell 脚本,test.sh 是测试 oozie 用 shell 脚本,rbis-spark_2.10-1.0.jar 是执行程序,mysql-connector-java.jar 是程序使用 jar 包,commons-pool2-2.3.jar 是程序使用 jar 包。 * 作业部署执行...

    Oozie安装部署及任务定义说明

    1. **action节点**:工作流中的基本单元,可以是Hadoop MapReduce、Pig、Hive、Sqoop等作业。 2. **start节点**:工作流的起点。 3. **end节点**:工作流的终点,表示所有任务完成。 4. **Kill节点**:当工作流遇到...

    oozie-5.2.1-distro.tar.gz

    1. **工作流管理**:Oozie支持定义和执行复杂的工作流程,这些流程可以包含Hadoop MapReduce、Pig、Hive、 Sqoop等任务,以及外部系统的命令行操作。 2. **协调器作业**:允许基于时间或数据可用性来调度工作流程,...

    Hive编程指南+HIVE从入门到精通+Hive高级编程+Apache Oozie

    4. **错误处理与调试**: 识别并解决查询中的常见问题,理解Hive日志以进行故障排除。 5. **实时查询**: 使用Hive on Tez或Hive on Spark实现更快的响应时间。 **Hive高级编程** 高级编程涉及更复杂的Hive使用场景和...

    Apache Hadoop---Oozie.docx

    Oozie 的Action执行模型确保了用户代码的安全执行,Oozie Server不直接运行用户代码,而是通过一个启动作业(launcher job)来执行Action。这个启动作业是一个只包含Map阶段的MapReduce作业,它不知道具体的执行环境...

    oozie配置文件

    在Hadoop生态系统中,Oozie是一个工作流调度系统,用于管理和协调Hadoop作业,包括Hive、Pig、MapReduce、Spark等。Oozie与Hadoop集群的其他组件紧密集成,提供了一种集中式的方式来管理作业的生命周期和依赖关系。...

    oozie-4.3.0

    1. **工作流管理系统:** Oozie 是一个开源的工作流调度系统,它能够管理和调度 Hadoop 生态系统中的各种作业,包括 MapReduce、Pig、Hive、Sqoop、Java 可执行程序、shell 脚本等。它为大数据处理提供了统一的控制层...

    oozie使用整理

    ### Oozie 使用详解 #### 一、Oozie 概述 Oozie 是一个用于管理工作流和协调数据处理任务的开源工具,主要用于在 Hadoop 生态系统中实现复杂的工作流调度。它通过定义一系列任务及其之间的依赖关系来自动化执行大...

    oozie的控制台用ext依赖

    在CDH(Cloudera Distribution Including Apache Hadoop)环境下安装Oozie后,可能会遇到无法查看或使用控制台的问题。这通常是由于Oozie的Web界面依赖于一些外部(ext)库,而这些库并未包含在默认的安装包中。因此...

    oozie_demo

    6. **Oozie客户端API**:ooziedemo可能提供了使用Java或命令行工具提交和管理Oozie工作流程的示例代码,展示了如何与Oozie服务器交互。 7. **元数据管理**:Oozie工作流程中的Hive和Pig操作需要相应的表和脚本存在...

    Oozie大数据调度系统从入门到精通视频教程

    5.Oozie中的特殊概念Action 6.Hadoop的集成配置 7.Oozie的部署配置 第三章:Oozie调度开发实战 1.Shell脚本工作流调度开发实战 2.Hive Job工作流调度开发实战 3.MapReduce工作流调度开发实战 4.复杂工作流...

    大数据Oozie架构原理.pdf

    Action Nodes 决定每个操作执行的任务类型,包括 map-reduce, java, hive, shell, pig 等。 Oozie 的基本功能包括支持多种类型的 Hadoop 作业调度、提供了一个 wait 工具、支持 Hive Server2、支持 Spark 等。 在 ...

Global site tag (gtag.js) - Google Analytics