Oozie运行Hive - fighting-one-piece - ITeye博客

`

fighting_2013

浏览: 15937 次
性别:

最近访客更多访客>>

98es

123456.H

woodding2008

tianshun.cao

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

Oozie运行Hive

博客分类：

OOZIE

阅读更多

1.运行Hive需要用到hive-site.xml文件以及对应版本的hive的jar包，于是将hive-site.xml文件和当前所用hive版本下相关的jar包上传到HDFS上面。
2.修改examples/apps/hive/workflow.xml文件，主要添加对hive-site.xml配置的支持
<job-xml>${hiveSitePath}</job-xml>
其中需要注意事项：job-xml顺序
<xs:sequence>
    <xs:element name="job-tracker" type="xs:string" minOccurs="1" maxOccurs="1"/>
    <xs:element name="name-node" type="xs:string" minOccurs="1" maxOccurs="1"/>
    <xs:element name="prepare" type="hive:PREPARE" minOccurs="0" maxOccurs="1"/>
    <xs:element name="job-xml" type="xs:string" minOccurs="0" maxOccurs="1"/>
    <xs:element name="configuration" type="hive:CONFIGURATION" minOccurs="0" maxOccurs="1"/>
    <xs:element name="script" type="xs:string" minOccurs="1" maxOccurs="1"/>
    <xs:element name="param" type="xs:string" minOccurs="0" maxOccurs="unbounded"/>
    <xs:element name="file" type="xs:string" minOccurs="0" maxOccurs="unbounded"/>
    <xs:element name="archive" type="xs:string" minOccurs="0" maxOccurs="unbounded"/>
</xs:sequence>
3.修改examples/apps/hive/job.properties文件，在文件中添加相关位置的配置
hiveSitePath=${nameNode}/user/${user.name}/hive/hive-site.xml
oozie.libpath=${nameNode}/user/${user.name}/share/lib/hive
4.执行命令
bin/oozie job -config ../examples/apps/hive/job.properties -run

分享到：

Oozie Java代码运行Job | Oozie运行Hadoop

2014-01-01 19:54
浏览 584
评论(0)
分类:企业架构
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Hadoop+Spark+Hive+HBase+Oozie+Kafka+Flume+Flink+ES+Redash等详细安装部署: 在大数据领域，构建一个完整的生态系统是至关重要的，其中包括多个组件，如Hadoop、Spark、Hive、HBase、Oozie、Kafka、Flume、Flink、Elasticsearch和Redash。这些组件协同工作，提供了数据存储、处理、调度、流...

oozie oozie: 这个文件通常包含创建Oozie在运行时依赖的各种表和视图的命令，比如`VALIDATE_CONN`表，该表可能用于验证和管理Oozie的工作流连接器。安装Oozie时，你需要执行`oozie.sql`中的SQL语句来初始化数据库。这通常涉及到...

apache-hive-2.3.2-bin.tar.gz: 6. **Hcatalog**：作为数据层的接口，允许外部工具如 Pig、MapReduce 或 Oozie 访问 Hive 的元数据。 **Hive 的核心功能** 1. **数据查询**：通过 HQL（Hive Query Language），类似 SQL 的语法，进行数据查询和...

oozie所需的ext下载: 在大数据处理领域，Oozie是一个非常重要的工作流调度系统，它被广泛应用于Hadoop生态系统中，用于管理和调度Hadoop相关的任务，如MapReduce、Pig、Hive、Sqoop等。Oozie的核心功能是协调工作流程，监控作业状态，并...

oozie配置文件: 在Hadoop生态系统中，Oozie是一个工作流调度系统，用于管理和协调Hadoop作业，包括Hive、Pig、MapReduce、Spark等。Oozie与Hadoop集群的其他组件紧密集成，提供了一种集中式的方式来管理作业的生命周期和依赖关系。...

Oozie安装部署及任务定义说明: - 启动Oozie服务器，运行`oozie-server`命令。 6. **Oozie客户端配置** - 在客户端机器上安装Oozie客户端，确保配置文件中包含Oozie服务器的URL。 7. **Oozie任务提交** - 编写作业定义文件（如workflow.xml）...

oozie-5.2.1-distro.tar.gz: 1. **工作流管理**：Oozie支持定义和执行复杂的工作流程，这些流程可以包含Hadoop MapReduce、Pig、Hive、 Sqoop等任务，以及外部系统的命令行操作。 2. **协调器作业**：允许基于时间或数据可用性来调度工作流程，...

大数据Oozie架构原理.pdf: Oozie 是一个基于工作流引擎的开源框架，运行在 Tomcat 容器中，使用数据库存储工作流定义和实例，支持多种类型的 Hadoop 作业调度。Oozie 的架构原理可以分为四个部分：Client、Console、SDK 和 DB。 Oozie 的架构...

ext-2.2.zip oozie: 在部署和配置Oozie的过程中，`ext-2.2.zip`文件起着至关重要的作用，因为它包含了Oozie运行所需的前端资源和JavaScript库，这些资源对于Oozie Web Console的正常运行是必不可少的。 Oozie的工作流引擎设计为可扩展...

apache-hive-2.3.9-bin.tar大数据HIVE.zip: 11. **Hadoop的使用**：Hive运行在Hadoop之上，利用Hadoop的分布式计算能力处理大数据。Hadoop的HDFS为Hive提供了可靠的存储，而MapReduce或Spark则提供了计算能力。了解了这些核心概念后，你可以开始在Hadoop环境...

oozie介绍及使用详解: 3. **上传和验证工作流**：将工作流XML文件和相关的作业资源（如Hive脚本、MapReduce JAR文件）上传到HDFS，并使用Oozie客户端工具进行验证。 4. **提交和启动工作流**：通过Oozie客户端提交工作流，并启动作业。 5....

大数据技术之Oozie入门到精通.txt: - 每个任务都是一个原子操作，如运行MapReduce作业、执行Hive查询等。 - 工作流可以通过XML文件定义，其中包含了任务的逻辑顺序以及依赖关系。 **2. 协调器（Coordinator）** - 协调器用于定义周期性的作业执行，...

Oozie_ext-2.2.zip: Oozie是Apache软件基金会的一个项目，专为Hadoop设计，能够协调Hadoop生态系统中的各种任务，如MapReduce、Pig、Hive、Sqoop和Java程序等。它提供了一个灵活的工作流调度机制，使得大数据处理更加有序和自动化。...

oozie_demo: Oozie是Apache Hadoop生态系统中的一个重要的组件，主要用于协调Hadoop集群上的工作流程任务，支持MapReduce、Pig、Hive、Sqoop等多种数据处理工具。通过Oozie，用户可以定义并调度复杂的作业依赖关系，实现大数据...

win10下搭建Hadoop环境（jdk+mysql+hadoop+scala+hive+spark） 3.docx: 在Windows 10环境下搭建Hadoop...搭建完成后，你可以使用这个环境进行大数据的学习和实验，例如执行MapReduce作业、创建Hive表、运行Spark程序等。通过不断实践和优化，你将更好地理解和掌握Hadoop生态系统的运作机制。

Oozie的安装与配置.docx: 【Oozie的安装与配置】是Hadoop生态系统中的一个重要环节，Oozie是一个工作流调度系统，用于管理和协调Hadoop集群上的各种作业，如MapReduce、Pig、Hive、Spark等。以下是对Oozie安装配置过程的详细解释： 1. **所...

oozie使用整理: 1. **运行流程**：Oozie 作为一个服务运行在 Hadoop 集群上，用户可以通过 REST API、CLI 或者 Web UI 向其提交作业流定义文件，Oozie 服务解析这些定义文件并调度实际的任务执行。 2. **基本架构**：主要包括以下...

Apache Hadoop---Oozie.docx: Oozie 的Action执行模型确保了用户代码的安全执行，Oozie Server不直接运行用户代码，而是通过一个启动作业（launcher job）来执行Action。这个启动作业是一个只包含Map阶段的MapReduce作业，它不知道具体的执行环境...

oozie控制台ext jar包.zip: 此外，及时关注oozie的版本更新和官方文档，了解可能的已知问题和解决方案，以保证系统的稳定运行。总之，《oozie控制台ext jar包.zip》是一个为oozie web控制台提供增强功能的工具，通过它，用户可以享受到更为...

Global site tag (gtag.js) - Google Analytics