oozie运行hive以及hive的udf - - ITeye博客

`

Taoo

浏览: 296048 次
性别:
来自: 北京

最近访客更多访客>>

huageng520

leisureWong

jack1007

kingding

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

白Rime：楼主在吗，我在装 libxml2 时，出现该问题，有些地方还是 ...
python安装是 -fPIC问题的解决
yeelor： $./configure --prefix=/usr/loca ...
python安装是 -fPIC问题的解决
yeelor： $./configure --prefix=/usr/loca ...
python安装是 -fPIC问题的解决
fuzzball： bo_hai 写道楼主的办法解决我了的问题。给你32个兄弟有 ...
python安装是 -fPIC问题的解决
fuzzball： silent1 写道编译ganglia的时候出现此问题，按楼主 ...
python安装是 -fPIC问题的解决

oozie运行hive以及hive的udf

博客分类：

oozie
hive

阅读更多

一，
执行hiveAction除了需要配置oozie.hive.defaults外，还需要配置几个hive的参数。
这点我不是很理解，以为只要在hive-site.xml里面配置了，就完事了，结果不行，还需要单独配置，而且oozie.hive.defaults不配置还不行。
配置如下：

<property>
    <name>oozie.hive.defaults</name>
    <value>my-hive-default.xml</value>
</property>

<property>
  <name>hive.metastore.local</name>
  <value>false</value>
  <description>controls whether to connect to remove metastore server or open a new metastore server in Hive Client JVM</description>
</property>

<property>
  <name>hive.metastore.uris</name>
  <value>thrift://xx.xx.xx.xx:9083</value>
  <description>host and port for the thrift metastore server</description>
</property>

<property>
  <name>hive.metastore.warehouse.dir</name>
  <value>/hive/warehouse0</value>
  <description>location of default database for the warehouse</description>
</property>

二，
执行hive的udf时，不需要在hive脚本里面写add /xxx/xxx/xxx/HIVE_UDF.jar.
只要保证这个HIVE_UDF.jar在sharelib里面，或者file指定应该也行（这个没试，猜的）。
那个create temporary function xxxxx as 'yyy';还是要在脚本里面写的。

分享到：

折腾 elephant-bird | 用oozie执行pigAction与hiveAction的问题

2012-06-12 22:09
浏览 6919
评论(1)
分类:开源软件
查看更多

评论

1 楼 yxl040840219 2012-10-09

能说下详细的流程么？我在配置是出现
Error: E0701 : E0701: XML schema error, cvc-complex-type.2.4.c: The matching wildcard is strict, but no declaration can be found for element 'hive'.

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Hive编程指南+HIVE从入门到精通+Hive高级编程+Apache Oozie: 4. **视图与UDF**: 视图简化了复杂查询，而用户自定义函数（UDF）允许用户扩展Hive的功能。 5. **Hive与Hadoop的交互**: 了解如何在Hadoop集群上部署和配置Hive，以及如何通过HDFS交互数据。 **Hive从入门到精通** ...

apache-hive-2.3.9-bin.tar大数据HIVE.zip: 6. **存储过程（UDF，UDAF，UDTF）**：Hive支持用户自定义函数（UDF），用户定义聚合函数（UDAF）和用户定义表生成函数（UDTF），允许扩展Hive的功能。 7. **连接Hadoop生态系统**：Hive与Hadoop生态系统的其他组件...

Hive编程指南-2013.12.pdf: 除了基本功能，Hive还支持UDF（用户自定义函数）、UDAF（用户自定义聚合函数）和UDTF（用户自定义表生成函数），允许用户扩展HQL的功能。此外，Hive on Tez或Hive on Spark等执行引擎的引入，进一步提高了查询性能。...

项目用于研究Hive源码，包括示例代码注释等_Hive-Research.zip: Oozie则是一个用于管理Hadoop作业的工作流调度系统，它可以让用户在Hadoop集群上安排和运行Hive作业。 Hive作为一个数据仓库解决方案，让数据仓库管理员和分析师能够在不牺牲可扩展性和容错性的前提下，使用SQL语言...

hive面试题（Hadoop）: - Azkaban和Oozie都是流行的工作流调度工具，它们能够帮助管理和自动化执行一系列Hive SQL和其他相关任务。 #### 监控机制 - 使用相应的监控工具或界面来跟踪和监控任务执行的状态。 ### ORC与Parquet列式存储的...

大数据面试二：hive: - Hive 支持处理 JSON 数据，但需要借助 UDF（用户自定义函数）如 LATERAL VIEW 或使用 Hive 的内置 JSON 解析函数进行解析。理解并掌握这些知识点对于在大数据面试中展示对Hive的深入理解和应用能力至关重要。...

data-request-lgd:带Oozie Client的Spring Web应用程序: 数据请求LGD 基于Spring Boot的REST API，用于提交和监视Oozie工作流程 Oozie工作流程是通过OozieClient API提交...pig包含了Oozie工作流程，HiveQL脚本，猪作业脚本和猪的UDF工作包含执行刷新/无效语句的jar的impala

大数据、云计算系统高级架构师课程学习路线图.pdf: Sqoop、Flume、Oozie 是大数据领域中常用的数据协作框架，本部分课程旨在帮助学员掌握 Sqoop、Flume、Oozie 的核心技术，涵盖了 Sqoop 的功能、使用原则、将 RDBMS 数据导入 Hive 表中、将 HDFS 上文件导出到 RDBMS ...

7-2+BIGO海量数据的Ad-Hoc分析实践与改进.pdf: 同时，他们还处理了反引号、双引号、隐式转换、创建表差异、创建视图等问题，以及各种自定义函数（UDF）的兼容性问题。在实现Presto的高可用性方面，BIGO改进了原有的架构，引入了Proxy服务器和负载均衡机制。原来...

hadoop-2.9.0.tar.gz: 在Hadoop 2.9.0中，Pig可能有性能提升和新的UDF（用户自定义函数）支持。 8. ZooKeeper：ZooKeeper是一个分布式协调服务，用于管理大型分布式系统的配置信息、命名服务和同步。Hadoop 2.9.0中，ZooKeeper可能提供了...

hadoop权威指南（第2版）PDF: 本书不仅涵盖了这些核心技术，还讲解了Hadoop集群的安装、配置、管理和监控，以及如何解决实际运行中遇到的问题。此外，书中还介绍了其他相关的项目，如Zookeeper（分布式协调服务）、Sqoop（数据导入导出工具）和...

Hadoop权威指南中文第二版: 此外，Pig的性能优化、UDF（用户定义函数）的使用以及Pig与Hive等其他工具的集成也是可能讨论的主题。除了以上核心内容，书中的其他章节可能还会涉及Hadoop生态系统的其他组件，如HBase（分布式数据库）、Hive...

Hadoop硬实战 [（美）霍姆斯著][电子工业出版社][2015.01]_PDF电子书下载带书签目录高清完整版.rar ): 技术点3　使用Oozie 定期执行数据导入活动 2．2．3　从数据库中拉数据技术点4　使用MapReduce 将数据导入数据库技术点5　使用Sqoop 从MySQL 导入数据 2．2．4　HBase 技术点6　HBase 导入HDFS 技术点7　将...

国内第一部hadoop面试葵花宝典: 4. Hive：提供SQL-like查询接口，用于处理结构化数据，学习HQL语法和Hive表的管理是基础。 5. Pig：Pig Latin语言简化了大规模数据处理，理解其工作流和UDF（用户定义函数）的编写。 6. HBase：基于HDFS的NoSQL...

【面试宝典】2021年超全超详细的最新大数据开发面试题，附答案解析(一版).pdf: - 使用Oozie、Azkaban等工具实现Hive查询的调度。 **4. ORC、Parquet等列式存储的优点** - 支持列级别数据压缩。 - 加速查询响应时间。 - 减少磁盘I/O。 **5. 数据建模使用的模型** - 星型模型、雪花模型等。 *...

hadoop_the_definitive_guide_3nd_edition: Apache Oozie 182 6. How MapReduce Works . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 Anatomy of a MapReduce Job Run 187 Classic MapReduce ...

Spark分布式内存计算框架视频教程: 8.Oozie和Hue集成调度Spark 应用第五章、SparkStreaming 模块 1.Streaming流式应用概述 2.Streaming 计算模式 3.SparkStreaming计算思路 4.入门案例 5.SparkStreaming工作原理 6.DStream及函数 7.集成Kafka 8.案例...

思科—大数据: 2. **开发效率的提升**：通过使用Hive和Pig的用户定义函数(UDF)库，开发人员的工作效率得到了显著提高。 3. **作业调度的简化**：Cisco TES的使用极大地简化了作业调度和流程协调的过程。 4. **内部人才培养**：思科...

Global site tag (gtag.js) - Google Analytics