`
qindongliang1922
  • 浏览: 2183902 次
  • 性别: Icon_minigender_1
  • 来自: 北京
博客专栏
7265517b-f87e-3137-b62c-5c6e30e26109
证道Lucene4
浏览量:117534
097be4a0-491e-39c0-89ff-3456fadf8262
证道Hadoop
浏览量:125921
41c37529-f6d8-32e4-8563-3b42b2712a50
证道shell编程
浏览量:59907
43832365-bc15-3f5d-b3cd-c9161722a70c
ELK修真
浏览量:71301
社区版块
存档分类
最新评论

Hive集成Tez让大象飞起来

    博客分类:
  • Hive
阅读更多




基础环境

Apache Hadoop2.7.1
Centos6.5
Apache Hadoop2.7.1
Apache Hbase0.98.12
Apache Hive1.2.1
Apache Tez0.7.0
Apache Pig0.15.0
Apache oozie4.2.0
Apache Spark1.6.0
Cloudrea Hue3.8.1

安装Tez,请参考上篇文章:http://qindongliang.iteye.com/blog/2271440

安装成功之后,在hadoop/etc/hadoop/下面新建一个tez-site.xml,并配置tez的lib路径:

<configuration>
    <property>
        <name>tez.lib.uris</name>
       <value>/user/tez</value>
    </property>
</configuration>


然后执行命令hadoop fs -mkdir -p /user/tez 在HDFS上创建tez的目录
接着执行hadoop fs -copyFromLocal tezlib/* /user/tez上面tez相关的所有jar到HDFS对应的路径下

有一点需要注意,在实际交替运行pig on tez 和hive on tez时,发现hive报了一个异常:






博客地址:http://qindongliang.iteye.com/
原始是tez编译出来的这个jar包,与hadoop的里面jar大小不一致,所以就报这个异常了,解决办法,统一按照hadoop里面这个jar包大小运行即可

另外一点需要注意的是,如果集群中装有压缩功能,lzo或者snappy那么也需要将相关的jar包传到/user/tez里面





设置tez模式,然后查询:
set hive.execution.engine=tez;
启动相关服务,在hue里面查询
bin/hive --service metastore
bin/hiveserver2
而且,结果还支持图表展示:




扫码关注微信公众号:我是攻城师(woshigcs),我们一起学习,进步和交流!(woshigcs)
本公众号的内容是有关搜索和大数据技术和互联网等方面内容的分享,也是一个温馨的技术互动交流的小家园,有什么问题随时都可以留言,欢迎大家来访!

  • 大小: 95.7 KB
  • 大小: 61.7 KB
  • 大小: 28 KB
  • 大小: 42 KB
0
0
分享到:
评论

相关推荐

    hive on tez 常见报错问题收集

    然而,在实际操作中,我们经常会遇到一些常见的错误,特别是当Hive运行在Tez引擎上时。这里我们将深入探讨五个在Hive on Tez中常见的报错问题及其解决方案。 1. 错误一:Failing because I am unlikely to write ...

    hive&tez.zip

    Apache Hive和Tez是大数据处理领域中的两个重要组件,它们在Hadoop生态系统中扮演着关键角色。本篇文章将深入探讨这两个工具以及它们如何协同工作。 Hive是基于Hadoop的数据仓库工具,它允许用户通过SQL(称为HQL,...

    cdh继承tez引擎 cdh添加tez引擎 hive引擎增加

    在CDH环境中集成Tez引擎以提升Hive的性能,主要涉及以下几个关键步骤和知识点: 1. **Hadoop版本匹配**: CDH版本需要与Tez版本相匹配。在这个例子中,CDH版本是6.2.0,而Tez版本是0.9.1。确保使用兼容的Hadoop...

    Hive_1.2.1_Tez_0.9.1安装包.rar

    Hive和Tez是大数据处理领域中的两个重要组件,它们在数据仓库和分析工作中发挥着关键作用。Hive是基于Hadoop的数据仓库工具,能够将结构化的数据文件映射为一张数据库表,并提供SQL(HQL)接口进行数据查询和分析。...

    CDH6.3.2集成tez

    ### CDH6.3.2集成tez #### 概述 Cloudera Distribution Including Apache Hadoop (CDH) 是一款由 Cloudera 公司提供的企业级大数据平台,它包含了 Hadoop 生态系统中的核心组件和服务。Tez 是一个支持复杂数据处理...

    Hive LLAP&ApacheTez;

    ### Hive LLAP与Apache Tez关键技术解析 #### 一、Hive概述 **Hive**是一种基于Hadoop的大数据处理工具,主要用于存储和查询结构化的数据。它通过提供类似于SQL的语言(HQL)来简化Hadoop上的数据分析过程,使得...

    源码apache-tez-0.8.3编译后的hadoop2.7.3版本hive-tez包tez-0.8.3.tar.gz

    源码使用的是apache-tez-0.8.3,对应的hadoop版本2.7.3,源码包中的nodejs的版本是v0.12.3,很难编译通过,最后把nodejs改成了v4.0.0才编译通过tez-ui2模块。

    源码apache-tez-0.8.3编译后的hadoop2.8.3版本hive-tez包tez-0.8.3.tar.gz

    源码使用的是apache-tez-0.8.3,对应的hadoop版本2.8.3,源码包中的nodejs的版本是v0.12.3,很难编译通过,最后把nodejs改成了v4.0.0才编译通过tez-ui2模块。

    本项目为大数据基础镜像组件,其中包括Hadoop、Spark、Hive、Tez、Hue、Flink、MySQL等

    在大数据环境中,MySQL常作为元数据存储或与其他大数据组件集成,提供数据的快速查询和事务处理能力。 综上所述,这个项目为用户搭建了一个综合的大数据环境,涵盖了从数据存储、计算到数据访问和分析的各个环节,...

    大数据Hive on MR/TEZ与hadoop的整合应用

    本课程主要介绍hive的架构与应用,首先介绍了hive的实现结构,然后介绍了Hive Metastore三种模式,接着重点介绍hive的安装与配置,以及hive sql的基本操作,后面又介绍了hive beeline、hive on tez的使用,并测试了...

    大数据环境搭建,本项目为大数据基础镜像组件,其中包括Hadoop、Spark、Hive、Tez、Hue、Flink、.zip

    在大数据领域,构建一个高效、稳定的工作环境是至关重要的,这通常涉及到多个组件的集成与配置。本项目提供了一个基础的大数据环境搭建方案,涵盖了Hadoop、Spark、Hive、Tez、Hue以及Flink等核心组件。下面将详细...

    HiveMRvsHiveTez:Hadoop 2.6.0 + Hive 1.2.0 + Tez 0.7.0 + Tez UI 0.7.0 + MySQL + BigFrame + Datahooks

    使用BigFrame比较Hive-MR和Hive-Tez的性能Hadoop 2.6.0 + Hive 1.2.0 + Tez 0.7.0 + Tomact 8.0 + Tez UI 0.7.0 + MySQL + BigFrame + Datahooks教程 系统必备本教程基于Ubuntu 14.04LTS 64位版本。 添加一个名为...

    idea 集成使用 hive 需要导入的jar包.rar

    在IntelliJ IDEA中集成Apache Hive进行大数据处理是开发过程中的常见需求。Hive是一个基于Hadoop的数据仓库工具,能够将结构化的数据文件映射为一张数据库表,并提供SQL(HQL,Hive Query Language)查询功能,方便...

    hive集成atlas的hive-hook编译包

    hive集成atlas的hive-hook编译包

    Hadoop3+Hive3+Tez编译安装

    Hadoop3+Hive3+Tez编译安装;适用视频:https://www.bilibili.com/video/BV1L54

    基于CentOS7的Hadoop2.7.7集群部署+hive3.1.1+Tez0.9.1.doc

    "基于CentOS7的Hadoop2.7.7集群部署+hive3.1.1+Tez0.9.1" 本文档旨在描述基于CentOS7的Hadoop2.7.7集群部署+hive3.1.1+Tez0.9.1的环境搭建过程。该文档涵盖了环境说明、软件版本说明、配置hosts和hostname、配置SSH...

    flink1.12.0集成或者连接hive3.1.2的依赖包

    将 Flink 与 Hive 集成,可以充分利用 Flink 的实时处理能力与 Hive 的数据仓库功能,实现高效的数据分析。 标题提到的是 Flink 1.12.0 版本与 Hive 3.1.2 版本的集成,这是一个常见的需求,因为这两大组件的结合...

    tez-ui-0.10.1.war

    5. **集成Hive**:为了在Hive中利用Tez UI,还需要在Hive的配置文件(如`hive-site.xml`)中设置`tez.ui.history.url.base`属性,指向Tez UI的URL。 6. **测试与验证**:运行一个Hive查询并检查Tez UI是否能正确...

    Hive集成Python分析数据

    Hive;Hive;Hive;Hive;Hive;Hive;Hive;Hive;Hive;Hive;Hive;Hive

    HDP平台的Hive性能调优——Hive高性能最佳实践

    在HDP平台上,Tez被设置为默认执行引擎,可以通过Hive-site.xml配置文件来确保使用Tez。 2. 使用ORC文件格式 ORC(Optimized Row Columnar)是Hive中用于存储数据的文件格式之一,相比其他格式如Parquet,ORC具有更...

Global site tag (gtag.js) - Google Analytics