`

Tez: build from souce code

    博客分类:
  • Tez
 
阅读更多

build from source code

 

1. download   from http://tez.apache.org/install.html

if you want to get the lattest codes through this command

#git clone https://git-wip-us.apache.org/repos/asf/tez.git

 

#tar xvf apache-tez-0.5.1-src.tar.gz

#cd apache-tez-0.5.1-src

#mvn package  -Dhadoop.version=2.3.0 -P\!hadoop24 -DskipTests

 

error:

DAGClientTimelineImpl.java:[38,33] package com.sun.jersey.api.client does not exist

solution: modify tez-api/pom.xml 

 

  <dependencies>
     <dependency>
            <groupId>com.sun.jersey</groupId>
            <artifactId>jersey-client</artifactId>
            <version>1.9</version>
      </dependency>

......

 

rerun

#mvn clean package  -Dhadoop.version=2.3.0 -P\!hadoop24 -DskipTests

 

all build jars in tez-dist/target/ dir.

-------------------------------------------

Depoly tez to hadoop clusters

1. make TEZ_HOME

#mkdir -p /home/inok/tez

#cp tez-dist/target/tez-0.5.1-minimal.tar.gz  /home/inok/tez/

#cp tez-dist/target/tez-0.5.1.tar.gz  /home/inok/tez/

#cd /home/inok/tez

#mkdir conf

#mkdir jars

#cd conf

#vi tez-site.xml

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
  <name>tez.lib.uris</name>
  <value>${fs.defaultFS}/apps/tez-0.5.1/tez-0.5.1.tar.gz</value>
</property>

<property>
  <name>tez.use.cluster.hadoop-libs</name>
  <value>false</value>
</property>
</configuration>

 

#cd  ../

#tar xf tez-0.5.1-minimal.tar.gz -C  jars/

 

distribute tez dir to all cluster nodes /home/inok/

 

2. upload tez-0.5.1.tar.gz to hdfs

#hdfs dfs -mkdir -p /apps/tez-0.5.1

#hdfs dfs -put  tez-0.5.1.tar.gz  /apps/tez-0.5.1/

 

3. configure hadoop

# modify hadoop-2.3.0/etc/hadoop/mapred-site.xml

<property>
  <name>mapreduce.framework.name</name>
  <value>yarn-tez</value>
</property>

# modify hadoop-2.3.0/etc/hadoop/hadoop-env.sh

export TEZ_CONF_DIR=/home/inok/tez/conf
export TEZ_JARS=/home/inok/tez/jars
export HADOOP_CLASSPATH=$HADOOP_CLASSPATH:$TEZ_CONF_DIR:$TEZ_JARS/*:$TEZ_JARS/lib/*

 

update mapred-site.xml and hadoop-env.sh  in all hadoop cluster nodes

 

4. restart hadoop clusters

#stop-all.sh

#start-all.sh

 

5. test tez

#hdfs dfs -mkdir test

# vi words

good morning 
good afternoon
thanks 
my boy

#hdfs dfs -put words test/

#hadoop jar hadoop-2.3.0/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.3.0.jar wordcount test/words test/output

IF you see the following reds words, congratuations, tez works.

 

 
14/11/13 09:58:58 INFO client.RMProxy: Connecting to ResourceManager at /192.168.0.131:2015
14/11/13 09:58:58 INFO client.TezClient: Submitting DAG application with id: application_1415843888183_0002
14/11/13 09:58:58 INFO client.TezClient: Tez system stage directory hdfs://192.168.0.131:2014/mr-history/am/staging/inok/.staging/job_1415843888183_0002/.tez/application_1415843888183_0002 doesn't exist and is created
14/11/13 09:58:58 INFO client.TezClient: Submitting DAG to YARN, applicationId=application_1415843888183_0002, dagName=word count
14/11/13 09:58:58 INFO impl.YarnClientImpl: Submitted application application_1415843888183_0002
14/11/13 09:58:58 INFO client.TezClient: The url to track the Tez AM: http://inok-c0:2019/proxy/application_1415843888183_0002/
14/11/13 09:58:58 INFO client.RMProxy: Connecting to ResourceManager at /192.168.0.131:2015
14/11/13 09:58:58 INFO client.RMProxy: Connecting to ResourceManager at /192.168.0.131:2015
 
-----------------

When I submit a common mapreduce job in hue through oozie, there is an error

Cannot initialize Cluster. Please check your configuration for
 mapreduce.framework.name and the correspond server addresses

 

#oozie job --oozie http://localhost:11000/oozie --config examples/apps/java-main/job.properties  -run
job: 0000003-141113143744303-oozie-inok-W

 

http://qnalist.com/questions/5187496/failing-to-run-hive-action-using-mapreduce-framework-name-yarn-tez

 

 <property>
  <name>mapreduce.framework.name</name>
  <value>yarn-tez</value>
</property>

but  in mapred-default.xml  in hadoop-mapreduce-client-core-2.3.0.jar

<property>
  <name>mapreduce.framework.name</name>
  <value>local</value>
  <description>The runtime framework for executing MapReduce jobs.
  Can be one of local, classic or yarn.
  </description>
</property>

 

 ----
try these mothods

1. cp tez-site.xml to  etc/hadoop

2. cp all tez relavant jars to oozie share lib 's oozie dir and update to hdfs

3. check tez's example

 

 

References

http://blog.woopi.org/wordpress/?p=96

http://docs.hortonworks.com/HDPDocuments/HDP2/HDP-2.1.2/bk_installing_manually_book/content/rpm-chap-tez.html

 

分享到:
评论

相关推荐

    TEZ:训练pytorch模型更快rrrr......。-Python开发

    tez:训练pytorch模型fastrrrr ....... tez:训练pytorch模型fastrrrr .......注意:当前,我们不接受任何拉取请求! 所有公共关系将被关闭。 如果您需要某个功能或某些功能不起作用,请创建一个问题。 意思是“锐利...

    tez:Apache Tez

    阿帕奇·特兹(Apache Tez) Apache Tez是一个通用的数据处理管道引擎,被设想为用于更高抽象的低级引擎,例如Apache Hadoop Map-Reduce,Apache Pig,Apache Hive等。 从本质上讲,tez非常简单,只有两个组成部分...

    tez:Tez是用于PyTorch的超级简单且轻巧的Trainer。 它还带有许多实用程序,可用于解决PyTorch中90%以上的深度学习项目

    Tez:简单的pytorch培训师 注意:当前,我们不接受任何拉取请求! 所有公共关系将被关闭。 如果您需要某个功能或某些功能不起作用,请创建一个问题。 意思是“锐利,快速,活跃”。 这是一个简单的要点库,使您的...

    storm-tez:使用TEZ在纱线POC上进行风暴

    【标题】:“storm-tez:使用TEZ在YARN POC上进行风暴”是指将Apache Storm集成到Apache Tez框架中,在Hadoop YARN平台上进行流处理的Proof of Concept(POC)项目。 【描述】:“Storm-tez”是Apache Storm的一个...

    docker-hive-on-tez:在 Tez 上运行的 Apache Hive 的 Docker 镜像

    在 Tez 上运行 Apache Hive 的 Docker 镜像此存储库包含一个 docker 文件,用于构建 docker 映像以在 Tez 上运行 Apache Hive。 这个 docker 文件依赖于我的其他包含和 基础镜像的存储库。当前版本Apache Hive(主干...

    Hive错误之 Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask错误分析_xiaohu21的博客-CSDN博客.mht

    Hive错误之 Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask错误分析_xiaohu21的博客-CSDN博客.mht

    audioholic.tez:建立在Tezos区块链上的音乐流媒体购买平台

    audioholic.tez 建立在Tezos区块链上的音乐流/购买平台。

    cdh继承tez引擎 cdh添加tez引擎 hive引擎增加

    在CDH环境中集成Tez引擎以提升Hive的性能,主要涉及以下几个关键步骤和知识点: 1. **Hadoop版本匹配**: CDH版本需要与Tez版本相匹配。在这个例子中,CDH版本是6.2.0,而Tez版本是0.9.1。确保使用兼容的Hadoop...

    阿托斯 (ATOS)数字式位置控制器Z-RI-TEZ.pdf

    阿托斯 (ATOS)数字式位置控制器Z-RI-TEZpdf,阿托斯 (ATOS)数字式位置控制器Z-RI-TEZ:数字式,与阀集成,适用于轴运动控制

    运行引擎Tez.zip

    **Tez:Hadoop生态中的高性能计算引擎** Tez是Apache Hadoop生态系统中的一款高性能、可扩展的计算框架,主要用于优化大数据处理任务。它被设计为Hive的默认执行引擎,提供了一种比传统MapReduce(MR)更高效的数据...

    apache-tez-0.9.2-bin.tar.gz

    在`~/.bashrc`或`~/.bash_profile`中添加一行`export PATH=$PATH:/path/to/apache-tez-0.9.2-bin/bin`,然后运行`source ~/.bashrc`或`source ~/.bash_profile`使其生效。 3. **配置Hadoop**:在你的Hadoop配置文件...

    tez-ui-0.10.1.war

    【tez-ui-0.10.1.war】是一个重要的组件,它是Apache Tez用户界面的WAR(Web ARchive)文件,用于提供对Tez执行引擎的可视化监控和管理。Apache Tez是一个高性能、灵活的数据处理框架,它被广泛应用于Hadoop生态系统...

    Apache TEZ部署手册

    1. 解压 tar 包 `tar –zxvf ./tez/tez-dist/target/tez-0.7.0.tar.gz` 和 `tar –zxvf ./tez/tez-dist/target/tez-0.7.0-minimal.tar.gz`。 2. 将 tez-0.7.0 上传到 HDFS `hadoop fs –mkdir /apps` 和 `hadoop fs ...

    CDH6.3.2集成tez

    ### CDH6.3.2集成tez #### 概述 Cloudera Distribution Including Apache Hadoop (CDH) 是一款由 Cloudera 公司提供的企业级大数据平台,它包含了 Hadoop 生态系统中的核心组件和服务。Tez 是一个支持复杂数据处理...

    tez-0.9.1.tar.gz

    《Tez框架在CDH6.3.2中的编译与应用详解》 Tez,一个由Apache Hadoop社区开发的通用数据处理框架,旨在提供更高效、灵活和可扩展的计算模型。在Hadoop生态系统中,Tez作为YARN上的任务调度和执行引擎,可以替代...

    tez-0.10.1.zip

    **Tez 框架详解** Tez 是一个由 Apache Hadoop 社区开发的通用、灵活且高效的处理框架,其设计目标是替代 MapReduce,成为Hadoop 生态系统中的新计算模型。在 `tez-0.10.1.zip` 这个压缩包中,包含了 Tez 的最新...

    tez.tar.gz

    【tez.tar.gz】是一个压缩包文件,其中包含与Tez相关的多个组件和库,用于在Hadoop生态系统中执行复杂的并行数据处理任务。Tez是Apache Hadoop的一个开源框架,设计用来提供比MapReduce更高效、更灵活的作业执行模型...

    hive on tez 常见报错问题收集

    然而,在实际操作中,我们经常会遇到一些常见的错误,特别是当Hive运行在Tez引擎上时。这里我们将深入探讨五个在Hive on Tez中常见的报错问题及其解决方案。 1. 错误一:Failing because I am unlikely to write ...

    tez-0.9.2-minimal.tar.gz

    【标题】"tez-0.9.2-minimal.tar.gz"是一个压缩包,其中包含了TEZ框架0.9.2版本的精简版组件。这个版本是针对Hadoop 3.2.1构建的,确保了与最新Hadoop生态系统的兼容性。 【描述】描述表明,这个压缩包是开发者或...

    hive&tez.zip

    Apache Hive和Tez是大数据处理领域中的两个重要组件,它们在Hadoop生态系统中扮演着关键角色。本篇文章将深入探讨这两个工具以及它们如何协同工作。 Hive是基于Hadoop的数据仓库工具,它允许用户通过SQL(称为HQL,...

Global site tag (gtag.js) - Google Analytics