`

[解決] Spark run on yarn (spark2-hdp-yarn-archive.tar.gz)

 
阅读更多

 

最近在yarn 上運行spark 遇到一個奇怪的問題:

Diagnostics: ExitCodeException exitCode=2: 
gzip: /spare/hadoop/yarn/local/filecache/21_tmp/tmp_spark2-hdp-yarn-archive.tar.gz: unexpected end of file
tar: This does not look like a tar archive
tar: Exiting with failure status due to previous errors

 

查閲了很多資料,偶然看到以下的url 受到啓發,發現在 hdfs://xxxxx/hdp/apps/<version>/spark2/ 下的spark2-hdp-yarn-archive.tar.gz 有問題,並不是一個真正的gz file, 這個就是問題所在。

 

解決方案:

把/usr/hdp/current/spark2-client/jars 打包成spark2-hdp-yarn-archive.tar.gz, 並put 到hdp/apps/<version>/spark2/ 。 記得檢查權限,至少444.

 

然後使用 spark-submit  xxx --master yarn 執行,通過!

 

我使用的是hdp 2.5, spark 2.1.

 

[參考]

https://community.hortonworks.com/articles/30096/foxing-broken-targz-and-jar-files-in-hdp-24.html

分享到:
评论

相关推荐

    HDP-GPL-3.1.4.0-centos7-gpl.tar.gz

    标题 "HDP-GPL-3.1.4.0-centos7-gpl.tar.gz" 提供的信息表明,这是一个与HDP(Hortonworks Data Platform)相关的开源版本,版本号为3.1.4.0,是为CentOS 7操作系统设计的。HDP是一个基于Apache Hadoop的全面数据平台...

    HDP-GPL-2.6.4.0-centos7-rpm.tar.gz

    通常,一个名为"HDP-GPL-2.6.4.0-centos7-rpm.tar.gz"的压缩包会包含一系列以".rpm"结尾的文件,这些文件对应了HDP的不同组件,如Hadoop的核心服务(HDFS、YARN)、MapReduce、Hive、Pig、ZooKeeper等。此外,还可能...

    yarn-v1.22.5.tar.gz

    1. 下载并解压:首先从源下载 `yarn-v1.22.5.tar.gz` 文件,然后使用 `tar -zxvf yarn-v1.22.5.tar.gz` 命令进行解压。 2. 安装:解压后,进入解压后的目录,通过运行 `./install.sh` 或者 `sudo ./install.sh`...

    jdk1.8+yarn-1.22.10.tar.gz

    本压缩包“jdk1.8+yarn-1.22.10.tar.gz”提供了JDK 1.8和YARN 1.22.10的集成,便于在Hadoop集群上部署和管理Java应用。 【JDK1.8】 JDK 1.8是Oracle公司发布的Java开发工具包的一个重要版本,它引入了许多新特性,...

    HDP-GPL-3.0.1.0-centos7-gpl.tar.gz 用于部署HDP大数据平台,处理和分析各种类型的数据

    该软件包主要用于在CentOS 7操作...通过安装和配置HDP-GPL-3.0.1.0-centos7-gpl.tar.gz,您可以搭建一个功能强大的大数据平台,用于处理和分析各种类型的数据。它可以帮助您实现数据的存储、处理、查询和可视化等任务。

    hadoop-3.1.1.3.1.4.0-315.tar.gz

    ambari-2.7.5 编译过程中四个大包下载很慢,所以需要提前下载,包含:hbase-2.0.2.3.1.4.0-315-bin.tar.gz ,hadoop-3.1.1.3.1.4.0-315.tar.gz , grafana-6.4.2.linux-amd64.tar.gz ,phoenix-5.0.0.3.1.4.0-315....

    hbase-2.0.2.3.1.4.0-315-bin.tar.gz

    ambari-2.7.5 编译过程中四个大包下载很慢,所以需要提前下载,包含:hbase-2.0.2.3.1.4.0-315-bin.tar.gz ,hadoop-3.1.1.3.1.4.0-315.tar.gz , grafana-6.4.2.linux-amd64.tar.gz ,phoenix-5.0.0.3.1.4.0-315....

    yarn.tar.gz

    此外,你还需要掌握YARN的配置,如在`yarn-site.xml`中设置的参数,以及如何通过命令行接口与YARN交互,如提交应用程序、查看应用程序状态等。同时,了解YARN与MapReduce、Spark等计算框架的集成也是很重要的。 总...

    yarn-v0.23.2.tar.gz

    yarn-v0.23.2.tar.gz 在安装ambari,源码编译的时候下载的文件有问题 手动下载 地址 https://github.com/yarnpkg/yarn/releases/download/v0.23.2/yarn-v0.23.2.tar.gz

    SPARK2_ON_YARN-2.4.0.cloudera2.jar

    SPARK2_ON_YARN-2.4.0 jar包下载

    Ambari-2.7.3.0+HDP-3.1.0.0-Ubuntu安装包-HDP安装包大全

    HDP是由 Hortonworks 提供的一个全面的数据平台,它包含了多个开源项目,如Hadoop、HBase、YARN、Spark等,为数据处理提供了一站式的解决方案。HDP-3.1.0.0是一个特定的版本,它可能包含了性能优化、新功能的引入...

    spark2-2.4.0.cloudera2-1.cdh5.13.3.p0.1041012-el6.zip

    在压缩包中,"SPARK2_ON_YARN-2.4.0.cloudera2.jar"是Spark在YARN上的运行时JAR文件,包含了运行Spark应用程序所需的依赖。"manifest.json"通常包含有关软件包的信息,如版本、依赖项等,对于CDH环境来说,它可能是 ...

    yarn-1.22.10编译工具

    yarn-1.22.10编译工具yarn-1.22.10编译工具 yarn-1.22.10编译工具yarn-1.22.10编译工具 yarn-1.22.10编译工具yarn-1.22.10编译工具 yarn-1.22.10编译工具yarn-1.22.10编译工具 yarn-1.22.10编译工具yarn-1.22.10编译...

    hadoop-2.7.1.tar.gz.zip

    在安装和配置Hadoop时,你需要修改conf目录下的配置文件,如core-site.xml(定义HDFS的基本属性)、hdfs-site.xml(设置HDFS的参数)、mapred-site.xml(设置MapReduce参数)和yarn-site.xml(配置YARN)。...

    yarn-v1.19.1.tar.gz

    `yarn-v1.19.1.tar.gz`是一个包含Yarn源码的压缩包,版本号为1.19.1。这个版本可能是在特定日期发布的稳定版,提供了该时期Yarn的功能和修复。 首先,让我们深入了解一下Yarn。Yarn的主要目标是提供更快、更安全、...

    spark-2.2.0-yarn-shuffle.jar

    spark-2.2.0-yarn-shuffle.jar

    hadoop-2.6.5.tar.gz

    安装Hadoop时,需要配置环境变量、Hadoop配置文件(如core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml),以及集群的节点设置。同时,为了运行Hadoop,你需要一个Java运行环境(JRE)。 4. **集群...

    apache-ambari-2.7.5-src.tar.gz

    在"apache-ambari-2.7.5-src.tar.gz"这个压缩包中,我们获得了Ambari的源代码,这意味着我们可以根据自己的需求进行定制和编译。 1. **Ambari核心功能**: - **安装和配置**:Ambari提供了自动化安装和配置Hadoop...

    node-v16.20.2-linux-x64.tar.xz

    node-v16.20.2-linux-x64.tar.xz

    spark-2.2.1-bin-2.6.0-cdh5.14.2.tar.gz

    在本例中,我们讨论的是Spark 2.2.1版本与CDH 5.14.2的集成,具体文件为"spark-2.2.1-bin-2.6.0-cdh5.14.2.tar.gz",这是一个压缩包文件,用于在CDH环境中部署Spark。 首先,让我们深入了解Spark的核心概念。Spark...

Global site tag (gtag.js) - Google Analytics