方便调试spark参数的python脚本 - 在路上 - ITeye博客

`

softkf

浏览: 35555 次
性别:
来自: 上海

最近访客更多访客>>

qq1264926943

一指琉璃砂

woodding2008

wd1282988143

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

xiaohuafyle： ...
查看端口占用情况
huaweiAt_888： ...
%type与%rowtype区别

方便调试spark参数的python脚本

博客分类：

Spark

阅读更多

# encoding:utf-8
__author__ = 'jwang'
import os

cmd_list = []

spark_submit = '/usr/local/datacenter/spark/bin/spark-submit'


cmd_list.append(spark_submit)

cmd_list.append('--class')
cmd_list.append('com.xx.xx.RBK')

cmd_list.append('--master')
cmd_list.append('yarn')

cmd_list.append('--name')
cmd_list.append('XXRBK')

cmd_list.append('--executor-memory')
cmd_list.append('3g')

cmd_list.append('--driver-memory')
cmd_list.append('3g')

cmd_list.append('--executor-cores')
cmd_list.append('16')

cmd_list.append('xxxx.jar')

params = []

params.append('"xx"')
params.append('"rule"')

cmd_list.extend(params)

exec_cmd = ' '.join(cmd_list)

#''
print 'start to execute ::: ' + exec_cmd

os.system(exec_cmd)
os._exit(0)

分享到：

将博客搬至CSDN | 初识MongoDB

2015-12-13 21:32
浏览 1196
评论(0)
分类:编程语言
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

各类速查表汇总-PySpark Cheat Sheet -Spark in Python: 这个命令指定了要执行的Python脚本文件。通过这种方式，可以方便地在集群上运行PySpark程序。以上就是PySpark Cheat Sheet的主要内容，涵盖了PySpark的基本操作和常用API。掌握这些知识点对于高效地使用PySpark...

本地调试所需spark-x.x.x-bin-hadoop包: 在本地环境调试Spark应用时，你需要首先解压spark-x.x.x-bin-hadoop.rar，这将得到一个包含所有Spark可执行文件和配置文件的目录结构。然后，你可以设置SPARK_HOME环境变量指向这个目录，接着配置Spark的启动参数，...

Python库 | spark_datax_schema_tools-0.0.31.tar.gz: 1. **源代码**：Python模块和脚本，实现数据架构工具的核心功能，如读取、验证和转换数据schema。 2. **文档**：可能有README文件，详细介绍了如何安装、配置和使用该库，以及它的功能和限制。 3. **示例**：可能...

Python-一个用于启动ApacheSpark集群的命令行工具: 而这个命令行工具为用户提供了与Spark集群交互的简单接口，使得在本地或云端部署Spark变得更加方便。描述中的“一个用于启动Apache Spark集群的命令行工具”进一步强调了该工具的主要功能，即通过命令行界面来启动...

Python库 | dagster-spark-0.7.12.tar.gz: 标题中的“Python库 | dagster-spark-0.7.12.tar.gz”指的是一个针对Python编程语言的库，名为dagster-spark，版本号为0.7.12，其源代码或安装包被封装在tar.gz格式的压缩文件中。tar.gz是一种常见的Linux/Unix系统...

Python3实战Spark大数据分析及调度-第10章 Azkaban基础篇.zip: 例如，你可以使用Python编写数据预处理脚本，然后通过Spark进行大规模计算，最后通过Azkaban调度系统自动化执行整个流程。这种组合使得数据分析和处理更加灵活，同时也提高了工作效率。本章的学习内容将涵盖以下几...

Java中调用Python代码: 4. **使用进程通信**: 另一种方法是通过启动Python脚本作为独立的进程，然后使用Java的`ProcessBuilder`或`Runtime.exec()`来执行Python命令。这种方法较为通用，但需要处理进程间通信（如标准输入/输出流）。 5. *...

spark-3.2.4-bin-hadoop3.2-scala2.13 安装包: 对于应用程序开发，可以使用Scala、Java、Python或R编写代码，然后通过`spark-submit`脚本提交作业到集群。 6. **性能优化**: Spark提供了一系列性能优化手段，如Tungsten内存管理、Code Generation、Shuffle优化等...

datax-python3.rar: - 修改配置文件，如"datax_home/conf/datax.json"，配置数据源、任务参数等信息。 - 在命令行中，使用`python datax.py [job_config_file_path]`命令启动DataX任务。 4. **DataX 支持的数据源** - 数据库：如...

spark-2.1.0-bin-without-hadoop.tgz: Spark Shell提供了交互式的Python（pyspark）和Scala环境，便于快速测试和调试代码。应用程序可以通过`spark-submit`脚本提交到集群。 6. **性能优化**：Spark支持动态资源调度、数据缓存以及Tungsten和Codegen技术...

配置好的 pyspark 安装包 spark-2.3.0-bin-2.6.0-cdh5.7.0.tar.gz: 在大数据处理领域，Apache Spark 以其高效、易用的特性备受青睐，而 pyspark 则是 Spark 与 Python 的结合，为 Python 开发者提供了便利的数据处理接口。本文将详细讲解如何配置和使用已准备好的 pyspark 安装包 `...

Spark Streaming 流式日志过滤的实验资源: - **数据持久化**：Log2DB.py 可能是一个 Python 脚本，用于将过滤后的日志数据存储到数据库中，这是实时数据分析的常见后处理步骤。 - **数据库连接**：Spark Streaming 可以直接与多种数据库系统集成，如 HBase...

Spark开发指南.pdf: - `$SPARK_HOME/examples/src/main/python/pi.py`: 指定 Python 脚本路径。 ##### 3.2 Spark-shell - **描述**: 提供了一个交互式的 Scala shell，用于快速编写和执行 Spark 应用。 - **示例**: - 启动 Spark-...

日志分析脚本文件: `funcstack.py`这个脚本可能是用Python编写的，因为Python是一种广泛用于日志分析的编程语言，其语法简洁且拥有丰富的标准库和第三方库，如`logging`和`pandas`，能方便地处理日志数据和数据分析。脚本可能包含...

PyPI 官网下载 | dagster-spark-0.8.9.tar.gz: 3. **多模态API**：Spark提供了多种编程接口，包括Scala、Java、Python和R，使得不同背景的开发人员都能方便地使用。 4. **SQL支持**：Spark SQL提供了对结构化数据处理的支持，可以方便地与其他SQL系统集成。 **...

spark源码-master: SparkSubmit首先会与Master建立连接，注册应用，然后将作业的JAR包或Python脚本上传到集群，最后请求Master启动作业。 7. **事件驱动模型**： Spark Master使用事件驱动的编程模型来处理各种操作，如Worker注册、...

spark-tut-2016-intro.pdf: - **Job提交**：通过`spark-submit`命令提交Spark应用，同样也支持Python脚本的执行。 - **Notebook**：支持Jupyter Notebook、Zeppelin等交互式编程环境，方便代码编写和调试。 - **Web界面**：对于大型组织，如...

写给Python程序员的Scala入门教程1: 与Python的函数相比，Scala的函数可以作为一等公民，被赋值给变量、作为参数传递和返回。 9. **Scala的类型系统**： Scala的类型系统比Python复杂，但提供了更细粒度的控制。例如，Scala的`Option`类型用于处理...

Global site tag (gtag.js) - Google Analytics