Spark 启动脚本——启动总结 - zzm - ITeye博客

`

m635674608

浏览: 5090126 次
性别:
来自: 南京

最近访客更多访客>>

wusuosuo

yijiaomuqing

millerchu

xdung

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

明兜3号：部署落地+业务迁移玩转k8s进阶与企业级实践技能（又名：Ku ...
Kubernetes系统常见运维技巧
q328965539：牛掰啊资料收集的很全面
HDFS小文件处理解决方案总结+facebook(HayStack) + 淘宝（TFS）
guichou： fluent挂载了/var/lib/kubelet/pods目 ...
kubernetes上部署Fluentd+Elasticsearch+kibana日志收集系统
xu982604405： System.setProperty("java.r ...
jmx rmi 穿越防火墙问题及jmxmp的替代方案
大漠小帆：麻烦问下，“获取每个Item相似性最高的前N个Item”，这个 ...
协同过滤推荐算法在MapReduce与Spark上实现对比

Spark 启动脚本——启动总结

博客分类：

spark

阅读更多

1. 设置主目录和配置目录

2. 启动Master

sbin/spark-daemon.sh start org.apache.spark.deploy.master.Master 1 --ip $SPARK_MASTER_IP --port $SPARK_MASTER_PORT --webui-port $SPARK_MASTER_WEBUI_PORT

3. 启动slaves

单实例：sbin/start-slave.sh 1 spark://$SPARK_MASTER_IP:$SPARK_MASTER_PORT

多实例：sbin/start-slave.sh i spark://$SPARK_MASTER_IP:$SPARK_MASTER_PORT --webui-port <8081++>

slave机执行命令：sbin/spark-daemon.sh start org.apache.spark.deploy.worker.Worker i spark://$SPARK_MASTER_IP:$SPARK_MASTER_PORT --webui-port <8081++>

4. 实际执行命令

bin/spark-class org.apache.spark.deploy.master.Master|org.apache.spark.deploy.worker.Worker spark://xxxxxx:xxxx --webui-port xxxx

http://www.cnblogs.com/hujunfei/p/3624508.html

分享到：

Spark 启动脚本——sbin/slaves.sh | spark rdd 转换过程

2015-10-25 00:06
浏览 1107
评论(0)
分类:编程语言
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

【自动化脚本】自动启动hdfs/yarn/spark HA集群: 脚本功能：启动集群前提：配置好执行脚本的主机到其他主机的ssh登录脚本使用：vim编辑脚本，按照自己的配置修改主机号，我的是hadoop1、2是NN；hadoop2、3是Spark Master；hadoop3还是RM；hadoop4、5、6是DN、NM、...

spark-master.zip: 在"spark-master"这个文件夹中，可能包含了启动和配置Spark Master所需的各种文件和脚本。通常，你会看到如下内容： 1. `sbin`目录：包含启动和停止Spark Master的脚本，如`start-master.sh`和`stop-master.sh`。 2...

Spark不能使用hive自定义函数.doc: 这可以通过修改 Spark 的启动脚本或者使用 `--jars` 参数来实现。 - 如果需要加载多个 jar 包，可以将它们放在同一个目录下，然后通过通配符方式引入所有 jar 文件，例如 `/root/mqw/udf/*`。 3. **优化依赖管理**...

spark-3.0.0-bin-hadoop3.2: 在Windows环境下，你可以通过修改配置文件，设置环境变量，并使用提供的启动脚本来运行Spark Shell、Spark Submit等工具，开始你的大数据处理之旅。为了充分利用Spark的功能，你需要了解如何配置Spark的运行环境，...

基于spark的大数据过滤引擎推荐系统.zip: 首先，我们来看项目的核心技术——Spark。Spark是由Apache软件基金会维护的开源大数据处理框架，其主要特点是支持内存计算，大大提升了数据处理的速度。相比于Hadoop MapReduce，Spark通过将数据存储在内存中，减少...

逻辑回归分类实验——【机器学习与算法分析】.docx: 1. **启动pyspark**：在命令行中使用`pyspark --master local[4]`启动Spark的本地模式。 2. **导入库和读取数据**：导入必要的库，如SparkContext、SQLContext、SparkConf等，然后读取wine数据集，将其转换为Spark ...

hadoop 的windows补丁: 6. **启动Hadoop服务**: 使用Hadoop的启动脚本启动各个服务，如`start-dfs.cmd`和`start-yarn.cmd`。 7. **测试运行**: 通过运行简单的Hadoop命令，如`hadoop fs -ls /`，验证Hadoop是否已在Windows上成功运行。 ...

ml-spark:毫升火花: 7. **示例脚本**：可能包含启动Spark作业的示例脚本，展示如何在命令行中提交任务。通过对Spark和Scala的深入理解，以及对Spark Notebook的熟练运用，可以有效地进行大规模数据的预处理、特征工程、模型训练和评估...

Hibench大数据基准测试手册 - 修订1.docx: 例如，运行`bin/run.sh hibench spark_benchmark`即可启动Spark基准测试。 ##### 2.4 运行流式处理基准测试针对流式处理框架，如Spark Streaming、Flink、Storm和Gearpump，需要特别注意的是，这些框架的配置和...

ranger-admin集成: 5. **启动Ranger Admin**：使用Ranger提供的启动脚本来启动服务，如 `start-all.sh`。 6. **设置安全**：根据组织的安全策略，可能需要配置SSL/TLS以加密通信，并启用Kerberos进行身份验证。 7. **连接数据源**：...

forsub: 压缩包子文件的文件名称为"forsub-main"，这可能是一个主文件或者启动脚本，它包含了运行整个"MP2_Spark"项目或任务的逻辑。在Python中，"main"通常用来表示程序的入口点，根据`if __name__ == "__main__"`条件判断...

SparkInspectorFramework:用于 Cocoapods 和其他项目的 Spark Inspector 框架的副本: SparkInspectorFramework 是一个专为Cocoapods和其他iOS开发项目设计的框架，它提供了一种强大的工具——Spark Inspector，用于调试和分析应用性能。在Objective-C编程语言环境下，这个框架可以帮助开发者深入理解...

大数据安全-kerberos技术-hadoop安装包，hadoop版本：hadoop-3.3.4.tar.gz: - 示例脚本和工具，如启动脚本、数据迁移工具等总的来说，使用Kerberos与Hadoop-3.3.4结合，可以构建一个安全可靠的大数据处理环境。在实际操作中，管理员需要深入了解Kerberos的工作原理和Hadoop的配置细节，以...

r-demos-aws:用于在AWS中运行R演示的脚本: 在使用r-demos-aws之前，需要了解AWS的基础服务，如EC2（Elastic Compute Cloud）——提供了可扩展的虚拟服务器，以及S3（Simple Storage Service）——用于存储和检索数据的云存储服务。理解这些服务如何协同工作...

streamx-console-service_2.11-1.2.3.tar.gz: 前者可能是隐藏的MacOS元数据文件，后者则是实际的软件包内容，包含启动脚本、配置文件、依赖库等，用于在本地或服务器上部署StreamX Console Service。在部署时，你需要按照官方文档的指导，配置相关参数（如...

PyPI 官网下载 | aws-cdk.aws-emr-1.136.0.tar.gz: 例如，你可能需要根据业务需求动态调整集群规模，或者在特定时间启动和停止集群，这些都可以通过编写Python脚本和调用CDK API实现。此外，CDK还支持与其他AWS服务的集成，如S3（用于存储数据）、Lambda（用于事件...

hadoop3lib.rar: 在压缩包中，这些组件的相关库文件可能包含配置信息、服务启动脚本等，对于理解并部署Hadoop集群至关重要。在大数据处理中，Hadoop的MapReduce模型起着核心作用。它将大规模数据处理任务分解为许多小任务，分布在...

hadoop-2.6.5【已配好windows版本，请按readme文件配置环境变量、放置dll】: 6. **启动Hadoop服务**：通过执行`start-dfs.sh`和`start-yarn.sh`脚本启动Hadoop的DataNodes、NameNode、ResourceManager和NodeManager等服务。你可以通过`jps`命令检查各个进程是否正常运行。 7. **测试Hadoop**...

Hadoop _centos文件.rar: 6. **启动Hadoop**：通过执行`start-dfs.sh`和`start-yarn.sh`脚本启动HDFS和YARN服务。 7. **检查Hadoop状态**：使用`jps`命令查看各个Hadoop进程是否正常运行，或者通过Web UI访问`http://localhost:50070`...

hadoop 无jar版 2.7.0: 标题中的“hadoop 无jar版 2.7.0”指的是Hadoop框架的一个特定版本——2.7.0，这个版本在某些情况下可能不包含通常所需的JAR文件。Hadoop是一个开源分布式计算框架，主要设计用于处理和存储大规模数据集。在分布式...

Global site tag (gtag.js) - Google Analytics