Spark源码分析1-部署与整体架构 -

frankfan915

浏览: 356532 次
性别:
来自: 杭州

最近访客更多访客>>

gaojingsong

javacoo

449582981

nick_jian

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

Spark源码分析1-部署与整体架构

博客分类：

源码分析
Spark

Spark官网：http://spark.apache.org/docs/latest/

Apache Spark is a fast and general-purpose cluster computing system. It provides high-level APIs in Scala, Java, and Python that make parallel jobs easy to write, and an optimized engine that supports general computation graphs. It also supports a rich set of higher-level tools includingShark (Hive on Spark), MLlib for machine learning, GraphX for graph processing, and Spark Streaming.

Spark 部署

1.下载：http://spark.apache.org/downloads.html.

2. 编译：sbt/sbt assembly

3.启动master：./sbin/start-master.sh

启动work：./bin/spark-class org.apache.spark.deploy.worker.Worker spark://IP:PORT

4.spark的部署方式

1）local 模式，将master设置成“local”，这样spark将以本地模式运行，不用启动work和master，适合于调试

2）deriver模式：

./bin/spark-class org.apache.spark.deploy.Client --supervise --verbose launch spark://hzs-sparc01:7077 file:///home/share/lib/OperationIntelligence-0.0.1-SNAPSHOT.jar com.seven.oi.spark.RemoteSparkApplication

master将在work上启动一个deriver用来管理excutor的运行

deriver模式的优点是master可以管理deriver，当deriver挂掉后，可以重新启动deriver。

3）app模式：将app打成jar包，调用jar命令运行这个jar包

java -cp OperationIntelligence-0.0.1-SNAPSHOT.jar com.seven.oi.spark.RemoteSparkApplication

类似于deriver模式，但master不会管理这个deriver，java命令启动的进程将作为一个deriver

4）Mesos 模式：未看

5）YARN 模式：未看

Spark组成

spark由deriver,worker,excutor,master组成。deriver用于register application,schedual job,collector block manager info， worker用于start excutor 和deriver，excutor 用于run task，master用于维护application和worker的状态并且restart deriver 和application。

下面是deriver启动到runJob的过程

查看图片附件

分享到：

Spark源码分析2-Driver generate jobs and ... | Dubbo源代碼分析-configuration

2014-05-06 10:26
浏览 3602
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Spark源码分析1-部署与整体架构

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Spark源码分析1-部署与整体架构

评论

发表评论

相关推荐

concurrent- LinkedBlockingQueue

flume源码分析-Sink

flume源码分析-SinkProcessor

flume源码分析-ChannelSelector

Spark源码分析13-Tuning Spark

Spark源码分析12-yarn部署

Spark源码分析11-BlockManager

Spark源码分析10-Schedualer

Spark源码分析9-Excutor

Spark源码分析8-client 如何选择将task提交给那个excutor

Spark源码分析7-Metrics的分析

Spark源码分析6-Worker

Spark源码分析5-Master

Spark源码分析4-RDD computor

Spark源码分析3-The connect between driver,master and excutor

Spark源码分析2-Driver generate jobs and launch task

Dubbo源代碼分析-configuration

最近访客更多访客>>