大数据系列10：Spark – 内存计算 - 杨尚川的博客

yangshangchuan

浏览: 2483450 次
性别:
来自: 北京

最近访客更多访客>>

wangyy

akingde

feilafei123

wf_chn

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

大数据系列10：Spark – 内存计算

博客分类：

大数据

Apache Spark Spark SQL Spark Streaming MLlib GraphX

tar -zxvf spark-0.8.0-incubating-bin-hadoop1.tgz

mv spark-0.8.0-incubating-bin-hadoop1 spark-0.8.0

wget http://www.scala-lang.org/files/archive/scala-2.9.3.tgz

tar -zxvf scala-2.9.3.tgz

sudo vi /etc/profile

增加:

export SCALA_HOME=/home/ysc/scala-2.9.3

export PATH=$PATH:$SCALA_HOME/bin

source /etc/profile

cd spark-0.8.0（spark命令和hadoop命令重名，不加入path）

cp conf/spark-env.sh.template conf/spark-env.sh

vi conf/slaves

修改localhost为host001

vi conf/spark-env.sh

增加:

JAVA_HOME=/home/ysc/jdk1.7.0_40

SCALA_HOME=/home/ysc/scala-2.9.3

SPARK_WORKER_INSTANCES=2

启动服务：

bin/start-all.sh

WEB界面：

Spark Master ：http://host001:8080/

Spark Worker ：http://host001:8081/

运行例子：

集群运算：

./run-example org.apache.spark.examples.JavaSparkPi spark://host001:7077

./run-example org.apache.spark.examples.JavaWordCount spark://host001:7077 README.md

本地运算：

./run-example org.apache.spark.examples.JavaSparkPi local[4] （4代表线程数目）

./run-example org.apache.spark.examples.JavaWordCount local[4]README.md

停止服务：

bin/stop-all.sh

Spark相关框架研究交流群，如：Apache Spark、Spark SQL、Spark Streaming、MLlib、GraphX等，有兴趣的请加Q群：182304757

APDPlat旗下十大开源项目

1
顶

3
踩

分享到：

大数据系列11：Gora – 大数据持久化 | 大数据系列5：Pig – 大数据分析平台

2013-10-04 05:11
浏览 6425
评论(0)
分类:互联网
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

大数据系列10：Spark – 内存计算

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

大数据系列10：Spark – 内存计算

评论

发表评论

相关推荐

数据生成器

分布式内存文件系统：Tachyon

大数据系列12：Hadoop2 – 全新的Hadoop

大数据系列6：HBase – 基于Hadoop的分布式数据库

大数据系列1：在win7上安装配置Hadoop伪分布式集群

大数据系列11：Gora – 大数据持久化

大数据系列5：Pig – 大数据分析平台

大数据系列4：Hive – 基于HADOOP的数据仓库

大数据系列9：Mahout – 机器学习

大数据系列8：Sqoop – HADOOP和RDBMS数据交换

大数据系列7：Storm – 流计算

大数据系列2：建立开发环境编写HDFS和Map Reduce程序

大数据系列3：用Python编写MapReduce

最近访客更多访客>>