Spark学习-3 运行一个example - Fisher小屋 - ITeye博客

`

Djava.sohu.com

浏览: 65080 次
性别:
来自: 上海

最近访客更多访客>>

tyzqqq

erocx

scaler

zcpwillam

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

一说书先生：快学Spark 2.0(新特性、含真实项目、纯Scala语言开 ...
Spark学习-关于Spark的开发语言Scala
llhdf：现在我们发布了 windows 64 位系统下sparkid ...
Spark的学习2-IDE
nuan268：你好，不知能否给一份代码参考下呢，邮箱nuan268@foxm ...
我的Js日志组件 logger for js (log4js)- (2009-10-30)
hbbbs： Djava.sohu.com 写道回9 楼 hbbbs:比co ...
我的Js日志组件 logger for js (log4js)- (2009-10-30)
Djava.sohu.com：回9 楼 hbbbs:比console.log方便的地方包括： ...
我的Js日志组件 logger for js (log4js)- (2009-10-30)

Spark学习-3 运行一个example

博客分类：

BigData
Spark
学习

Spark BigData winutils.exe

阅读更多

开始学习Spark了，先看看Spark能做点什么吧。

最好的方式就是先运行个例子程序。先从Spark网站下载一个运行环境(我的运行环境是Win7, 64bits) 。

我们在官方网站: http://spark.apache.org/downloads.html下载一个版本：
我选 Spark 1.0 + Prebuild for Hadoop 2.3, Link为
http://d3kbcqa49mib13.cloudfront.net/spark-1.1.0-bin-hadoop2.3.tgz

下载解压后，进入到bin目录,运行 run-example.cmd SparkPi 10, 你就可以看到运行的结果了。

你可能会遇到以下这个问题:
===> 说null/bin/winutils.exe找不到，这是因为Spark引用Hadoop的包，而Hadoop需要检查这个文件。所以解决这个最简单方式是设置 HADOOP_HOME指向你Spark的根目录,然后把winutils.exe拷到bin目录。如果没有winutils.exe,你可以到网上搜下。
a. 你可以 SET HADOOP_HOME=D:\Java\spark\spark-1.1.0-bin-hadoop2.3 (需要将这个路径改成你的实际路径.
然后再运行命令就可以了。
b. 或者修改bin/*.cmd文件，把下面这句加进去就可以了
SET HADOOP_HOME=%~dp0..
这句就是说设置HADOOP_HOME的路径为 bin的父目录。

分享到：

Spark学习-关于云平台的一个问题 | Spark的学习2-IDE

2014-10-15 11:10
浏览 10803
评论(0)
分类:开源软件
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

learning-spark-examples-master: Spark作为一个快速、通用且可扩展的大数据处理框架，以其高效、易用的特性在大数据领域广受青睐。本项目以Scala语言为基础，结合Spark API，提供了丰富的实践案例，以帮助开发者熟练掌握Spark的各种操作。一、...

spark相关jar包: Spark是Apache软件基金会下的一个开源大数据处理框架，以其高效、灵活和可扩展的特性而闻名。Spark的核心设计是基于内存计算，它极大地提高了数据处理的速度，使得数据科学家和开发人员能够在处理大规模数据集时获得...

spark example 2.2.0版本 maven项目: Spark是Apache Hadoop生态系统中的一个分布式计算框架，它专为大规模数据处理而设计，提供了高效、灵活和易于使用的数据处理工具。在这个“spark example 2.2.0版本 maven项目”中，我们可以深入理解Spark的基本用法...

terraform-emr-spark-example：一个示例Terraform项目，它将在Amazon EMR上配置安全和可自定义的Spark集群: 在这个名为"terraform-emr-spark-example"的项目中，我们将深入探讨如何使用Terraform在Amazon Elastic MapReduce (EMR) 上创建、配置和管理安全且可定制的Apache Spark集群。 **1. Terraform核心概念** Terraform...

spark_examples:Spark程序的示例测试程序: 总的来说，Spark程序的示例测试程序为开发者提供了一个实践平台，通过Java API深入学习Spark的各个方面，包括数据处理、分布式计算和性能调优。通过不断地试验和调试，开发者可以更好地掌握Spark这一强大工具，提升...

dbscan-on-spark-example: 在"**dbscan-on-spark-example-master**"压缩包中，可能包含了以下内容： - 项目源码：包含Scala文件，实现了DBSCAN算法与Spark的集成。 - 测试数据：可能提供了一小部分测试数据用于验证算法的正确性。 - README.md...

data-mining-algorithms-cpp-master_example_appendix_bigdata_: 在这个"**data-mining-algorithms-cpp-master_example_appendix_bigdata_**"项目中，我们可以看到一个用C++实现的数据挖掘算法的示例代码库，特别关注于大数据处理。这个项目的描述表明代码来源于GitHub，意味着这是...

Spark-Streaming编程指南.docx: Spark Streaming 是 Apache Spark 的一个模块，专门用于实时数据流处理。它是 Spark 核心 API 的扩展，设计上遵循了 Spark 的简洁、易用和高性能的特点。Spark Streaming 支持高吞吐量和容错能力，使得它能够在...

spark2.0-examples:Spark 2.0的示例: Spark 2.0是Apache Spark的一个重要里程碑，它...总的来说，"spark2.0-examples"项目为开发者提供了一个深入学习Spark 2.0的实践平台，通过这些实例，你可以掌握Spark的核心特性，并将其应用于实际的大数据处理任务中。

clojure-sparkml-example:Clojure SparkML对MNIST数据进行随机森林: SparkML是Apache Spark的一个模块，提供了一套用于构建和评估机器学习管道的API，支持多种机器学习算法，包括随机森林。随机森林是一种集成学习方法，它通过构建并组合多个决策树来提高预测的准确性和稳定性。在...

实验7-Spark基本操作.docx: - **Scala 示例**：Spark 提供了一个计算 PI 的 Scala 示例程序，可以通过运行 `./bin/run-example SparkPi 10` 来迭代 10 次计算 PI 的近似值。 - **Python 示例**：同样，Spark 也提供了 Python 版本的 PI 计算...

shell-spark-example:创建示例 spark 命令的应用程序，这些命令在 spark 集群上的节点之一的 shell 上运行。教育的: 创建此应用程序是为了学习 spark 和使用 github/开源项目使用 Spark API 编写 Spark 应用程序并在集群上执行在外壳上执行其他语言开发的 Spark 程序，如 PySpark 在命令行上执行 SparkQL 查询

spark2_8_3安装版exe.zip: Spark 2.8.3是大数据处理领域中的一个重要版本，它是Apache Spark项目的一部分，提供了高效、易用且可扩展的数据处理能力。Spark以其强大的内存计算和流处理功能，被广泛应用于数据挖掘、机器学习和实时分析等多个...

Spark-Scala-Maven-示例：Spark，Scala项目的示例Maven配置: 本示例项目“Spark-Scala-Maven-Example”旨在展示如何配置Maven来构建和运行一个结合了Spark与Scala的应用程序。首先，我们需要了解Spark。Spark是由Apache开发的大数据处理框架，它提供了快速、通用和可扩展的...

huaweicloud-mrs-example-mrs-2.0.zip: 通过"huaweicloud-mrs-example-mrs-2.0.zip"中的示例代码，开发者可以学习如何在华为云MRS平台上配置和运行这些组件的作业，以及如何利用它们处理和分析海量数据。这些示例将涵盖各种场景，从简单的数据读写到复杂的...

jpmml全部Jar包和source包: JPMML（Java Predictive Model Markup Language）是一个开源项目，用于将各种机器学习模型转换为PMML（Predictive Model Markup Language）格式。PMML是一种标准化的XML语言，用于描述统计和数据挖掘模型，使得模型...

Spark入门教程: - **Application**: 用户基于Spark构建的应用程序，包含一个驱动程序(Driver program)和运行在集群上的多个Executor。 - **Application Jar**: 包含用户Spark应用的JAR文件。有时需要创建一个“uber-jar”文件，包含...

Spark环境搭建和使用方法: 3. **Hadoop环境**：Spark可以独立运行，但为了充分利用其分布式计算能力，建议同时安装Hadoop。如果尚未安装Hadoop，可以参照[厦门大学数据库实验室](http://dblab.xmu.edu.cn/blog/install-hadoop/)提供的安装教程...

spark快速数据处理第二章: 在本节中，我们将学习如何通过Spark Shell加载一个简单的文本文件。这是开始进行任何数据处理任务的第一步，也是理解Spark如何与数据交互的基础。 **详细解释：** 1. **Spark Shell简介**: - Spark Shell是一个...

Hadoop 和 Spark 的安装、环境配置、使用教程以及一个分布式机器学习项目示例.docx: 假设有一个大规模的数据集，希望通过分布式的方式训练一个机器学习模型。可以使用Spark MLlib库来实现这一目标。下面是一个简单的线性回归模型训练的例子。 **4.1 准备数据集** 假设已经准备好了CSV格式的数据集，...

Global site tag (gtag.js) - Google Analytics