spark-学习笔记--5 wordcount scala版 - 杨中磊的博客 - ITeye博客

`

05rjyzl11

浏览: 147069 次
性别:
来自: 北京

最近访客更多访客>>

breezylee

laopo521anping

wolfwell

gzjhqh

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

isaiah282485068：怎么不出书出来啊，市场上好却这方面的书啊
mule in action翻译1 : 第一部分 mule 核心

spark-学习笔记--5 wordcount scala版

博客分类：

spark

阅读更多

spark-学习笔记--5 wordcount scala版

import org.apache.spark.SparkConf
import org.apache.spark.SparkContext

object  WordCount {
  
  
  def main(args :Array[String]){
    
    
    val conf = new SparkConf().setAppName("wordcount");
    val sc = new SparkContext(conf);
    val lines =  sc.textFile("hdfs://master:9000/666666666.txt", 1);
    val words = lines.flatMap(line => line.split(" "))
    val pairs = words.map(word => (word,1));
    val wordCounts =  pairs.reduceByKey { _ + _}
    
    wordCounts.foreach(wordCount => println(wordCount._1+"---"+wordCount._2))
    
  
  }
  
  
}

分享到：

spark-学习笔记--6 创建RDD | spark-学习笔记--4 hadoop-2.4.1集群安装

2018-10-25 10:13
浏览 506
评论(0)
分类:编程语言
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

spark-1.6.0-bin-hadoop2.4.tgz: 4. **MLlib**：Spark的机器学习库，包含了各种常见的机器学习算法，如分类、回归、聚类、协同过滤等，以及模型选择和评估工具。 5. **GraphX**：用于图计算，提供了一种表示和操作图形数据的API，支持图形分析和并行...

spark下实现wordcount: ### Spark 下实现 WordCount #### 一、简介在大数据处理领域，Apache Spark 是一个非常流行的框架，它能够高效地处理大规模数据集。WordCount 是一个经典的示例程序，用于统计文本文件中每个单词出现的次数。本篇...

spark-1.3.1-bin-hadoop2.6.tgz: Spark自带了一些样例程序，例如WordCount，可以通过`bin/spark-submit`命令提交作业到集群运行。 6. **开发和交互** - **Scala**：Spark的原生编程语言，可以编写Spark应用。 - **PySpark**：Python接口，提供与...

hadoop scala spark 例子项目，运行了单机wordcount: 【标题】中的“hadoop scala spark 例子项目，运行了单机wordcount”指的是一个使用Hadoop、Scala和Spark框架实现的简单WordCount程序。在大数据处理领域，WordCount是入门级的经典示例，用于统计文本文件中单词出现...

Springboot 结合Apache Spark 2.4.4与Scala 2.12 集成示例: 在本集成示例中，我们将探讨如何将Spring Boot与Apache Spark 2.4.4以及Scala 2.12版本相结合，实现一个简单的"Hello World"应用。Spring Boot以其便捷的微服务开发能力，而Apache Spark是大数据处理领域中的一员...

flink-1.16.2下载安装包，flink-1.16.2-bin-scala-2.12.zip: Flink 1.16.2是该软件的一个稳定版本，针对Scala 2.12构建，这意味着它可以充分利用Scala语言的强大功能，包括其面向函数和面向对象的特性，以及丰富的库支持。 1. **Flink架构** - **分布式流处理引擎**：Flink的...

大数据Spark入门到精通v3.0版: 009 - Spark框架 - 快速上手 - WordCount - Spark的实现.avi 010 - Spark框架 - 快速上手 - WordCount - 日志和错误.avi 011 - Spark框架 - 运行环境 - 本地环境 - 基本配置和操作.avi 012 - Spark框架 - 运行环境 -...

flink-1.11.2-bin-scala_2.12 linux安装包: 了解并掌握这些基础知识后，你可以进一步探索Flink的高级特性，如流处理的实时性、状态管理的复杂性、以及如何与其他大数据组件（如Hadoop、Spark）集成，从而在实际项目中充分利用Flink的强大功能。

flink-1.9.0-bin-scala_2.12.tgz安装包: - Linux：`./start-job.sh --class org.apache.flink.examples.java.wordcount.WordCount --run --jobmanager localhost:8081 --input hdfs://localhost:9000/path/to/input.txt --output hdfs://localhost:9000/...

使用Scala设计WordCount程序: 使用Scala设计WordCount程序软件环境: hadoop-2.6.5.tar.gz spark-1.6.2-bin-hadoop2.6.tgz scala-2.10.4.gz scala-SDK-4.0.0-vfinal-2. 11-linux.gtk.x86_64.tar.gz

第四章Spark的集成开发环境使用到的组件包和jar包.zip: 本压缩包包含：spark-assembly-1.4.0-hadoop2.6.0.jar、jcommon-1.0.16.jar、jfreechart-1.0.3.jar、joda-time-2.2.jar，基于课程《第四章Spark&Scala的集成开发环境.docx》

WordCount_Spark!_spark_wordcount_java_: 总结，Spark上的WordCount程序是理解和学习Spark基础操作的好起点。通过这个简单的例子，我们可以深入理解Spark的工作原理，以及如何在Java环境中编写并执行Spark任务。在实际应用中，这些基本操作可以扩展到更复杂...

Spark 最简单WordCount: **Spark 最简单WordCount** Spark是一款高性能的分布式计算框架，主要设计用于大数据处理。它提供了弹性分布式数据集（RDD）的概念，这是一种可分区、容错且可以并行操作的数据结构。在Spark中，我们可以通过Scala...

Spark-通过 API实现WordCount案例的数据集和jar包: 下载资料后，免费获取数据集和jar包

spark框架中wordcount的scala实现: scala语言和python一样都是交互式的语言，操作简单。这是wordcount的scala实现，简单明了，比java实现简单很多，希望对大家有所帮助

spark-scala-tutorial：Apache Spark的免费教程: 本教程“spark-scala-tutorial-master”将涵盖这些基础以及更多进阶主题，例如 Spark SQL、Spark Streaming、MLlib（机器学习库）和 GraphX。通过实践，你将掌握如何在 Scala 中有效地使用 Spark 进行大数据处理，为...

Spark：用Scala和Java实现WordCount: 用Scala和Java实现WordCount，其中Java实现的JavaWordCount是spark自带的例子（$SPARK_HOME/examples/src/main/java/org/apache/spark/examples/JavaWordCount.java）OS:RedHatEnterpriseLinuxServerrelease6.4...

Spark简单测试案例: ### Spark简单测试案例 #### 一、测试环境在本案例中，我们将使用特定的环境配置来进行测试。...通过学习这个案例，可以帮助读者更好地理解 Spark 的基本操作以及如何在实际场景中应用 Spark 进行大规模数据处理。

flink 安装包 1.15.2(flink-1.15.2-bin-scala_2.12 .tgz): 5. **运行示例**：Flink 包含了一些示例程序，例如 WordCount，用于演示基本的流处理。你可以通过 `./bin/flink run examples/streaming/WordCount.jar` 命令运行它。 6. **停止 Flink**：当不再使用时，使用 `./...

spark-examples: 火花示例建造制作罐子： mvn package ...从 CDH5 集群中的网关节点运行 JavaWordCount： spark-submit --class com.javachen.spark.wordcount.JavaWordCount --master local \ spark-examples-0.

Global site tag (gtag.js) - Google Analytics