`

spark-学习笔记--5 wordcount scala版

 
阅读更多

spark-学习笔记--5   wordcount scala版

 

import org.apache.spark.SparkConf
import org.apache.spark.SparkContext

object  WordCount {
  
  
  def main(args :Array[String]){
    
    
    val conf = new SparkConf().setAppName("wordcount");
    val sc = new SparkContext(conf);
    val lines =  sc.textFile("hdfs://master:9000/666666666.txt", 1);
    val words = lines.flatMap(line => line.split(" "))
    val pairs = words.map(word => (word,1));
    val wordCounts =  pairs.reduceByKey { _ + _}
    
    wordCounts.foreach(wordCount => println(wordCount._1+"---"+wordCount._2))
    
  
  }
  
  
}

 

分享到:
评论

相关推荐

    spark-1.6.0-bin-hadoop2.4.tgz

    4. **MLlib**:Spark的机器学习库,包含了各种常见的机器学习算法,如分类、回归、聚类、协同过滤等,以及模型选择和评估工具。 5. **GraphX**:用于图计算,提供了一种表示和操作图形数据的API,支持图形分析和并行...

    spark下实现wordcount

    ### Spark 下实现 WordCount #### 一、简介 在大数据处理领域,Apache Spark 是一个非常流行的框架,它能够高效地处理大规模数据集。WordCount 是一个经典的示例程序,用于统计文本文件中每个单词出现的次数。本篇...

    spark-1.3.1-bin-hadoop2.6.tgz

    Spark自带了一些样例程序,例如WordCount,可以通过`bin/spark-submit`命令提交作业到集群运行。 6. **开发和交互** - **Scala**:Spark的原生编程语言,可以编写Spark应用。 - **PySpark**:Python接口,提供与...

    hadoop scala spark 例子项目,运行了单机wordcount

    【标题】中的“hadoop scala spark 例子项目,运行了单机wordcount”指的是一个使用Hadoop、Scala和Spark框架实现的简单WordCount程序。在大数据处理领域,WordCount是入门级的经典示例,用于统计文本文件中单词出现...

    Springboot 结合Apache Spark 2.4.4与Scala 2.12 集成示例

    在本集成示例中,我们将探讨如何将Spring Boot与Apache Spark 2.4.4以及Scala 2.12版本相结合,实现一个简单的"Hello World"应用。Spring Boot以其便捷的微服务开发能力,而Apache Spark是大数据处理领域中的一员...

    flink-1.16.2下载安装包,flink-1.16.2-bin-scala-2.12.zip

    Flink 1.16.2是该软件的一个稳定版本,针对Scala 2.12构建,这意味着它可以充分利用Scala语言的强大功能,包括其面向函数和面向对象的特性,以及丰富的库支持。 1. **Flink架构** - **分布式流处理引擎**:Flink的...

    大数据Spark入门到精通v3.0版

    009 - Spark框架 - 快速上手 - WordCount - Spark的实现.avi 010 - Spark框架 - 快速上手 - WordCount - 日志和错误.avi 011 - Spark框架 - 运行环境 - 本地环境 - 基本配置和操作.avi 012 - Spark框架 - 运行环境 -...

    flink-1.11.2-bin-scala_2.12 linux安装包

    了解并掌握这些基础知识后,你可以进一步探索Flink的高级特性,如流处理的实时性、状态管理的复杂性、以及如何与其他大数据组件(如Hadoop、Spark)集成,从而在实际项目中充分利用Flink的强大功能。

    flink-1.9.0-bin-scala_2.12.tgz安装包

    - Linux:`./start-job.sh --class org.apache.flink.examples.java.wordcount.WordCount --run --jobmanager localhost:8081 --input hdfs://localhost:9000/path/to/input.txt --output hdfs://localhost:9000/...

    使用Scala设计WordCount程序

    使用Scala设计WordCount程序 软件环境: hadoop-2.6.5.tar.gz spark-1.6.2-bin-hadoop2.6.tgz scala-2.10.4.gz scala-SDK-4.0.0-vfinal-2. 11-linux.gtk.x86_64.tar.gz

    第四章Spark的集成开发环境使用到的组件包和jar包.zip

    本压缩包包含:spark-assembly-1.4.0-hadoop2.6.0.jar、jcommon-1.0.16.jar、jfreechart-1.0.3.jar、joda-time-2.2.jar, 基于课程《第四章Spark&Scala的集成开发环境.docx》

    WordCount_Spark!_spark_wordcount_java_

    总结,Spark上的WordCount程序是理解和学习Spark基础操作的好起点。通过这个简单的例子,我们可以深入理解Spark的工作原理,以及如何在Java环境中编写并执行Spark任务。在实际应用中,这些基本操作可以扩展到更复杂...

    Spark 最简单WordCount

    **Spark 最简单WordCount** Spark是一款高性能的分布式计算框架,主要设计用于大数据处理。它提供了弹性分布式数据集(RDD)的概念,这是一种可分区、容错且可以并行操作的数据结构。在Spark中,我们可以通过Scala...

    Spark-通过 API实现WordCount案例的数据集和jar包

    下载资料后,免费获取数据集和jar包

    spark框架中wordcount的scala实现

    scala语言和python一样都是交互式的语言,操作简单。这是wordcount的scala实现,简单明了,比java实现简单很多,希望对大家有所帮助

    spark-scala-tutorial:Apache Spark的免费教程

    本教程“spark-scala-tutorial-master”将涵盖这些基础以及更多进阶主题,例如 Spark SQL、Spark Streaming、MLlib(机器学习库)和 GraphX。通过实践,你将掌握如何在 Scala 中有效地使用 Spark 进行大数据处理,为...

    Spark:用Scala和Java实现WordCount

    用Scala和Java实现WordCount,其中Java实现的JavaWordCount是spark自带的例子($SPARK_HOME/examples/src/main/java/org/apache/spark/examples/JavaWordCount.java)OS:RedHatEnterpriseLinuxServerrelease6.4...

    Spark简单测试案例

    ### Spark简单测试案例 #### 一、测试环境 在本案例中,我们将使用特定的环境配置来进行测试。...通过学习这个案例,可以帮助读者更好地理解 Spark 的基本操作以及如何在实际场景中应用 Spark 进行大规模数据处理。

    flink 安装包 1.15.2(flink-1.15.2-bin-scala_2.12 .tgz)

    5. **运行示例**:Flink 包含了一些示例程序,例如 WordCount,用于演示基本的流处理。你可以通过 `./bin/flink run examples/streaming/WordCount.jar` 命令运行它。 6. **停止 Flink**:当不再使用时,使用 `./...

    spark-examples

    火花示例 建造 制作罐子: mvn package ...从 CDH5 集群中的网关节点运行 JavaWordCount: spark-submit --class com.javachen.spark.wordcount.JavaWordCount --master local \ spark-examples-0.

Global site tag (gtag.js) - Google Analytics