`
luckytwo
  • 浏览: 21493 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
文章分类
社区版块
存档分类
最新评论

hadoop运行自带的WordCount例子。

 
阅读更多

 使用hadoop用户登录

 

1、编译WordCount.java文件

cd /opt/hadoop/hadoop-1.2.1/src/examples/org/apache/hadoop/examples 进入该目录

执行下面的命令

javac -classpath /opt/hadoop/hadoop-1.2.1/hadoop-core-1.2.1.jar://opt/hadoop/hadoop-1.2.1/lib/commons-cli-1.2.jar -d /opt/hadoop/hadoop-1.2.1/src/examples WordCount.java

 

-d /opt/hadoop/hadoop-1.2.1/src/examples 是为了保留包路径信息,否则后面会出现:java.lang.ClassNotFoundException: org.apache.hadoop.examples.WordCount异常

 

2、打jar包

cd /opt/hadoop/hadoop-1.2.1/src/examples

 

jar cvf WordCount.jar ./org/apache/hadoop/examples/*.class

这样会把org.apache.hadoop.examples包结构打入

 

3、创建输入文件与input文件夹

随便建立file01、file02两个文件,随便输入文字

  1. $ bin/hadoop fs -mkdir /tmp/input  
  2. $ bin/hadoop fs -put file01 /tmp/input/
  3. $ bin/hadoop fs -put file02 /tmp/input/ 

 

4、运行WordCount程序

./hadoop jar WordCount.jar org.apache.hadoop.examples.WordCount /tmp/input /tmp/output

 

org.apache.hadoop.examples.WordCount 要写全路径,否则报类找不到

 

5、查看结果

  1. $ bin/hadoop fs -cat /tmp/output/part-00000  

 

 

 

 

分享到:
评论

相关推荐

    ubuntu运行hadoop的wordcount

    - 上述命令中,`hadoop-0.20.2-examples.jar`是Hadoop自带的例子程序集合,包含了WordCount等示例程序。 - `wordcount`表示执行WordCount任务。 - `input`和`output`分别代表输入文件夹和输出文件夹路径。 #### ...

    Hadoop的配置及运行WordCount.docx

    - 下载和编译WordCount示例,Hadoop的源码包中包含了这个例子。在Hadoop的src目录下,使用Maven或Ant构建项目,生成可执行的jar文件。 - 创建一个文本文件,输入一些单词,作为WordCount的输入数据。将文件上传到...

    hadoop文档, hdfs mapreduce,环境搭建,例子介绍等

    - **监控与管理**:使用Hadoop自带的Web界面监控集群状态。 #### 四、示例应用 为了更好地理解Hadoop的实际应用,我们可以通过一个经典的WordCount示例来演示MapReduce的工作流程。 1. **Map阶段**:读取输入文件,...

    Hadoop大数据平台构建、测试Job教学课件.pptx

    在这里,我们将运行Hadoop自带的WordCount示例,这是一个计算文件中单词出现次数的经典应用。使用`yarn jar /opt/hadoop-2.8.5/share/hadoop/mapreduce/hadoop-mapreduce-example-2.8.5.jar wordcount /input/wc....

    Linux下Hadoop伪分布式配置及操作命令

    可以通过执行Hadoop自带的启动脚本来完成这一过程。一般情况下,启动命令会先启动NameNode,然后启动DataNode。 6. Hadoop使用: Hadoop的使用包括运行测试例子(例如WordCount)、编写并运行Hadoop应用程序以及...

    windows7-64bit-hadoop本地库lib和bin

    搭建完成后,可以通过运行Hadoop自带的示例程序,如WordCount,来检查环境是否配置正确。这个例子会统计文本文件中的单词出现次数,展示了MapReduce的基本工作原理。 总之,“windows7-64bit-hadoop本地库lib和bin...

    hadoop2.7.1tar包.zip

    在安装完成后,你可以通过运行Hadoop自带的一些例子来验证安装是否成功,例如WordCount程序,它统计文本文件中每个单词出现的次数。这将涉及到创建HDFS上的输入目录,提交MapReduce作业,以及查看输出结果。 总之,...

    Spark:用Scala和Java实现WordCount

    其中Java实现的JavaWordCount是spark自带的例子($SPARK_HOME/examples/src/main/java/org/apache/spark/examples/JavaWordCount.java)OS:RedHatEnterpriseLinuxServerrelease6.4(Santiago)Hadoop:Hadoop2.4.1JDK:1...

    第3章hadoop伪分布式环境的搭建.docx

    6. **运行示例程序**:在伪分布式环境中,可以尝试运行Hadoop自带的示例程序,如WordCount,以确保环境配置正确。 通过以上步骤,你就可以在单台机器上成功搭建Hadoop的伪分布式环境,这对于理解和实践Hadoop的基本...

    大数据平台技术—实验3(2023-2024-1) (2).doc

    * Hadoop 自带例子:Hadoop 提供了一些自带例子,例如 pi 计算圆周率 三、Wordcount 计算实验 * 掌握 MapReduce 的 Wordcount 计算方法 * 了解如何使用 MapReduce 相应计算程序,完成 wordcount 计算 * 了解如何...

    云服务器上搭建大数据伪分布式环境

    ###### 6.1 查看Hadoop自带的例子 ```bash hadoop jar /usr/local/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.5.jar ``` 可以看到Hadoop提供的一些示例程序。 ###### 6.2 在HDFS中创建用户目录...

    大数据平台技术—实验3(2023-2024-1).doc

    2. 使用Hadoop自带例子pi计算圆周率 实验结果证明了圆周率计算的正确性。 ### 第3题 基于MapReduce的Wordcount计算实验 该实验的目的是掌握MapReduce的Wordcount计算方法。实验步骤如下: 1. 使用MapReduce的...

    hue工作流使用说明

    - 将Oozie自带的例子和ShareLib部署到HDFS的home目录。 3. 工作流操作: - 通过命令行和图形化界面操作Oozie工作流。 - 工作流定义了Hadoop作业的执行顺序,一旦启动,就会按既定顺序执行,直到完成。 - 需要...

    Spark简单测试案例

    #### 二、Spark 自带的例子 在安装 Spark 后,可以直接使用其内置的一些示例程序来快速了解 Spark 的基本用法。 ##### 2.1 启动示例程序 可以通过 `spark-submit` 命令来提交 Spark 内置的示例程序。例如,启动 `...

    spark 分布式集群搭建

    Spark Standalone 是 Apache Spark 提供的一种自带的集群管理模式,主要用于管理 Spark 应用程序的执行环境。这种模式简单易用,适合于开发测试以及中小型生产环境。 #### Spark Standalone 部署配置 ##### ...

Global site tag (gtag.js) - Google Analytics