hadoop运行自带的WordCount例子。 - 折花哥 - ITeye博客

`

luckytwo

浏览: 21810 次
性别:
来自: 深圳

最近访客更多访客>>

why981229

lslab

雅然风懿

Gky_AiYY

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

全部博客 (9)

社区版块

存档分类

最新评论

hadoop运行自带的WordCount例子。

阅读更多

使用hadoop用户登录

1、编译WordCount.java文件

cd /opt/hadoop/hadoop-1.2.1/src/examples/org/apache/hadoop/examples 进入该目录

执行下面的命令

javac -classpath /opt/hadoop/hadoop-1.2.1/hadoop-core-1.2.1.jar://opt/hadoop/hadoop-1.2.1/lib/commons-cli-1.2.jar -d /opt/hadoop/hadoop-1.2.1/src/examples WordCount.java

-d /opt/hadoop/hadoop-1.2.1/src/examples 是为了保留包路径信息，否则后面会出现：java.lang.ClassNotFoundException: org.apache.hadoop.examples.WordCount异常

2、打jar包

cd /opt/hadoop/hadoop-1.2.1/src/examples

jar cvf WordCount.jar ./org/apache/hadoop/examples/*.class

这样会把org.apache.hadoop.examples包结构打入

3、创建输入文件与input文件夹

随便建立file01、file02两个文件，随便输入文字

$ bin/hadoop fs -mkdir /tmp/input
$ bin/hadoop fs -put file01 /tmp/input/
$ bin/hadoop fs -put file02 /tmp/input/

4、运行WordCount程序

./hadoop jar WordCount.jar org.apache.hadoop.examples.WordCount /tmp/input /tmp/output

org.apache.hadoop.examples.WordCount 要写全路径，否则报类找不到

5、查看结果

$ bin/hadoop fs -cat /tmp/output/part-00000

分享到：

Hadoop eclipse开发环境配置 | ssh localhost 免密码登陆

2013-09-01 02:17
浏览 2791
评论(0)
分类:开源软件
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

ubuntu运行hadoop的wordcount: - 上述命令中，`hadoop-0.20.2-examples.jar`是Hadoop自带的例子程序集合，包含了WordCount等示例程序。 - `wordcount`表示执行WordCount任务。 - `input`和`output`分别代表输入文件夹和输出文件夹路径。 #### ...

Hadoop的配置及运行WordCount.docx: - 下载和编译WordCount示例，Hadoop的源码包中包含了这个例子。在Hadoop的src目录下，使用Maven或Ant构建项目，生成可执行的jar文件。 - 创建一个文本文件，输入一些单词，作为WordCount的输入数据。将文件上传到...

hadoop文档, hdfs mapreduce,环境搭建，例子介绍等: - **监控与管理**：使用Hadoop自带的Web界面监控集群状态。 #### 四、示例应用为了更好地理解Hadoop的实际应用，我们可以通过一个经典的WordCount示例来演示MapReduce的工作流程。 1. **Map阶段**：读取输入文件，...

hadoop2.7.1tar包.zip: 在安装完成后，你可以通过运行Hadoop自带的一些例子来验证安装是否成功，例如WordCount程序，它统计文本文件中每个单词出现的次数。这将涉及到创建HDFS上的输入目录，提交MapReduce作业，以及查看输出结果。总之，...

Hadoop大数据平台构建、测试Job教学课件.pptx: 在这里，我们将运行Hadoop自带的WordCount示例，这是一个计算文件中单词出现次数的经典应用。使用`yarn jar /opt/hadoop-2.8.5/share/hadoop/mapreduce/hadoop-mapreduce-example-2.8.5.jar wordcount /input/wc....

Linux下Hadoop伪分布式配置及操作命令: 可以通过执行Hadoop自带的启动脚本来完成这一过程。一般情况下，启动命令会先启动NameNode，然后启动DataNode。 6. Hadoop使用： Hadoop的使用包括运行测试例子（例如WordCount）、编写并运行Hadoop应用程序以及...

windows7-64bit-hadoop本地库lib和bin: 搭建完成后，可以通过运行Hadoop自带的示例程序，如WordCount，来检查环境是否配置正确。这个例子会统计文本文件中的单词出现次数，展示了MapReduce的基本工作原理。总之，“windows7-64bit-hadoop本地库lib和bin...

Spark：用Scala和Java实现WordCount: 其中Java实现的JavaWordCount是spark自带的例子（$SPARK_HOME/examples/src/main/java/org/apache/spark/examples/JavaWordCount.java）OS:RedHatEnterpriseLinuxServerrelease6.4(Santiago)Hadoop:Hadoop2.4.1JDK:1...

第3章hadoop伪分布式环境的搭建.docx: 6. **运行示例程序**：在伪分布式环境中，可以尝试运行Hadoop自带的示例程序，如WordCount，以确保环境配置正确。通过以上步骤，你就可以在单台机器上成功搭建Hadoop的伪分布式环境，这对于理解和实践Hadoop的基本...

大数据平台技术—实验3(2023-2024-1) (2).doc: * Hadoop 自带例子：Hadoop 提供了一些自带例子，例如 pi 计算圆周率三、Wordcount 计算实验 * 掌握 MapReduce 的 Wordcount 计算方法 * 了解如何使用 MapReduce 相应计算程序，完成 wordcount 计算 * 了解如何...

云服务器上搭建大数据伪分布式环境: ###### 6.1 查看Hadoop自带的例子 ```bash hadoop jar /usr/local/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.5.jar ``` 可以看到Hadoop提供的一些示例程序。 ###### 6.2 在HDFS中创建用户目录...

大数据平台技术—实验3(2023-2024-1).doc: 2. 使用Hadoop自带例子pi计算圆周率实验结果证明了圆周率计算的正确性。 ### 第3题基于MapReduce的Wordcount计算实验该实验的目的是掌握MapReduce的Wordcount计算方法。实验步骤如下： 1. 使用MapReduce的...

Spark简单测试案例: #### 二、Spark 自带的例子在安装 Spark 后，可以直接使用其内置的一些示例程序来快速了解 Spark 的基本用法。 ##### 2.1 启动示例程序可以通过 `spark-submit` 命令来提交 Spark 内置的示例程序。例如，启动 `...

hue工作流使用说明: - 将Oozie自带的例子和ShareLib部署到HDFS的home目录。 3. 工作流操作： - 通过命令行和图形化界面操作Oozie工作流。 - 工作流定义了Hadoop作业的执行顺序，一旦启动，就会按既定顺序执行，直到完成。 - 需要...

spark 分布式集群搭建: Spark Standalone 是 Apache Spark 提供的一种自带的集群管理模式，主要用于管理 Spark 应用程序的执行环境。这种模式简单易用，适合于开发测试以及中小型生产环境。 #### Spark Standalone 部署配置 ##### ...

Global site tag (gtag.js) - Google Analytics