使用hadoop用户登录
1、编译WordCount.java文件
cd /opt/hadoop/hadoop-1.2.1/src/examples/org/apache/hadoop/examples 进入该目录
执行下面的命令
javac -classpath /opt/hadoop/hadoop-1.2.1/hadoop-core-1.2.1.jar://opt/hadoop/hadoop-1.2.1/lib/commons-cli-1.2.jar -d /opt/hadoop/hadoop-1.2.1/src/examples WordCount.java
-d /opt/hadoop/hadoop-1.2.1/src/examples 是为了保留包路径信息,否则后面会出现:java.lang.ClassNotFoundException: org.apache.hadoop.examples.WordCount异常
2、打jar包
cd /opt/hadoop/hadoop-1.2.1/src/examples
jar cvf WordCount.jar ./org/apache/hadoop/examples/*.class
这样会把org.apache.hadoop.examples包结构打入
3、创建输入文件与input文件夹
随便建立file01、file02两个文件,随便输入文字
- $ bin/hadoop fs -mkdir /tmp/input
- $ bin/hadoop fs -put file01 /tmp/input/
- $ bin/hadoop fs -put file02 /tmp/input/
4、运行WordCount程序
./hadoop jar WordCount.jar org.apache.hadoop.examples.WordCount /tmp/input /tmp/output
org.apache.hadoop.examples.WordCount 要写全路径,否则报类找不到
5、查看结果
- $ bin/hadoop fs -cat /tmp/output/part-00000
相关推荐
- 上述命令中,`hadoop-0.20.2-examples.jar`是Hadoop自带的例子程序集合,包含了WordCount等示例程序。 - `wordcount`表示执行WordCount任务。 - `input`和`output`分别代表输入文件夹和输出文件夹路径。 #### ...
- 下载和编译WordCount示例,Hadoop的源码包中包含了这个例子。在Hadoop的src目录下,使用Maven或Ant构建项目,生成可执行的jar文件。 - 创建一个文本文件,输入一些单词,作为WordCount的输入数据。将文件上传到...
- **监控与管理**:使用Hadoop自带的Web界面监控集群状态。 #### 四、示例应用 为了更好地理解Hadoop的实际应用,我们可以通过一个经典的WordCount示例来演示MapReduce的工作流程。 1. **Map阶段**:读取输入文件,...
在这里,我们将运行Hadoop自带的WordCount示例,这是一个计算文件中单词出现次数的经典应用。使用`yarn jar /opt/hadoop-2.8.5/share/hadoop/mapreduce/hadoop-mapreduce-example-2.8.5.jar wordcount /input/wc....
可以通过执行Hadoop自带的启动脚本来完成这一过程。一般情况下,启动命令会先启动NameNode,然后启动DataNode。 6. Hadoop使用: Hadoop的使用包括运行测试例子(例如WordCount)、编写并运行Hadoop应用程序以及...
搭建完成后,可以通过运行Hadoop自带的示例程序,如WordCount,来检查环境是否配置正确。这个例子会统计文本文件中的单词出现次数,展示了MapReduce的基本工作原理。 总之,“windows7-64bit-hadoop本地库lib和bin...
在安装完成后,你可以通过运行Hadoop自带的一些例子来验证安装是否成功,例如WordCount程序,它统计文本文件中每个单词出现的次数。这将涉及到创建HDFS上的输入目录,提交MapReduce作业,以及查看输出结果。 总之,...
其中Java实现的JavaWordCount是spark自带的例子($SPARK_HOME/examples/src/main/java/org/apache/spark/examples/JavaWordCount.java)OS:RedHatEnterpriseLinuxServerrelease6.4(Santiago)Hadoop:Hadoop2.4.1JDK:1...
6. **运行示例程序**:在伪分布式环境中,可以尝试运行Hadoop自带的示例程序,如WordCount,以确保环境配置正确。 通过以上步骤,你就可以在单台机器上成功搭建Hadoop的伪分布式环境,这对于理解和实践Hadoop的基本...
* Hadoop 自带例子:Hadoop 提供了一些自带例子,例如 pi 计算圆周率 三、Wordcount 计算实验 * 掌握 MapReduce 的 Wordcount 计算方法 * 了解如何使用 MapReduce 相应计算程序,完成 wordcount 计算 * 了解如何...
###### 6.1 查看Hadoop自带的例子 ```bash hadoop jar /usr/local/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.5.jar ``` 可以看到Hadoop提供的一些示例程序。 ###### 6.2 在HDFS中创建用户目录...
2. 使用Hadoop自带例子pi计算圆周率 实验结果证明了圆周率计算的正确性。 ### 第3题 基于MapReduce的Wordcount计算实验 该实验的目的是掌握MapReduce的Wordcount计算方法。实验步骤如下: 1. 使用MapReduce的...
- 将Oozie自带的例子和ShareLib部署到HDFS的home目录。 3. 工作流操作: - 通过命令行和图形化界面操作Oozie工作流。 - 工作流定义了Hadoop作业的执行顺序,一旦启动,就会按既定顺序执行,直到完成。 - 需要...
#### 二、Spark 自带的例子 在安装 Spark 后,可以直接使用其内置的一些示例程序来快速了解 Spark 的基本用法。 ##### 2.1 启动示例程序 可以通过 `spark-submit` 命令来提交 Spark 内置的示例程序。例如,启动 `...
Spark Standalone 是 Apache Spark 提供的一种自带的集群管理模式,主要用于管理 Spark 应用程序的执行环境。这种模式简单易用,适合于开发测试以及中小型生产环境。 #### Spark Standalone 部署配置 ##### ...