Hadoop运行WordCount示例出现的一些问题及解决办法 - Keep Moving - ITeye博客

`

aaron-han

浏览: 27291 次
性别:
来自: 北京

最近访客更多访客>>

ne独孤之心ne

luyuncheng

860548048

651630320

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

rexyoung：不用多线程也能写出并发的 Quick Sorthttp://w ...
算法基础之快速排序
rexyoung：你的程序有一些小毛病，比如：1，pivot 在 19 行是一个 ...
算法基础之快速排序

Hadoop运行WordCount示例出现的一些问题及解决办法

博客分类：

Hadoop

hadoop windows wordcount

阅读更多

博客标题起的真别扭。。

先说两点：
1.用cygwin伪分布式环境运行的。
2.hadoop开发者第一期里有个DFSOperator的示例，那个更简单，怎么打jar包，怎么运行之类的问题可以先参见一个那篇文章。

运行WordCount示例遇到了两个问题：
a. ***/work/tmp does not exist的问题
解决办法：配置conf/mapred-site.xml文件中mapred.child.tmp属性的值，如下：
   <property>
      <name>mapred.child.tmp</name>
      <value>/hadoop/childtmp</value>
   </property>
原因貌似是运行hadoop需要临时目录存储中间数据。
b. map100%，reduce0%的问题
解决办法：在/etc/hosts下加上本机器的名字和ip即可。

下边说一下运行过程：
1.准备一些测试数据，例如input1.txt和input2.txt

2.新建输入目录，将测试数据put进去。

3.运行./hadoop jar wordcount.jar WordCount input output，这里会自动新建output目录，如果之前已存在，会报FileAlreadyExistsException，这时需要./hadoop fs -rmr output删掉它(觉得这里有点奇怪，求解答)。

4.查看运行结果。

下一篇开始转战ubuntu，不在纠结windows了。

查看图片附件

0
顶

0
踩

分享到：

Ubuntu下搭建单节点Hadoop环境及WordCount ... | windows环境搭建Hadoop过程中的一些问题及 ...

2012-03-30 20:30
浏览 2315
评论(0)
分类:互联网
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

hadoop运行wordcount实例: #### 二、配置Hadoop过程中遇到的问题及解决方案在配置Hadoop的过程中，可能会遇到以下常见问题及其解决方法： 1. **Java环境问题**： - 错误提示：“java: no such file or directory”。 - 解决方案：确保...

使用hadoop实现WordCount实验报告.docx: **WordCount应用** 是Hadoop平台上的一个基础示例，它统计输入文件中的每个单词出现的次数。例如，输入文件包含"Hello world"，则WordCount程序的输出应为"Hello 1"和"world 1"。 ### 二、实验原理与步骤 1. **...

Hadoop mapreduce实现wordcount: 这个文件可能是 Hadoop 官方文档中关于 WordCount 示例的一个章节，详细介绍了如何编写 Map 和 Reduce 函数，以及如何配置和运行 WordCount 作业。可能包括了 Java 代码示例，讲解如何创建 MapReduce 程序，并将其...

hadoop 运行成功代码（wordcount）: WordCount是Hadoop入门的经典示例，用于统计文本中单词出现的次数。本项目将详细介绍如何在Hadoop环境中成功运行WordCount程序，以及涉及到的相关知识点。首先，`Hadoop`是一个基于Java的框架，设计用来处理和存储...

Hadoop示例程序WordCount运行及详解: Hadoop示例程序WordCount运行及详解 Hadoop平台上进行WordCount是非常重要的，掌握了WordCount可以更好地理解Hadoop的map-reduce编程模型。本文将详细讲解Hadoop平台上WordCount的运行和实现。基于Hadoop的map-...

Hadoop的安装与配置及示例wordcount的运行: 3. 运行wordcount示例程序：我们可以使用hadoop jar命令来运行wordcount示例程序。 wordcount示例程序 Wordcount是Hadoop的一个示例程序，用于统计输入文件中的单词数量。我们可以使用hadoop jar命令来运行...

ubuntu运行hadoop的wordcount: WordCount是Hadoop中最经典的示例程序之一，用于统计文本文件中每个单词出现的次数。 1. **执行WordCount任务**： - 使用Hadoop提供的`bin/hadoop jar`命令运行WordCount任务，将`input`目录作为输入源，`output`...

Hadoop安装教程和Wordcount示例: 文档详细的描述了Hadoop在Linux上的安装过程，并且附带了Wordcount程序示例

Hadoop集群中WordCount示例: ### Hadoop集群中WordCount示例详解 #### Hadoop简介 Hadoop是一个开源软件框架，用于分布式存储和处理大规模数据集。它通过提供一个高效、可靠且可扩展的环境来支持大数据处理应用，使得开发者可以在商品硬件上...

hadoop-1.2.1运行WordCount: ### Hadoop-1.2.1 运行WordCount...总之，运行Hadoop-1.2.1下的WordCount示例涉及多个步骤，从环境搭建、数据准备到程序执行及结果验证都需要仔细操作。特别是在遇到问题时，应根据具体错误信息逐一排查并解决问题。

hadoop之wordcount例程代码: WordCount是Hadoop入门学习中的一个经典示例，用于统计文本中各个单词出现的次数。这个程序简单直观，很好地展示了MapReduce的工作原理。接下来，我们将深入探讨Hadoop的WordCount实例及其背后的原理。首先，我们...

Hadoop集群-WordCount运行详解.pdf: Hadoop采用MapReduce编程模型来实现分布式计算，MapReduce是Hadoop的核心组件，它将复杂的、运行在大规模集群上的并行计算问题简化为两个关键操作：Map（映射）和Reduce（归约）。 MapReduce理论简介中，1.1.1...

hadoop1.2.1修改WordCount并编译: Hadoop 是一种基于分布式处理的大数据处理框架，其中 WordCount 程序是一个经典的示例程序，用于统计文本文件中的词频信息。在 Hadoop 1.2.1 版本下，我们可以修改 WordCount 程序以便在控制台输出结果。在 ...

大数据实验报告Hadoop编程实现wordcount单词统计程序附源码.doc: 大数据实验报告 Hadoop 编程实现 wordcount 单词统计程序附源码本实验报告旨在介绍使用 Hadoop 编程实现 wordcount 单词统计程序的步骤和代码实现。实验的目的在于熟悉 Hadoop 虚拟机的安装与环境的配置，初步理解...

WordCount2_hadoopwordcount_: 在标题中的"WordCount2_hadoopwordcount_"可能指的是Hadoop WordCount的第二个版本，通常是在Hadoop 2.x环境下运行。这个程序的核心任务是对输入文本进行分词，统计每个单词出现的次数，并将结果输出。在这个过程中...

hadoop实现wordcount: "hadoop实现wordcount"是一个经典的入门示例，用于演示Hadoop的MapReduce编程模型。在这个项目中，我们将探讨如何使用Hadoop进行大规模文本数据的情感分析，并统计单词出现的频率。 MapReduce是Hadoop的核心组件之...

hadoop wordcount 打包部署: Hadoop WordCount 是一个经典的示例程序，用于演示如何利用Hadoop MapReduce框架进行大规模数据处理。WordCount 的基本任务是计算文本文件中每个单词出现的次数。通过这个简单的例子，可以了解Hadoop的基本操作流程...

eclipse hadoop插件安装运行WordCount: 在本文中，我们将深入探讨如何在Eclipse IDE中安装Hadoop插件，并通过该插件运行WordCount示例，特别关注Windows环境下的配置。首先，我们需要了解Eclipse Hadoop插件的作用，它允许开发者在Eclipse环境中直接创建、...

hadoop demo wordcount: 通过深入分析和实践这个"BigdataProject"中的Hadoop WordCount示例，你不仅可以掌握Hadoop的基础知识，还能为后续的大数据分析项目打下坚实基础。这将帮助你理解和应用Hadoop框架解决实际问题，尤其是在大数据领域。

Hadoop的WordCount实例代码: WordCount是Hadoop中的一个经典示例程序，用于演示如何在Hadoop环境中进行简单的数据处理。这个程序的基本任务是对输入文本中的每个单词进行计数，统计出每个单词出现的频率。 Hadoop的核心组件包括HDFS（Hadoop ...

Global site tag (gtag.js) - Google Analytics