`
aaron-han
  • 浏览: 27009 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

Hadoop运行WordCount示例出现的一些问题及解决办法

阅读更多
博客标题起的真别扭。。
先说两点:
1.用cygwin伪分布式环境运行的。
2.hadoop开发者第一期里有个DFSOperator的示例,那个更简单,怎么打jar包,怎么运行之类的问题可以先参见一个那篇文章。

运行WordCount示例遇到了两个问题:
a. ***/work/tmp does not exist的问题
解决办法:配置conf/mapred-site.xml文件中mapred.child.tmp属性的值,如下: 
   <property>   
      <name>mapred.child.tmp</name>     
      <value>/hadoop/childtmp</value>  
   </property> 
原因貌似是运行hadoop需要临时目录存储中间数据。
b. map100%,reduce0%的问题
解决办法:在/etc/hosts下加上本机器的名字和ip即可。

下边说一下运行过程:
1.准备一些测试数据,例如input1.txt和input2.txt



2.新建输入目录,将测试数据put进去。



3.运行./hadoop jar wordcount.jar WordCount input output,这里会自动新建output目录,如果之前已存在,会报FileAlreadyExistsException,这时需要./hadoop fs -rmr output删掉它(觉得这里有点奇怪,求解答)。



4.查看运行结果。



下一篇开始转战ubuntu,不在纠结windows了。  
  • 大小: 34 KB
  • 大小: 16.3 KB
  • 大小: 126.5 KB
  • 大小: 29.7 KB
0
0
分享到:
评论

相关推荐

    hadoop运行wordcount实例

    #### 二、配置Hadoop过程中遇到的问题及解决方案 在配置Hadoop的过程中,可能会遇到以下常见问题及其解决方法: 1. **Java环境问题**: - 错误提示:“java: no such file or directory”。 - 解决方案:确保...

    使用hadoop实现WordCount实验报告.docx

    **WordCount应用** 是Hadoop平台上的一个基础示例,它统计输入文件中的每个单词出现的次数。例如,输入文件包含"Hello world",则WordCount程序的输出应为"Hello 1"和"world 1"。 ### 二、实验原理与步骤 1. **...

    Hadoop mapreduce实现wordcount

    这个文件可能是 Hadoop 官方文档中关于 WordCount 示例的一个章节,详细介绍了如何编写 Map 和 Reduce 函数,以及如何配置和运行 WordCount 作业。可能包括了 Java 代码示例,讲解如何创建 MapReduce 程序,并将其...

    hadoop 运行成功代码(wordcount)

    WordCount是Hadoop入门的经典示例,用于统计文本中单词出现的次数。本项目将详细介绍如何在Hadoop环境中成功运行WordCount程序,以及涉及到的相关知识点。 首先,`Hadoop`是一个基于Java的框架,设计用来处理和存储...

    Hadoop示例程序WordCount运行及详解

    Hadoop示例程序WordCount运行及详解 Hadoop平台上进行WordCount是非常重要的,掌握了WordCount可以更好地理解Hadoop的map-reduce编程模型。本文将详细讲解Hadoop平台上WordCount的运行和实现。 基于Hadoop的map-...

    ubuntu运行hadoop的wordcount

    WordCount是Hadoop中最经典的示例程序之一,用于统计文本文件中每个单词出现的次数。 1. **执行WordCount任务**: - 使用Hadoop提供的`bin/hadoop jar`命令运行WordCount任务,将`input`目录作为输入源,`output`...

    Hadoop安装教程和Wordcount示例

    文档详细的描述了Hadoop在Linux上的安装过程,并且附带了Wordcount程序示例

    Hadoop集群中WordCount示例

    ### Hadoop集群中WordCount示例详解 #### Hadoop简介 Hadoop是一个开源软件框架,用于分布式存储和处理大规模数据集。它通过提供一个高效、可靠且可扩展的环境来支持大数据处理应用,使得开发者可以在商品硬件上...

    hadoop-1.2.1运行WordCount

    ### Hadoop-1.2.1 运行WordCount...总之,运行Hadoop-1.2.1下的WordCount示例涉及多个步骤,从环境搭建、数据准备到程序执行及结果验证都需要仔细操作。特别是在遇到问题时,应根据具体错误信息逐一排查并解决问题。

    hadoop之wordcount例程代码

    WordCount是Hadoop入门学习中的一个经典示例,用于统计文本中各个单词出现的次数。这个程序简单直观,很好地展示了MapReduce的工作原理。接下来,我们将深入探讨Hadoop的WordCount实例及其背后的原理。 首先,我们...

    Hadoop集群-WordCount运行详解.pdf

    Hadoop采用MapReduce编程模型来实现分布式计算,MapReduce是Hadoop的核心组件,它将复杂的、运行在大规模集群上的并行计算问题简化为两个关键操作:Map(映射)和Reduce(归约)。 MapReduce理论简介中,1.1.1...

    hadoop1.2.1修改WordCount并编译

    Hadoop 是一种基于分布式处理的大数据处理框架,其中 WordCount 程序是一个经典的示例程序,用于统计文本文件中的词频信息。在 Hadoop 1.2.1 版本下,我们可以修改 WordCount 程序以便在控制台输出结果。 在 ...

    大数据实验报告Hadoop编程实现wordcount单词统计程序附源码.doc

    大数据实验报告 Hadoop 编程实现 wordcount 单词统计程序附源码 本实验报告旨在介绍使用 Hadoop 编程实现 wordcount 单词统计程序的步骤和代码实现。实验的目的在于熟悉 Hadoop 虚拟机的安装与环境的配置,初步理解...

    WordCount2_hadoopwordcount_

    在标题中的"WordCount2_hadoopwordcount_"可能指的是Hadoop WordCount的第二个版本,通常是在Hadoop 2.x环境下运行。这个程序的核心任务是对输入文本进行分词,统计每个单词出现的次数,并将结果输出。在这个过程中...

    hadoop实现wordcount

    "hadoop实现wordcount"是一个经典的入门示例,用于演示Hadoop的MapReduce编程模型。在这个项目中,我们将探讨如何使用Hadoop进行大规模文本数据的情感分析,并统计单词出现的频率。 MapReduce是Hadoop的核心组件之...

    hadoop wordcount 打包部署

    Hadoop WordCount 是一个经典的示例程序,用于演示如何利用Hadoop MapReduce框架进行大规模数据处理。WordCount 的基本任务是计算文本文件中每个单词出现的次数。通过这个简单的例子,可以了解Hadoop的基本操作流程...

    eclipse hadoop插件安装 运行WordCount

    在本文中,我们将深入探讨如何在Eclipse IDE中安装Hadoop插件,并通过该插件运行WordCount示例,特别关注Windows环境下的配置。首先,我们需要了解Eclipse Hadoop插件的作用,它允许开发者在Eclipse环境中直接创建、...

    hadoop demo wordcount

    通过深入分析和实践这个"BigdataProject"中的Hadoop WordCount示例,你不仅可以掌握Hadoop的基础知识,还能为后续的大数据分析项目打下坚实基础。这将帮助你理解和应用Hadoop框架解决实际问题,尤其是在大数据领域。

    Hadoop的WordCount实例代码

    WordCount是Hadoop中的一个经典示例程序,用于演示如何在Hadoop环境中进行简单的数据处理。这个程序的基本任务是对输入文本中的每个单词进行计数,统计出每个单词出现的频率。 Hadoop的核心组件包括HDFS(Hadoop ...

Global site tag (gtag.js) - Google Analytics