参照hadoop-0.20.2/docs/quickstart.html
注:ssh-copy-id -i ~/.ssh/id_rsa.pub localhost,我的 用户名是fansxnet
配置我们的hadoop伪分布式,打开下面的页面,配置成功。
mapreduce 9001
hdfs 9000
添加hadoop的eclipse的插件并重起eclipse。
hadoop-0.20.2/contrib/eclipse-plugin/hadoop-0.20.2-eclipse-plugin.jar
配置插件
打开Map/Reduce Locations视图,New hadoop Locations
完成之后,就可以看到我们的分布式文件
新建我们的mapreduce项目hadoop
将hadoop自带的示例程序hadoop-0.20.2/src/examples/复制到我们的项目src目录下
本地新建一个input目录,里面新建两个文件
file1,内容如下
Hello World Bye World
file2,内容如下
Hello Hadoop Goodbye Hadoop
上传input文件夹到hdfs://localhost:9000/user/fansxnet/目录下
运行org.apache.hadoop.examples.WordCount.java
指定输入输出文件夹
hdfs://localhost:9000/user/fansxnet/input hdfs://localhost:9000/user/fansxnet/output
运行完之后刷新hdfs文件夹即可看到统计结果
- 大小: 62.1 KB
- 大小: 128.4 KB
- 大小: 115.4 KB
- 大小: 110.7 KB
- 大小: 188.9 KB
- 大小: 79 KB
分享到:
相关推荐
基于 Eclipse 的 Hadoop 应用开发环境配置是指在 Eclipse 中配置 Hadoop 开发环境,以便开发和运行 Hadoop 应用程序。本节将对基于 Eclipse 的 Hadoop 应用开发环境配置进行详细介绍。 一、Hadoop 概述 Hadoop 是...
在开发Hadoop应用程序时,Eclipse作为Java IDE是开发者常用的选择。为了在Eclipse中运行Hadoop 2.7.3程序,你需要确保正确配置了项目依赖并包含了所有必需的JAR包。以下是你需要知道的关键知识点: 1. **Hadoop环境...
4. **测试连接**:当以上步骤都已完成并且集群运行正常时,应该能够通过Eclipse连接到Hadoop集群并加载其中的文件。 #### 六、释放Hadoop-Common库 1. **解压位置**:将`Hadoop-common.zip`解压至指定位置,例如`E...
标题 "eclipse 运行hadoop工具包" 涉及到的是在Eclipse集成开发环境中运行Hadoop项目的方法。Eclipse是一款广泛使用的Java IDE,而Hadoop是Apache开源项目,主要用于大数据处理和分析。通过特定的插件,Eclipse能够...
六、在 Eclipse 中运行 WordCount 程序 6.1 导入 WordCount WordCount 6.2 配置运行参数 Run As -> Open Run Dialog... 选择 WordCount 程序,在 Arguments 中配置运行参数:/mapreduce/wordcount/input /...
本描述明确了本文档的主要内容是关于在Ubuntu操作系统下安装Eclipse,并在Eclipse中安装Hadoop插件,最后运行Hadoop应用程序。 标签: ubuntu eclipse java Hadoop API 本标签表明了本文档涉及到的技术领域是...
Eclipse 中将 Hadoop 程序打包成 JAR 文件并直接设定参数运行 本文将详细介绍如何使用 Eclipse 将 Hadoop 程序打包成 JAR 文件,并直接设定参数运行。通过本文,您将了解到 Eclipse 中的项目导出、JAR 文件生成、...
为了更好地进行Hadoop应用程序的开发与调试,很多开发者会选择集成开发环境(IDE)来提高工作效率。Eclipse是一款流行的开源IDE,支持多种编程语言,包括Java。本文主要介绍了如何在Eclipse环境下搭建Hadoop开发环境...
在Windows 7操作系统中,使用Eclipse开发Hadoop应用程序的过程涉及多个步骤,涵盖了从环境配置到实际编程的各个层面。以下是对这个主题的详细讲解: 首先,我们需要了解Hadoop和Eclipse的基础。Hadoop是一个开源的...
在Windows环境下使用Eclipse开发Hadoop应用程序,主要是为了利用Java编程语言实现分布式计算任务。Hadoop是一个开源的框架,主要用于处理和存储大量数据,而Eclipse则是一个流行的Java集成开发环境(IDE)。以下是...
为了方便开发者在Windows环境下进行Hadoop应用程序的开发,本篇指南将详细介绍如何使用Eclipse集成开发环境(IDE)来编写、编译并在Hadoop集群上运行简单的Hadoop应用程序。 #### 创建Java项目 1. **启动Eclipse**...
9. **运行Hadoop程序**:在Eclipse中,右键项目选择Run As -> Run Configurations,创建一个新的Hadoop Job配置。配置包括输入数据路径、输出数据路径、主类等信息。点击Run,Eclipse会自动将程序打包并提交到Hadoop...
总的来说,要使Eclipse连接并运行Hadoop项目,我们需要安装Hadoop Eclipse Plugin,并理解`hadoop.ddl`文件中关于数据结构的信息。同时,通过实践提供的`hadoop运行案例`,可以加深对Hadoop开发的理解,从而高效地...
1. **下载Hadoop插件**:这里提到的`hadoop-eclipse-plugin-2.6.0.jar`是Eclipse与Hadoop交互的核心插件,它允许我们在Eclipse中直接创建、管理和运行Hadoop作业。你需要将这个jar文件放入Eclipse的plugins目录下。 ...
在本文中,我们将深入探讨如何配置Eclipse IDE以连接到Hadoop集群,这对于开发和调试Hadoop相关的Java应用程序至关重要。Eclipse是一个强大的集成开发环境,支持多种编程语言,包括Java,而Hadoop是一个分布式计算...
Eclipse的Hadoop插件是开发Hadoop MapReduce应用程序的重要工具,它允许开发者在熟悉的Eclipse集成开发环境中(IDE)编写、调试和管理Hadoop项目。这个插件专为Hadoop 0.20.2版本设计,并且要求Eclipse版本为3.5。在...
总的来说,通过Eclipse与Hadoop 2.2.0插件的配合,Windows用户可以在本地环境中高效地开发和测试Hadoop应用,无需频繁地在IDE和命令行之间切换,大大提升了开发效率。确保正确配置Hadoop环境,并利用好Eclipse提供的...
9. **运行和调试**: 在Windows上,可以通过Eclipse运行Map/Reduce任务,但可能需要使用命令行启动Hadoop服务。 以上就是在Linux和Windows环境下配置Eclipse进行Hadoop开发的详细步骤。需要注意的是,由于Windows的...
描述中提到的“hadoop-eclipse-plugin-2.7.3.jar”是Eclipse的一个插件,它允许开发者在Eclipse中直接创建、编辑、构建和运行Hadoop项目。这个插件与Hadoop的特定版本(这里是2.7.3)兼容,提供了图形化的界面,方便...