`

eclipse下配置hadoop环境

 
阅读更多

按照http://smallbee.iteye.com/blog/1726303  配置环境。

 

本人在XP上使用了虚拟机,安装centos,然后eclipse是在centos上使用的。

 

 

将hadoop eclipse jar丢到eclipse中,重启。

 

总体步骤:

1.要在 Eclipse 里指定hadoop安装目录,然后建立 Map/Reduce location 结点 。

如果安装插件成功,打开Window-->Preferens,你会发现Hadoop Map/Reduce选项,在这个选项里你需要配置Hadoop installation directory。配置完成后退出。

 

配置Map/Reduce Locations。
在Window-->Show View中打开Map/Reduce Locations。
在Map/Reduce Locations中新建一个Hadoop Location。在这个View中,右键-->New Hadoop Location。在弹出的对话框中你需要配置Location name,如Hadoop,还有Map/Reduce Master和DFS Master。这里面的Host、Port分别为你在mapred-site.xml、core-site.xml中配置的地址及端口

 

配置完后退出。点击DFS Locations-->Hadoop如果能显示文件夹(2)说明配置正确,如果显示"拒绝连接",请检查你的配置。

 

新建项目

File-->New-->Other-->Map/Reduce Project
项目名可以随便取,如WordCount。
复制 hadoop安装目录/src/example/org/apache/hadoop/example/WordCount.java到刚才新建的项目下面。

 

2.在运行程序之前,在 hadoop 将输入文件放入 input ,把 output 删除 。 

上传模拟数据文件夹

为了运行程序,我们需要一个输入的文件夹,和输出的文件夹。
在本地新建word.txt

java c++ python c
java c++ javascript 
helloworld hadoop
mapreduce java hadoop hbase 

通过hadoop的命令在HDFS上创建/tmp/workcount目录,命令如下:bin/hadoop fs -mkdir /tmp/wordcount

通过copyFromLocal命令把本地的word.txt复制到HDFS上,命令如下:bin/hadoop fs -copyFromLocal /home/grid/word.txt  /tmp/wordcount/word.txt

 

如果是eclipse,直接可以选择右键找到对应命令即可。

 

3.在运行然后运行程序的时候选择 Run on hadoop 就可以了

运行项目

a.在新建的项目Hadoop,点击WordCount.java,右键-->Run As-->Run Configurations
b.在弹出的Run Configurations对话框中,点Java Application,右键-->New,这时会新建一个application名为WordCount
c.配置运行参数,点Arguments,在Program arguments中输入“你要传给程序的输入文件夹和你要求程序将计算结果保存的文件夹”,如:

hdfs://localhost:9000/tmp/wordcount/word.txt   hdfs://localhost:9000/tmp/wordcount/out

d、如果运行时报java.lang.OutOfMemoryError: Java heap space 配置VM arguments(在Program arguments下)

-Xms512m -Xmx1024m -XX:MaxPermSize=256m

 

 

 

 

刷新DFS Locations,就能看到output。

分享到:
评论

相关推荐

    eclipse配置hadoop

    Eclipse 配置 Hadoop 及 MapReduce 开发指南 一、Eclipse 中配置 Hadoop 插件 配置 Hadoop 插件是使用 Eclipse 进行 MapReduce 开发的第一步。首先,需要安装 Eclipse 3.3.2 和 Hadoop 0.20.2-eclipse-plugin.jar ...

    eclipse安装Hadoop插件

    通过上述步骤,我们不仅成功地在Eclipse中安装了Hadoop插件,还进一步配置了Hadoop环境,包括设置Hadoop集群的位置、释放Hadoop-common库以及关闭HDFS的权限检查等功能。这些操作有助于提高Hadoop程序开发的效率和...

    在eclipse中配置hadoop插件

    4. 配置Hadoop环境:安装插件后,需要配置Hadoop的相关路径,包括Hadoop的安装目录、配置文件路径(如core-site.xml和hdfs-site.xml)等。这些信息可以在Eclipse的Window -> Preferences -> Hadoop File System中...

    Ubuntu下开发Eclipse下的Hadoop应用

    * 如何配置Hadoop环境 * 如何使用Eclipse开发Hadoop应用程序 * 如何使用Map/Reduce视图 * 如何添加Hadoop location * 如何添加文本文件 * 如何新建Map/Reduce项目 * 如何新建WordCount类 * 如何添加/编写源代码 ...

    eclipse连接hadoop所需要的hadoop.ddl和eclipse插件和hadoop运行案例

    3. 配置插件:在Eclipse中设置Hadoop集群的相关信息,包括Hadoop的安装路径、 Namenode地址、端口等。 4. 使用插件:现在你可以通过Eclipse的“File” > “New” > “Job”等选项创建和管理Hadoop MapReduce作业了。...

    基于Eclipse的Hadoop应用开发环境配置

    "基于Eclipse的Hadoop应用开发环境配置" 基于 Eclipse 的 Hadoop 应用开发环境配置是指在 Eclipse 中配置 Hadoop 开发环境,以便开发和运行 Hadoop 应用程序。本节将对基于 Eclipse 的 Hadoop 应用开发环境配置进行...

    win7下eclipse配置hadoop的插件

    标题中提到的关键是"win7下eclipse配置hadoop的插件",这意味着我们要在Windows 7操作系统上,利用Eclipse进行Hadoop开发的环境配置。这通常包括以下几个步骤: 1. **下载Hadoop插件**:这里提到的`hadoop-eclipse-...

    eclipse中配置hadoop插件

    eclipse中配置hadoop插件 在Eclipse中配置Hadoop插件是使用Hadoop进行大数据处理和分析的重要步骤。...使用Eclipse配置Hadoop插件可以实现大数据处理和分析的自动化操作,提高工作效率和开发速度。

    在eclipse上进行Hadoop开发环境的配置

    本文将详细介绍如何在 Eclipse 上配置 Hadoop 开发环境,包括下载和安装 Eclipse、配置 Hadoop 插件、启动 Hadoop、上传测试数据、创建 MapReduce 项目和设置运行参数等步骤。 一、下载和安装 Eclipse Eclipse 是...

    hadoop-eclipse2.7.1、hadoop-eclipse2.7.2、hadoop-eclipse2.7.3

    Hadoop-Eclipse插件是将Hadoop的功能与Eclipse IDE结合的工具,它使得开发人员能够在Eclipse环境中直接编写、调试和运行Hadoop MapReduce程序,极大地提升了开发效率。 标题中的"hadoop-eclipse2.7.1、hadoop-...

    window7+eclipse4.7+Hadoop2.9.0环境搭建所需的全套插件及文档

    遵循文档中的步骤,你可以配置Eclipse的Java项目,设置Hadoop的本地路径,以及创建和运行MapReduce作业。 在所有这些配置完成后,你将拥有一个完整的Hadoop开发环境,可以在Windows 7上的Eclipse 4.7中编写、测试和...

    eclipse配置Hadoop开发环境

    附件包含eclipse在window7配置hadoop2.7.x 开发环境需要的jar、dll。具体安装步骤可以参考:https://blog.csdn.net/wudichengyaojin/article/details/64440655 可能遇到的问题参考: ...

    Eclipse+Hadoop环境配置

    ### Eclipse+Hadoop环境配置详解 #### 一、概述 在大数据处理领域,Hadoop作为一款开源软件框架,被广泛用于分布式存储与处理大规模数据集。为了更好地利用Hadoop进行开发,很多开发者会选择使用集成开发环境(IDE...

    hadoop搭建与eclipse开发环境设置

    目的很简单,为进行研究与学习,部署一个hadoop运行环境,并搭建一个hadoop开发与测试环境。 具体目标是: 1.在ubuntu系统上部署hadoop 2.在windows 上能够使用eclipse连接ubuntu系统上部署的hadoop进行开发与测试 3...

    hadoop-eclipse2.5.2、hadoop-eclipse2.6.0、hadoop-eclipse2.6.5

    1. **项目配置**:在Eclipse中可以直接创建Hadoop MapReduce项目,设置Hadoop集群的配置信息,如 Namenode 和 JobTracker 的地址。 2. **资源管理**:通过插件可以浏览HDFS文件系统,上传或下载文件,查看文件属性...

    eclipse连接hadoop相关工具

    这个主题涵盖了Eclipse插件、Hadoop的DLL文件以及Winutils工具,这些都是在Windows环境下进行Hadoop开发所必需的。 描述中提到的“hadoop-eclipse-plugin-2.7.3.jar”是Eclipse的一个插件,它允许开发者在Eclipse中...

    Eclipse下搭建Hadoop2.7.3开发环境

    这个过程将涉及几个关键步骤,包括安装Eclipse插件、配置Hadoop环境以及运行一个简单的WordCount示例。 首先,我们需要下载并安装Eclipse IDE,这是一款流行的Java开发工具,也是开发Hadoop应用的理想选择。确保你...

    Linux和Win下配置eclipse开发hadoop

    **一、Linux环境下配置Eclipse开发Hadoop** 1. **安装Java**: Hadoop依赖Java运行环境,首先确保系统已安装Java,并且版本至少为Java 8。可以通过`java -version`命令检查。 2. **安装Hadoop**: 下载Hadoop二进制...

    eclipse hadoop2 插件

    Eclipse Hadoop2 插件是为开发人员提供的一种强大工具,它允许用户在Eclipse集成开发环境中(IDE)直接编写、调试和管理Hadoop项目。这个插件针对Hadoop 2.x版本进行了优化,提供了丰富的功能来简化Hadoop应用程序的...

Global site tag (gtag.js) - Google Analytics