1. 准备:
linux上已经安装好hadoop集群或者单机;
windows上有个hadoop-0.20.2文件夹;
Eclipse Europa 3.3.2
(勿使用其他版本,测试没通过)下载地址: http://www.eclipse.org/downloads/packages/release/europa/winter
2. 安装eclipse插件:
把hadoop-0.20.2/contrib/eclipse-plugin下的hadoop-0.20.2-eclipse-plugin.jar文件拷到eclipse 的plugins目录下,重启eclipse,在Window-》Open
Perspective-》other,弹出的窗口中应该有一项Map/Reduce项,代表安装成功了。如果没有的话,把eclipse下的
configuration/org.eclipse.update文件夹删了,再重启eclipse。
3. 配置环境:
启动eclipse,转到Map/Reduce Perspective,在上图的Map/Reduce Locations里,新建一个Location,填入以下值
* Location Name -- localhost
* Map/Reduce Master (mapred.job.tracker中配置的jobtracker地址和端口)
o Host -- 10.125.50.20
o Port -- 50021
* DFS Master (fs.default.name中配置的host和端口)
o Host -- hd021-test.nh.sdo.com
o Port -- 8020
* User name -- lxw (用来提交mr任务的用户名)
4. 上传文件到hdfs:
hadoop fs -put 10.125.50.20.pub /user/lxw/input/
这时,在eclipse的Project explorer的DFS location中,应该能反应变化,没有的话,reconnect一下
5. 创建Map/Reduce Project:
右键点击 Project
Explorer
窗口,选择 New -> Project..
找到 Map/Reduce Project,
点Next
,输入名字。
点击下面的Config Hadoop Install Directiory,输入Hadoop的目录,如:D:\hadoop-0.20.2
6. 新建mr程序:
右键点击新创建的 Hadoop 工程,选择 New
-> Other
转到 Map/Reduce
文件夹, 选择 MapReduceDriver
然后点击 Next
,输入名字,点击Finish。
这样会自动生成一些代码,不用管,直接删掉,然后写自己的mr程序即可;
7. 运行mr程序:
选择 Run As --> Run on Hadoop.
弹出以下窗口:
选择 "Choose existing hadoop location"
, 然后选择刚才创建的hadoop配置信息,点击fihish即可开始运行;
分享到:
相关推荐
在本文中,我们将介绍如何在Linux环境下使用Maven在Eclipse中安装测试Hadoop。 首先,需要下载Maven的安装包,并将其解压到用户根目录下。在解压后,需要配置环境变量,以便在命令行中可以使用Maven。在配置环境...
最后,在Eclipse中运行你的WordCount程序,它将连接到Hadoop集群,执行MapReduce作业,并将结果写入指定的输出目录。 通过以上步骤,你已经在Linux环境中成功地配置了Maven,创建了一个Hadoop项目,并实现了简单的...
Hadoop最初是为Linux环境设计的,但随着其影响力的扩大,它也被移植到了Windows平台,使得在Windows环境中进行大数据处理和分析成为可能。 Hadoop的核心组件包括Hadoop Distributed File System (HDFS)和MapReduce...
本文档将详细介绍如何搭建一个Hadoop集群,并演示如何在Windows环境下利用Eclipse开发MapReduce程序,以WordCount为例。 **Hadoop安装前准备** 在开始搭建Hadoop集群之前,需要确保你的环境满足以下条件: 1. **...
003 Linux 环境下基本命令使用及Linux系统中文件的类型和权限 004 Linux 环境下基本命令讲解二 005 Linux 系统远程FTP工具与桌面工具XManager使用和培养三大能力 006 Linux 系统基本命令和基本配置的复习讲解 007 ...
实验项目“MapReduce 编程”旨在让学生深入理解并熟练运用MapReduce编程模型,这是大数据处理领域中的核心技术之一。实验内容涵盖了从启动全分布模式的Hadoop集群到编写、运行和分析MapReduce应用程序的全过程。 ...
Maven在Eclipse中远程调试hadoop2.6.0项目 1.系统环境 调试:Win7,64bit Cluster: Linux, Centos 2.创建hadoop项目命令 mvn archetype:generate -DarchetypeGroupId=org.apache.maven.archetypes -DgroupId=org....
- **执行Mapreduce过程**:指导如何提交并执行MapReduce作业。 - **Hadoop核心类讲解**:RM(Resource Manager)、NM(Node Manager)、NN(NameNode)、DN(DataNode)。 - **YARN调度框架事件分发机制**:介绍YARN的事件...
4. **MapReduce**:MapReduce是Hadoop的数据处理模型,课程将分析MR作业流程,教授如何编写Mapper和Reducer程序,并演示MapReduce的执行过程。此外,还将讲解Hadoop的核心类,如ResourceManager、NodeManager、...