`
superlxw1234
  • 浏览: 552312 次
  • 性别: Icon_minigender_1
  • 来自: 西安
博客专栏
Bd1c0a0c-379a-31a8-a3b1-e6401e2f1523
Hive入门
浏览量:44544
社区版块
存档分类
最新评论

windows下用eclipse连接linux中的hadoop,并执行mr

阅读更多

1. 准备:

 

    linux上已经安装好hadoop集群或者单机;

 

    windows上有个hadoop-0.20.2文件夹;

 

    Eclipse Europa 3.3.2

    (勿使用其他版本,测试没通过)下载地址: http://www.eclipse.org/downloads/packages/release/europa/winter

 

2. 安装eclipse插件:

 

    把hadoop-0.20.2/contrib/eclipse-plugin下的hadoop-0.20.2-eclipse-plugin.jar文件拷到eclipse 的plugins目录下,重启eclipse,在Window-》Open Perspective-》other,弹出的窗口中应该有一项Map/Reduce项,代表安装成功了。如果没有的话,把eclipse下的 configuration/org.eclipse.update文件夹删了,再重启eclipse。

 

 

 

 

 

3. 配置环境:

 

 

启动eclipse,转到Map/Reduce Perspective,在上图的Map/Reduce Locations里,新建一个Location,填入以下值

    * Location Name -- localhost
    * Map/Reduce Master  (mapred.job.tracker中配置的jobtracker地址和端口)
          o Host -- 10.125.50.20
          o Port -- 50021
    * DFS Master (fs.default.name中配置的host和端口)
          o Host -- hd021-test.nh.sdo.com
          o Port -- 8020
    * User name -- lxw (用来提交mr任务的用户名)

 

 

 

 

 

4. 上传文件到hdfs:

 

   hadoop fs -put 10.125.50.20.pub /user/lxw/input/

   这时,在eclipse的Project explorer的DFS location中,应该能反应变化,没有的话,reconnect一下

 

  

 

 

 

5. 创建Map/Reduce Project:

 

   右键点击  Project Explorer 窗口,选择 New -> Project.. 找到 Map/Reduce Project,Next ,输入名字。

 

   点击下面的Config Hadoop Install Directiory,输入Hadoop的目录,如:D:\hadoop-0.20.2

 

  

 

6. 新建mr程序:

 

 右键点击新创建的 Hadoop 工程,选择  New -> Other 转到 Map/Reduce 文件夹, 选择 MapReduceDriver 然后点击 Next ,输入名字,点击Finish。

 

这样会自动生成一些代码,不用管,直接删掉,然后写自己的mr程序即可;

 

7. 运行mr程序:

 

选择 Run As --> Run on Hadoop. 弹出以下窗口:

 

 

选择 "Choose existing hadoop location" , 然后选择刚才创建的hadoop配置信息,点击fihish即可开始运行;

 

 

 

 

 

0
0
分享到:
评论

相关推荐

    linux下maven在eclipse安装测试Hadoop收集.pdf

    在本文中,我们将介绍如何在Linux环境下使用Maven在Eclipse中安装测试Hadoop。 首先,需要下载Maven的安装包,并将其解压到用户根目录下。在解压后,需要配置环境变量,以便在命令行中可以使用Maven。在配置环境...

    linux下maven在eclipse安装测试Hadoop.pdf

    最后,在Eclipse中运行你的WordCount程序,它将连接到Hadoop集群,执行MapReduce作业,并将结果写入指定的输出目录。 通过以上步骤,你已经在Linux环境中成功地配置了Maven,创建了一个Hadoop项目,并实现了简单的...

    hadooponwindows.zip

    Hadoop最初是为Linux环境设计的,但随着其影响力的扩大,它也被移植到了Windows平台,使得在Windows环境中进行大数据处理和分析成为可能。 Hadoop的核心组件包括Hadoop Distributed File System (HDFS)和MapReduce...

    Hadoop搭建及mr程序示例.docx

    本文档将详细介绍如何搭建一个Hadoop集群,并演示如何在Windows环境下利用Eclipse开发MapReduce程序,以WordCount为例。 **Hadoop安装前准备** 在开始搭建Hadoop集群之前,需要确保你的环境满足以下条件: 1. **...

    Hadoop从入门到上手企业开发

    003 Linux 环境下基本命令使用及Linux系统中文件的类型和权限 004 Linux 环境下基本命令讲解二 005 Linux 系统远程FTP工具与桌面工具XManager使用和培养三大能力 006 Linux 系统基本命令和基本配置的复习讲解 007 ...

    实验项目 MapReduce 编程

    实验项目“MapReduce 编程”旨在让学生深入理解并熟练运用MapReduce编程模型,这是大数据处理领域中的核心技术之一。实验内容涵盖了从启动全分布模式的Hadoop集群到编写、运行和分析MapReduce应用程序的全过程。 ...

    MR_online_eclipse:hadoop WordCount 演示

    Maven在Eclipse中远程调试hadoop2.6.0项目 1.系统环境 调试:Win7,64bit Cluster: Linux, Centos 2.创建hadoop项目命令 mvn archetype:generate -DarchetypeGroupId=org.apache.maven.archetypes -DgroupId=org....

    大数据课程体系

    - **执行Mapreduce过程**:指导如何提交并执行MapReduce作业。 - **Hadoop核心类讲解**:RM(Resource Manager)、NM(Node Manager)、NN(NameNode)、DN(DataNode)。 - **YARN调度框架事件分发机制**:介绍YARN的事件...

    大数据课程体系(20210925082704).pdf

    4. **MapReduce**:MapReduce是Hadoop的数据处理模型,课程将分析MR作业流程,教授如何编写Mapper和Reducer程序,并演示MapReduce的执行过程。此外,还将讲解Hadoop的核心类,如ResourceManager、NodeManager、...

Global site tag (gtag.js) - Google Analytics