`
zhangbaoming815
  • 浏览: 149932 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

在eclipse下运行Map-Reduce程序

阅读更多

在eclipse下运行Map-Reduce程序:


1,在eclipse新建项目。
File-->New-->Other-->Map/Reduce Project
项目名可以随便取,如 HadoopTest
复制 hadoop 安装目录 /src/example/org/apache/hadoop/example/WordCount.java 到刚才新建的项目下面。


2 上传模拟数据文件夹。
为了运行程序,我们需要一个输入的文件夹,和输出的文件夹。输出文件夹,在程序运行完成后会自动生成。我们需要给程序一个输入文件夹。


在当前目录(如 hadoop 安装目录)下新建文件夹 input ,并在文件夹下新建文件 file0 1 ,文件内容如下:

hello map-reduce eclipse goodbye



1>在已经启动 Hadoop 守护进程终端中 cd hadoop 安装目录,运行下面命令:

bin/hadoop fs -put input input01

or hadoop fs -put input input01


2>这个命令将 input 文件夹上传到了 hadoop 文件系统了,在该系统下就多了一个 input01 文件夹,你可以使用下面命令查看:

bin/hadoop fs -ls  or hadoop fs -ls


3> 在新建的项目 HadoopTest ,点击 WordCount.java ,右键 -->Run As-->Run Configurations
4>
在弹出的 Run Configurations 对话框中,点 Java Application ,右键 -->New ,这时会新建一个 application 名为 WordCount
5>
配置运行参数,点 Arguments ,在 Program arguments 中输入“你要传给程序的输入文件夹和你要求程序将计算结果保存的文件夹”,如:


hdfs://localhost:9000/user/hadoop/input01  hdfs://localhost:9000/home/hadoop/Desktop/data/output01

6> 点击 Run ,运行程序

7>查看运行结果:

hadoop fs -ls /home/hadoop/Desktop/data

8>查看内容

hadoop fs -cat /home/hadoop/Desktop/data/output01/*


分享到:
评论

相关推荐

    Map-Reduce原理体系架构和工作机制,eclipse与Hadoop集群连接

    为了能够在Eclipse IDE中开发和调试Map-Reduce程序,需要配置Eclipse与Hadoop集群之间的连接。 **1. 安装Hadoop插件** - Eclipse Marketplace中搜索并安装Hadoop插件。 - 配置插件以指向Hadoop安装目录。 **2. ...

    eclipse运行mr插件hadoop-eclipse-plugin-2.6.0.jar

    3. **验证安装**: 重启Eclipse后,如果插件安装成功,你可以在`File` -> `New` -> `Project`中看到新的模板,如"Hadoop Map/Reduce Project"。 4. **配置Hadoop连接**: 在创建新的Hadoop Map/Reduce项目时,需要...

    hadoop-eclipse-plugin-3.1.1.tar.gz

    Hadoop-Eclipse-Plugin-3.1.1是一款专为Eclipse集成开发环境设计的插件,用于方便地在Hadoop分布式文件系统(HDFS)上进行开发和调试MapReduce程序。这款插件是Hadoop生态系统的组成部分,它使得Java开发者能够更加...

    hadoop-eclipse2.7.1、hadoop-eclipse2.7.2、hadoop-eclipse2.7.3

    Hadoop-Eclipse插件是将Hadoop的功能与Eclipse IDE结合的工具,它使得开发人员能够在Eclipse环境中直接编写、调试和运行Hadoop MapReduce程序,极大地提升了开发效率。 标题中的"hadoop-eclipse2.7.1、hadoop-...

    odps-eclipse-plugin-bundle-0.16.0.zip

    通过ODPS Eclipse插件,开发者可以直接在Eclipse中编写和测试MapReduce程序,无需离开熟悉的开发环境。 SQL也是ODPS的重要部分,它提供了SQL-on-Hadoop的功能,使得开发者可以用SQL语句来查询和分析ODPS中的大数据...

    map-reduce实现分布式爬虫

    在实际操作中,我们需要配置Hadoop集群的设置,如HDFS的存储路径、JobTracker的位置等,然后通过Eclipse运行Hadoop作业,启动爬虫程序。 总的来说,这个项目涵盖了分布式系统、大数据处理、网络爬虫等多个IT领域的...

    Hadoop-eclipse-plugin-2.7.6下载与说明

    在Java应用程序的主类上右键单击,选择“Run As” -> “Map/Reduce Job”,然后选择本地运行或连接到远程集群。 6. **连接到Hadoop集群**:如果你的开发环境不在Hadoop集群上,可以通过配置Eclipse连接到远程集群。...

    配置mapreduce开发环境(简单易懂,轻松上手)

    - 在MyEclipse中新建一个Map/Reduce项目,并配置本地Hadoop主目录。 - MyEclipse会自动加载所需的jar包。 2. **编写WordCount程序**: - 从网络下载WordCount示例代码。 - 在MyEclipse的“Run Configurations”...

    好用的hadoop-eclipse-plugin-2.6.4.jar

    另外,它还支持直接在Eclipse中启动和停止Job,以及调试Map和Reduce函数,这对于调试和优化代码来说是非常重要的。 Hadoop-Eclipse-Plugin-2.6.4版本是针对Hadoop 2.x系列的,因此,它支持YARN资源管理器,这使得在...

    hadoop-eclipse2.5.2、hadoop-eclipse2.6.0、hadoop-eclipse2.6.5

    Eclipse是流行的Java集成开发环境(IDE),而Hadoop-Eclipse插件是将Hadoop与Eclipse结合的工具,允许开发者在Eclipse中直接创建、运行和调试Hadoop MapReduce程序。这些文件"hadop-eclipse-plugin-2.5.2.jar"、...

    hadoop-eclipse-plugin-2.6.5.jar插件下载

    安装完成后,用户会在Eclipse的"New"菜单中看到"Hadoop Map/Reduce Project"选项,这标志着插件已成功安装并可使用。 使用Hadoop Eclipse Plugin,开发者可以进行以下操作: 1. **创建Hadoop项目**:选择“File” ...

    hadoop-eclipse-plugin-2.7.4.jar

    重启Eclipse后,你会发现在"File"菜单下多了"New" -> "Other" -> "Hadoop Map/Reduce Project"的选项,这就是Hadoop Eclipse Plugin所带来的变化。通过这个选项,你可以创建一个专门针对Hadoop的MapReduce项目,设置...

    使用Eclipse编译运行MapReduce程序.doc

    Eclipse作为流行的Java集成开发环境,配合Hadoop-Eclipse Plugin,使得在Eclipse中编写、调试和运行MapReduce程序变得非常方便。 ### 实验目的 1. 学习如何在Ubuntu/CentOS系统上使用Eclipse开发MapReduce程序。 2....

    hadoop-eclipse-plugin-1.1.2

    重启后,Eclipse会自动识别并加载该插件,此时,在"File"菜单中选择"New" -> "Project",就可以看到"Hadoop Map/Reduce Project"选项。 4. **使用插件开发MapReduce** - **创建项目**:通过插件,开发者可以轻松...

    window下eclipse中运行mapreduce程序所需要的Hadoop全部jar包

    3. **创建项目**:在Eclipse中,创建一个新的Java项目,选择“Map/Reduce”作为项目类型。这样,Eclipse会自动添加一些基础的MapReduce类库。 4. **导入jar包**:标题和描述提到的“Hadoop全部jar包”通常包括以下...

    eclipse-java-mars-1-linux-gtk-x86_64.tar.gz

    对于Hadoop开发,Eclipse提供了插件Hadoop Map/Reduce Client,这使得在Eclipse内编写、测试和调试Hadoop MapReduce程序成为可能。要安装这个插件,开发者可以在Eclipse中通过“Help” -> “Install New Software” ...

    hadoop-eclipse-plugin-2.7.4

    Hadoop Eclipse Plugin 2.7.4是专为Hadoop 2.7.4版本设计的一款集成开发工具,它使得开发者能够在Eclipse环境中直接编写、调试和运行MapReduce程序,极大地提升了开发效率和便利性。在Hadoop 2.7.3版本中,一些用户...

    hadoop-eclipse-plugin-3.2.1.jar

    hadoop-eclipse-plugin.jar插件基于Ubuntu18.04和Hadoop-3.2.1编译的,最后可以在eclipse创建Map Reduce文件

    eclipse-hadoop3x-master.rar

    大数据是当今的一个热门话题,相信搞JAVA的我们当然不能错过了,尤其是...hadoop可以不用eclipse插件也可以运行,但当然,对于我们初学的,有个插件肯定好很多,我们可以集中精力先让它跑起来,然后再慢慢去深入研究。

Global site tag (gtag.js) - Google Analytics