在eclipse下运行Map-Reduce程序:
1,在eclipse新建项目。
File-->New-->Other-->Map/Reduce
Project
项目名可以随便取,如
HadoopTest
。
复制
hadoop
安装目录
/src/example/org/apache/hadoop/example/WordCount.java
到刚才新建的项目下面。
2
上传模拟数据文件夹。
为了运行程序,我们需要一个输入的文件夹,和输出的文件夹。输出文件夹,在程序运行完成后会自动生成。我们需要给程序一个输入文件夹。
在当前目录(如
hadoop
安装目录)下新建文件夹
input
,并在文件夹下新建文件
file0
1
,文件内容如下:
hello map-reduce eclipse goodbye
1>在已经启动
Hadoop
守护进程终端中
cd
到
hadoop
安装目录,运行下面命令:
bin/hadoop fs -put input input01
or hadoop fs -put input input01
2>这个命令将
input
文件夹上传到了
hadoop
文件系统了,在该系统下就多了一个
input01
文件夹,你可以使用下面命令查看:
bin/hadoop fs -ls or hadoop fs -ls
3>
在新建的项目
HadoopTest
,点击
WordCount.java
,右键
-->Run
As-->Run Configurations
4>
在弹出的
Run
Configurations
对话框中,点
Java
Application
,右键
-->New
,这时会新建一个
application
名为
WordCount
5>
配置运行参数,点
Arguments
,在
Program
arguments
中输入“你要传给程序的输入文件夹和你要求程序将计算结果保存的文件夹”,如:
hdfs://localhost:9000/user/hadoop/input01 hdfs://localhost:9000/home/hadoop/Desktop/data/output01
6>
点击
Run
,运行程序
7>查看运行结果:
hadoop fs -ls /home/hadoop/Desktop/data
8>查看内容
hadoop fs -cat /home/hadoop/Desktop/data/output01/*
分享到:
相关推荐
为了能够在Eclipse IDE中开发和调试Map-Reduce程序,需要配置Eclipse与Hadoop集群之间的连接。 **1. 安装Hadoop插件** - Eclipse Marketplace中搜索并安装Hadoop插件。 - 配置插件以指向Hadoop安装目录。 **2. ...
3. **验证安装**: 重启Eclipse后,如果插件安装成功,你可以在`File` -> `New` -> `Project`中看到新的模板,如"Hadoop Map/Reduce Project"。 4. **配置Hadoop连接**: 在创建新的Hadoop Map/Reduce项目时,需要...
Hadoop-Eclipse-Plugin-3.1.1是一款专为Eclipse集成开发环境设计的插件,用于方便地在Hadoop分布式文件系统(HDFS)上进行开发和调试MapReduce程序。这款插件是Hadoop生态系统的组成部分,它使得Java开发者能够更加...
Hadoop-Eclipse插件是将Hadoop的功能与Eclipse IDE结合的工具,它使得开发人员能够在Eclipse环境中直接编写、调试和运行Hadoop MapReduce程序,极大地提升了开发效率。 标题中的"hadoop-eclipse2.7.1、hadoop-...
通过ODPS Eclipse插件,开发者可以直接在Eclipse中编写和测试MapReduce程序,无需离开熟悉的开发环境。 SQL也是ODPS的重要部分,它提供了SQL-on-Hadoop的功能,使得开发者可以用SQL语句来查询和分析ODPS中的大数据...
在实际操作中,我们需要配置Hadoop集群的设置,如HDFS的存储路径、JobTracker的位置等,然后通过Eclipse运行Hadoop作业,启动爬虫程序。 总的来说,这个项目涵盖了分布式系统、大数据处理、网络爬虫等多个IT领域的...
在Java应用程序的主类上右键单击,选择“Run As” -> “Map/Reduce Job”,然后选择本地运行或连接到远程集群。 6. **连接到Hadoop集群**:如果你的开发环境不在Hadoop集群上,可以通过配置Eclipse连接到远程集群。...
另外,它还支持直接在Eclipse中启动和停止Job,以及调试Map和Reduce函数,这对于调试和优化代码来说是非常重要的。 Hadoop-Eclipse-Plugin-2.6.4版本是针对Hadoop 2.x系列的,因此,它支持YARN资源管理器,这使得在...
- 在MyEclipse中新建一个Map/Reduce项目,并配置本地Hadoop主目录。 - MyEclipse会自动加载所需的jar包。 2. **编写WordCount程序**: - 从网络下载WordCount示例代码。 - 在MyEclipse的“Run Configurations”...
Eclipse是流行的Java集成开发环境(IDE),而Hadoop-Eclipse插件是将Hadoop与Eclipse结合的工具,允许开发者在Eclipse中直接创建、运行和调试Hadoop MapReduce程序。这些文件"hadop-eclipse-plugin-2.5.2.jar"、...
安装完成后,用户会在Eclipse的"New"菜单中看到"Hadoop Map/Reduce Project"选项,这标志着插件已成功安装并可使用。 使用Hadoop Eclipse Plugin,开发者可以进行以下操作: 1. **创建Hadoop项目**:选择“File” ...
重启Eclipse后,你会发现在"File"菜单下多了"New" -> "Other" -> "Hadoop Map/Reduce Project"的选项,这就是Hadoop Eclipse Plugin所带来的变化。通过这个选项,你可以创建一个专门针对Hadoop的MapReduce项目,设置...
Eclipse作为流行的Java集成开发环境,配合Hadoop-Eclipse Plugin,使得在Eclipse中编写、调试和运行MapReduce程序变得非常方便。 ### 实验目的 1. 学习如何在Ubuntu/CentOS系统上使用Eclipse开发MapReduce程序。 2....
重启后,Eclipse会自动识别并加载该插件,此时,在"File"菜单中选择"New" -> "Project",就可以看到"Hadoop Map/Reduce Project"选项。 4. **使用插件开发MapReduce** - **创建项目**:通过插件,开发者可以轻松...
3. **创建项目**:在Eclipse中,创建一个新的Java项目,选择“Map/Reduce”作为项目类型。这样,Eclipse会自动添加一些基础的MapReduce类库。 4. **导入jar包**:标题和描述提到的“Hadoop全部jar包”通常包括以下...
对于Hadoop开发,Eclipse提供了插件Hadoop Map/Reduce Client,这使得在Eclipse内编写、测试和调试Hadoop MapReduce程序成为可能。要安装这个插件,开发者可以在Eclipse中通过“Help” -> “Install New Software” ...
Hadoop Eclipse Plugin 2.7.4是专为Hadoop 2.7.4版本设计的一款集成开发工具,它使得开发者能够在Eclipse环境中直接编写、调试和运行MapReduce程序,极大地提升了开发效率和便利性。在Hadoop 2.7.3版本中,一些用户...
hadoop-eclipse-plugin.jar插件基于Ubuntu18.04和Hadoop-3.2.1编译的,最后可以在eclipse创建Map Reduce文件
大数据是当今的一个热门话题,相信搞JAVA的我们当然不能错过了,尤其是...hadoop可以不用eclipse插件也可以运行,但当然,对于我们初学的,有个插件肯定好很多,我们可以集中精力先让它跑起来,然后再慢慢去深入研究。