Hadoop版本:1.0.0
安装ECLIPSE的HADOOP 1.0.0版本的插件
1) Hadoop的Eclipse插件和Eclipse的版本关联性比较大,各版本间可能不兼容。网上搜索发现提供下载的1.0.0插件都是支持Eclipse3.7的。下载安装Eclipse3.7版本(Indigo 版本)。
2) 在Hadoop 1.0.0 版本的安装目录下,系统并没有提供hadoop-eclipse-plugin-1.0.0.jar插件。可以通过别的方法获得:
a) 在安装的目录下 src/contrib/eclipse路径下相关的源码,通过编译该源码,可以得到该插件。
b) 在csdn上面有hadoop-eclipse-plugin-1.0.0.jar 插件下载。下载网址:http://download.csdn.net/download/lwj_dx/4061857
3) 如果直接将下载hadoop-eclipse-plugin-1.0.0.jar复制到eclipse的插件目录中,在连接DFS时会出现错误,提示信息为: "error: failure to login",弹出的错误提示框内容为"An internal error occurred during:
"Connecting to DFS hadoop".
org/apache/commons/configuration/Configuration". 经过察看Eclipse的log,发现是缺少jar包导致的。进一步查找资料后,发现直接复制hadoop-eclipse-plugin-1.0.0.jar,该包中lib目录下缺少了jar包。
4) 首先要对hadoop-eclipse-plugin-1.0.0.jar进行修改。用归档管理器打开该包,发现只有commons-cli-1.2.jar
和hadoop-core.jar两个包。将HADOOP_HOME/lib目录下的 commons-configuration-1.6.jar , commons-httpclient-3.0.1.jar ,
commons-lang-2.4.jar , jackson-core-asl-1.0.1.jar 和
jackson-mapper-asl-1.0.1.jar 等5个包复制到hadoop-eclipse-plugin-0.20.203.0.jar的lib目录下,如下图:
然后,修改该包META-INF目录下的MANIFEST.MF,将classpath修改为以下内容:
Bundle-ClassPath:
classes/,lib/hadoop-core.jar,lib/commons-cli-1.2.jar,lib/commons-httpclient-3.0.1.jar,lib/jackson-core-asl-1.0.1.jar,lib/jackson-mapper-asl-1.0.1.jar,lib/commons-configuration-1.6.jar,lib/commons-lang-2.4.jar
5) 安装插件就很简单了,把这个文件放到 Eclipse的安装目录下的plugins,重新启动Eclipse。
Eclipse开发Hadoop项目
1) 将hadoop1.0.0解压到开发系统的某个目录,如:
2)
首先,打开Eclipse,设置好workspace
3) 打开Window-->Preferens,你会发现Hadoop
Map/Reduce选项,在这个选项里你需要配置Hadoop installation directory。配置完成后退出。
4)
选择window -> open perspective -> Other... , 选择有大象图标的 Map/Reduce.
此时,就打开了Map/Reduce的开发环境。可以看到,右下角多了一个Map/Reduce Locations的框。如下图:
然后,设置Hadoop的环境参数。选择Map/Reduce
Locations 标签,点击该标签最右边的大象图标,即那个齿轮状图标右侧的大象图标,打开参数设置页面,参数填写如下图:
Location
Name :
此处为参数设置名称,可以任意填写
Map/Reduce
Master (此处为Hadoop集群的Map/Reduce地址,应该和mapred-site.xml中的mapred.job.tracker设置相同)
Host: 10.0.0.211
port: 9001
DFS
Master (此处为Hadoop的master服务器地址,应该和core-site.xml中的
fs.default.name 设置相同)
Host: 10.0.0.211
Port: 9000
设置完成后,点击Finish就应用了该设置。
此时,在最左边的Project
Explorer中就能看到DFS的目录,如下图所示。
注,如果当前登录windows的用户名和hadoop集群的用户名不一致,将没有权限访问,提示错误如下:
Exception in thread "main" org.apache.hadoop.security.AccessControlException: Permission denied: user=d, access=WRITE, inode="data":zxg:supergroup:rwxr-xr-x
at org.apache.hadoop.hdfs.server.namenode.FSPermissionChecker.check(FSPermissionChecker.java:207)
管理DFS system目录。目前做法是将hadoop服务集群关闭权限认证,修改hadoop安装
集群master的hadoop/conf/mapred-site.xml,增加:
<property>
<name>dfs.permissions</name>
<value>false</value>
</property>
正式发布时,可以在服务器创建一个和hadoop集群用户名一致的用户,即可不用修改master的permissions策略。
5) 新建项目:File-->New-->Other-->Map/Reduce Project ,项目名可以随便取,如HadoopTest
6) 将测试代码 src.zip解压到HadoopTest源码目录的src目录下,刷新项目源码目录结构如下:
Ejob.java: 一个开源库,实现自动加载hadoop配置文件并将JAVA程序打包成jar包发布到hadoop集群,其引用范例参见WordCountTest.java
有关Ejob介绍参见:http://www.cnblogs.com/spork/archive/2010/04/07/1706162.html
- 大小: 160.3 KB
- 大小: 153.3 KB
- 大小: 60 KB
- 大小: 31.5 KB
- 大小: 31.2 KB
- 大小: 58.1 KB
- 大小: 75.5 KB
- 大小: 25.4 KB
分享到:
相关推荐
至此,你已经在Win7+Eclipse+Ubuntu的环境中搭建起了Hadoop的单机开发环境。你可以使用Eclipse的Hadoop插件(如Hadoop Eclipse Plugin)来编写、调试和运行Hadoop MapReduce程序。记住,这只是一个基本的配置,实际...
在所有这些配置完成后,你将拥有一个完整的Hadoop开发环境,可以在Windows 7上的Eclipse 4.7中编写、测试和调试Hadoop应用。Hadoop的分布式文件系统(HDFS)和MapReduce框架将为大数据处理提供强大的平台,而Eclipse...
### Hadoop 在 Win7 环境下的安装与配置 Hadoop 是一个开源软件框架,用于分布式存储和处理大规模数据集。本文档旨在提供在 Windows 7 操作系统上搭建 Hadoop 的详细步骤,帮助读者顺利搭建并测试 Hadoop 环境。 #...
在Windows 7操作系统中搭建Hadoop开发环境,...总之,搭建Win7上的Hadoop开发环境涉及下载和配置Hadoop,安装Eclipse插件,以及对相关文件进行适当修改。一旦完成,你就可以在Eclipse中愉快地开发和测试Hadoop应用了。
标题"hadop2+eclipse+win7开发所需环境"指的是在Windows 7操作系统上,使用Eclipse集成开发环境进行Hadoop 2.x应用程序的开发所需的一系列配置和工具。在这样的环境中,开发者可以编写、测试和调试Hadoop MapReduce...
搭建Windows 32位环境下Eclipse远程...通过上述步骤,可以在Windows 32位环境下成功搭建一个远程Hadoop开发环境,使用Eclipse进行Hadoop程序的编写、调试与运行。这样的环境搭建对于学习和开发Hadoop应用是至关重要的。
在Windows 7操作系统中编译Eclipse Hadoop Plugin是一个对开发者而言非常实用的过程,这个插件可以帮助用户在Eclipse集成开发环境中更方便地管理和调试Hadoop项目。在本节中,我们将深入探讨如何在Windows 7环境下...
在本文中,我们将深入探讨如何在Windows 7 32位系统上配置...遵循上述步骤,解决可能出现的错误,你将能够搭建一个可靠的Hadoop开发环境。记得在过程中遇到问题时,查阅官方文档或在线社区的资源,以便获取更多帮助。
总的来说,"hadoop-2.7.7-win7x64"是一个方便在Windows环境下进行Hadoop开发的资源包。通过合理的配置和理解Hadoop的核心概念,用户可以在本地进行大数据处理的实践和学习,为后续的集群部署和大数据应用打下坚实的...
在开发和测试过程中,开发者可能会使用Eclipse、IntelliJ IDEA等集成开发环境(IDE)配合Hadoop插件,使得调试和运行MapReduce程序更加便捷。此外,Hadoop的YARN资源管理器允许开发者管理和调度计算任务,以优化资源...
9. **开发与调试**: 开发Hadoop应用时,IDE如IntelliJ IDEA或Eclipse可以提供插件支持,便于编写、调试和部署MapReduce程序。此外,使用Hadoop的命令行工具或Web界面来监控HDFS和MapReduce作业的状态。 10. **社区...
【Hadoop在win7详细安装】的文档主要涵盖了在Windows 7环境下安装和配置Hadoop所需的基本步骤,其中涉及到的IT知识点包括: 1. **VirtualBox的安装与配置**: - VirtualBox是一款强大的免费虚拟机软件,因其体积...
6. **集成开发环境(IDE)支持**: - 对于开发和测试,可以使用Eclipse、IntelliJ IDEA等IDE的Hadoop插件,方便地编写和调试MapReduce程序。 7. **注意事项**: - Windows与Unix/Linux的文件路径格式不同,需要...
在描述中,用户提到自己在Linux环境下搭建了一个分布式Hadoop集群,并在32位Windows 7操作系统中使用Eclipse进行开发工作。通常情况下,Hadoop及其相关工具主要为64位系统设计,因此在32位系统上运行可能需要特别...
而"开发工具有IDEA,Eclipse插件"意味着,对于使用IntelliJ IDEA或Eclipse作为集成开发环境(IDE)的开发者来说,有相应的插件支持,可以方便地进行Hadoop应用的开发和调试。 在【压缩包子文件的文件名称列表】中,...
7. **集成开发环境(IDE)**: 如果你打算在Windows上进行Hadoop开发,可能还需要安装支持Hadoop的IDE,如IntelliJ IDEA或Eclipse,以及相关的插件,如Hadoop插件或Apache Spark和Hadoop插件。 8. **SSH客户端**: 虽然...
这些知识点涵盖了JavaEE网络应用开发所需的基本环境搭建流程、数据库配置、项目导入与配置、工程功能需求说明以及技术支持等方面的内容。这对于理解和掌握如何使用JavaEE技术开发云存储网盘具有重要的参考价值。
例如,可以在Windows环境下使用Eclipse远程连接至Hadoop集群进行程序开发。 5. **常见问题及解决方法**: - 缺少`winutils.exe`或`hadoop.dll`等问题是常见的错误之一。这些问题可以通过下载相应的二进制文件解决...