hadoop-eclipse开发环境搭建及error: failure to login错误
分类: hadoop 2012-10-20 23:22 191人阅读 评论(0) 收藏 举报
对于Hadoop开发者来讲,通过JAVA API编程是进入Map-Reduce分布式开发的第一步。由于Eclipse本身并没有提供对MapReduce编程模式的支持,所以需要一些简单的步骤来实现。
1. 安装Hadoop。
本文的Hadoop是部署在虚拟机上的伪分布模式。相关软件环境如下:
JDK: sun jdk1.6.0_30
Hadoop: hadoop-0.20.203.0
Linux: Ubuntu 11.10
Eclipse: Eclipse Indigo 3.7.1
关于Hadoop伪分布环境的具体配置方式,此处不再赘述。设置方面,core-site.xml中fs.default.name中填写的是hdfs://localhost:9000
2. 设置环境
在终端中输入
$ sudo vim /etc/profile
修改运行环境,在文件最尾添加如下内容:
export HADOOP_HOME=/home/wangyucao/hadoop-0.20.203.0 (此处即为hadoop的安装目录)
export PATH=$PATH:#HADOOP_HOME/bin
3. 安装Eclipse
在Ubuntu软件中心搜索Eclipse进行安装,或者通过官网下载Eclipse归档文件。此处选择通过官网下载,得到:
eclipse-jee-indigo-SR1-linux-gtk.tar.gz
解压该文件,并放在/usr目录下:
$ tar -zxvf eclipse-jee-indigo-SR1-linux-gtk.tar.gz
$ sudo mv eclipse /usr/
完成安装步骤。
4. 安装hadoop-eclipse插件
hadoop的发行版本中都包含了hadoop-eclipse-plugin插件。在开发hadoop应用时,需要首先安装该Eclipse插件。
看到网上的教程,一般都是说直接将HADOOP_HOME/lib中的 hadoop-eclipse-plugin-0.20.203.0.jar 复制到eclipse安装目录下的plugins目录中。但是在我实践尝试中,发现hadoop-0.20.203.0版本的该包如果直接复制到eclipse的插件目录中,在连接DFS时会出现错误,提示信息为: "error: failure to login",弹出的错误提示框内容为"An internal error occurred during: "Connecting to DFS hadoop". org/apache/commons/configuration/Configuration". 经过察看Eclipse的log,发现是缺少jar包导致的。进一步查找资料后,发现直接复制hadoop-eclipse-plugin-0.20.203.0.jar,该包中lib目录下缺少了jar包。
经过网上资料搜集,此处给出正确的安装方法:
首先要对hadoop-eclipse-plugin-0.20.203.0.jar进行修改。用归档管理器打开该包,发现只有commons-cli-1.2.jar 和hadoop-core.jar两个包。将HADOOP_HOME/lib目录下的 commons-configuration-1.6.jar , commons-httpclient-3.0.1.jar , commons-lang-2.4.jar , jackson-core-asl-1.0.1.jar 和 jackson-mapper-asl-1.0.1.jar 等5个包复制到hadoop-eclipse-plugin-0.20.203.0.jar的lib目录下,如下图:
然后,修改该包META-INF目录下的MANIFEST.MF,将classpath修改为一下内容:
Bundle-ClassPath: classes/,lib/hadoop-core.jar,lib/commons-cli-1.2.jar,lib/commons-httpclient-3.0.1.jar,lib/jackson-core-asl-1.0.1.jar,lib/jackson-mapper-asl-1.0.1.jar,lib/commons-configuration-1.6.jar,lib/commons-lang-2.4.jar
如下图:
这样就完成了对hadoop-eclipse-plugin-0.20.203.0.jar的修改。
最后,将hadoop-eclipse-plugin-0.20.203.0.jar复制到Eclipse的plugins目录下:
$ cd ~/hadoop-0.20.203.0/lib
$ sudo cp hadoop-eclipse-plugin-0.20.203.0.jar /usr/eclipse/plugins/
5. 在Eclipse中对该插件进行配置。
首先,打开Eclipse,设置好workspace。
选择window -> open perspective -> Other... , 选择有大象图标的 Map/Reduce.
此时,就打开了Map/Reduce的开发环境。可以看
到,右下角多了一个Map/Reduce Locations的框。如下图:
然后,设置Hadoop的环境参数。选择Map/Reduce Locations 标签,点击该标签最右边的大象图标,即那个齿轮状图标右侧的大象图标,打开参数设置页面,参数填写如下图:
Location Name : 此处为参数设置名称,可以任意填写
Map/Reduce Master (此处为Hadoop集群的Map/Reduce地址,应该和mapred-site.xml中的mapred.job.tracker设置相同)
Host: localhost
port: 9001
DFS Master (此处为Hadoop的master服务器地址,应该和core-site.xml中的 fs.default.name 设置相同)
Host: localhost
Port: 9000
设置完成后,点击Finish就应用了该设置。
此时,在最左边的Project Explorer中就能看到DFS的目录,如下图所示。
到这里,就完成了hadoop插件的设置过程。
分享到:
相关推荐
Hadoop-Eclipse-Plugin 2.8.0的出现,反映了Hadoop生态系统从Hadoop 1到Hadoop 2的重大转变,尤其是在资源管理和任务调度方面的改进。同时,这也意味着对于那些已经习惯了Eclipse或MyEclipse的开发者来说,他们无需...
Eclipse Hadoop2 插件是为开发人员提供的一种强大工具,它允许用户在Eclipse集成开发环境中(IDE)直接编写、调试和管理Hadoop项目。这个插件针对Hadoop 2.x版本进行了优化,提供了丰富的功能来简化Hadoop应用程序的...
hadoop eclipse插件 cdh3版本
Hadoop Eclipse是Hadoop开发环境的插件,用户在创建Hadoop程序时,Eclipse插件会自动导入Hadoop编程接口的jar文件,这样用户就可以在Eclipse插件的图形界面中进行编码、调试和运行Hadop程序,也能通过Eclipse插件...
hadoop eclipse 插件2.6.0 开发hadoop必备的插件 值得下载
hadoop eclipse build
2. **配置Hadoop环境**:在Eclipse中,需要配置Hadoop的运行环境,包括Hadoop的安装路径、HDFS地址等信息。 3. **创建Hadoop项目**:在Eclipse的“文件”菜单中选择“新建” -> “其他”,在弹出的对话框中找到...
Eclipse是流行的Java集成开发环境(IDE),而Hadoop-Eclipse插件是将Hadoop与Eclipse结合的工具,允许开发者在Eclipse中直接创建、运行和调试Hadoop MapReduce程序。这些文件"hadop-eclipse-plugin-2.5.2.jar"、...
2. **Eclipse IDE**:Eclipse是一款广泛使用的Java集成开发环境,支持多种语言和插件,为开发者提供了丰富的工具和功能,便于代码编写、调试和测试。 3. **Hadoop-Eclipse插件功能**: - **项目创建**:通过插件,...
《Hadoop Eclipse Plugin 2.7.4:MapReduce编程的得力助手》 Hadoop Eclipse Plugin 2.7.4是专为Hadoop 2.7.4版本设计的一款集成开发工具,它使得开发者能够在Eclipse环境中直接编写、调试和运行MapReduce程序,极...
2. **Eclipse集成的重要性** 在传统的开发模式下,Hadoop应用的开发需要在命令行环境中进行,这给开发者带来了不少困扰。Hadoop Eclipse Plugin的出现解决了这个问题,它允许开发者在Eclipse的图形用户界面内完成...
Hadoop Eclipse插件是开发Hadoop MapReduce程序的重要工具,它允许开发者在本地Eclipse集成开发环境中直接编写、测试和调试Hadoop作业,极大地提高了开发效率。以下是对这个插件的详细说明: 首先,安装Hadoop ...
Hadoop-Eclipse-Plugin-3.1.1是一款专为Eclipse集成开发环境设计的插件,用于方便地在Hadoop分布式文件系统(HDFS)上进行开发和调试MapReduce程序。这款插件是Hadoop生态系统的组成部分,它使得Java开发者能够更加...
7. **版本兼容性**:Hadoop Eclipse Plugin 2.6.5支持Hadoop 2.x系列,这意味着它可以与大多数现代Hadoop集群配合使用。 总之,Hadoop Eclipse Plugin 2.6.5是Hadoop开发者不可或缺的工具,它简化了Hadoop作业的...
Eclipse集成Hadoop2.10.0的插件,使用`ant`对hadoop的jar包进行打包并...- `hadoop2x-eclipse-plugin-master/src/contrib/eclipse-plugin/build.xml` 开源源地址: https://github.com/winghc/hadoop2x-eclipse-plugin
2. **可视化集群管理**:查看和管理Hadoop集群的节点状态,包括数据节点、任务节点等,方便进行故障排查和资源调度。 3. **提交和监控Job**:编写完MapReduce程序后,可以直接在Eclipse内提交Job到Hadoop集群,并...
而2.6.0版本则可能引入了对Hadoop 2.x系列的兼容,其中YARN(Yet Another Resource Negotiator)取代了JobTracker,负责集群资源管理和调度,提高了系统的灵活性和资源利用率。 2.7.x系列是Hadoop的稳定版本,2.7.3...
2. **代码编辑与编译**:Eclipse的优秀代码编辑和自动完成功能得以保留,帮助开发者编写高质量的MapReduce代码。 3. **远程调试**:这是该插件的一大亮点,开发者可以设置断点,对运行在远程Hadoop集群上的MapReduce...
2. **项目创建与编辑**:安装插件后,Eclipse会新增Hadoop相关的项目类型,如"Hadoop Map/Reduce Project"。开发人员可以创建这样的项目,编写MapReduce程序。插件提供了对Hadoop API的自动补全和语法高亮,使得编码...
2. **下载与安装Eclipse**:选择适用于Java开发的Eclipse版本,如Eclipse IDE for Java Developers,并进行安装。确保你的Eclipse版本与你的Java版本兼容。 3. **获取Hadoop Eclipse plugin**:找到并下载hadoop-...