我的环境:
Win7
Eclipse3.7
Hadoop0.20.2
Jdk1.6.10
在eclipse下安装开发hadoop程序的插件
安装这个插件很简单,haoop-0.20.2自带一个eclipse的插件,在hadoop目录下的 contrib\eclipse-plugin\hadoop-0.20.2-eclipse-plugin.jar,把这个文件copy到 eclipse的eclipse\plugins
目录下,然后启动eclipse就算完成安装了。
这里说明一下,haoop-0.20.2自带的eclipse的插件只能安装在eclipse 3.3上才有反应,而在eclipse 3.7上运行hadoop程序是没有反应的,所以要针对eclipse 3.7重新编译插件。
另外简单的解决办法是下载第三方编译的eclipse插件,下载地址为:
http://code.google.com/p/hadoop-eclipse-plugin/downloads/list
由于我用的是Hadoop-0.20.2,所以下载hadoop-0.20.3-dev-eclipse-plugin.jar.
然后将hadoop-0.20.3-dev-eclipse-plugin.jar重命名为hadoop-0.20.2-eclipse-plugin.jar,把它copy到eclipse的eclipse\plugins目录下,然后启动eclipse完成安装
安装cygin,启动…
解决Window环境下启动Hadoop时出现的 java.lang.NoClassDefFoundError: org/apache/hadoop/util/PlatformName 异常
只需要将${HADOOP_HOME}/bin/hadoop-config.sh文件中的第190行的一下的内容
JAVA_PLATFORM=`CLASSPATH=${CLASSPATH} ${JAVA} -Xmx32m ${HADOOP_JAVA_PLATFORM_OPTS} org.apache.hadoop.util.PlatformName | sed -e "s/ /_/g"`
修改成以下的内容即可
JAVA_PLATFORM=`CLASSPATH=${CLASSPATH} ${JAVA} -Xmx32m -classpath ${HADOOP_COMMON_HOME}/hadoop-common-0.21.0.jar org.apache.hadoop.util.PlatformName | sed -e "s/ /_/g"`
在cygwin上执行hadoop命令一切正常,如下这些命令执行结果都OK,在浏览器中访问http://localhost:50030也正常,但是在eclipse中运行wordcount时抛出:
hadoop/bin/hadoop fs -ls hdfs://localhost:9000/user/wb-gaobingying/input
Exception in thread "main" java.lang.RuntimeException: java.io.IOException: Call to localhost/127.0.0.1:9000 failed on local exception: java.io.EOFException
at org.apache.hadoop.mapred.JobConf.getWorkingDirectory(JobConf.java:371)
at org.apache.hadoop.mapred.FileInputFormat.setInputPaths(FileInputFormat.java:309)
at org.apache.hadoop.mapred.FileInputFormat.setInputPaths(FileInputFormat.java:282)
at WordCount.run(WordCount.java:117)
at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:65)
at WordCount.main(WordCount.java:125)
ecilpse中也有:
有人说这是客户端与服务端的hadoop版本不一致
此时我的客户端是0.20.2,服务端是0.21.0
于是把服务端也换成0.20.0了,但
Location下面都好了,但是还是一直停留在
这个问题我一直没解决,后来试了下new一个我的虚拟机ubuntu上的hadoop伪集群,ok了,如下:
Host:
Master 10.13.13.55
选中wordcount程序,
然后,选择Run on hadoop,界面如下,选择一个locaiton
启动报错如下:
03/29 16:30:09 INFO mapred.JobClient: Task Id : attempt_201303291556_0001_m_000003_0, Status : FAILED
org.apache.hadoop.security.AccessControlException: org.apache.hadoop.security.AccessControlException: Permission denied: user=taobao-hz\wb-gaobingying, access=WRITE, inode="hadoop":hadoop:supergroup:rwxr-xr-x
at sun.reflect.NativeConstructorAccessorImpl.newInstance0(Native Method)
at sun.reflect.NativeConstructorAccessorImpl.newInstance(Na
这个是因为Hadoop location中的 hadoop.job.uri的值没有改成hadoop,Tardis,其中hadoop是我的虚拟机的账号名.
重新启动,执行如下:
查看DFS Locations下已经有了本次job执行的结果:
- 大小: 12.1 KB
- 大小: 13.5 KB
- 大小: 50.1 KB
- 大小: 23.4 KB
- 大小: 130.2 KB
- 大小: 25.4 KB
分享到:
相关推荐
5. **hadoop远程调试.txt** - 文件名暗示了如何远程调试Hadoop程序,这对于开发者在分布式环境中解决问题至关重要,可能涵盖了使用IDE(如Eclipse)的远程调试配置和技巧。 6. **MR执行流程笔记.txt** - MapReduce...
9. **在Eclipse下开发HBase**:学习如何在Eclipse集成开发环境中编写和调试HBase应用程序。 10. **集群下开发HBase**:当对单机环境熟悉后,可以进一步学习如何在多节点集群上配置和使用HBase,包括数据分布、容错...
Eclipse插件是开发Hadoop应用的重要工具,它提供了集成的开发环境,使得开发者可以更方便地编写、调试和运行Hadoop程序。通过插件,用户可以创建Hadoop项目,编写MapReduce代码,并在本地模拟器或集群上运行,大大...
【Hadoop与Eclipse集成开发】 在进行大数据处理时,Hadoop是一个不可或缺的开源框架,而Eclipse作为...通过这种方式,开发者可以在熟悉的Eclipse环境中高效地调试和管理Hadoop项目,提高开发效率,同时便于团队协作。
最后,"如何把hadoop源码关联到eclipse工程中"是针对开发者的内容,说明如何将Hadoop的源代码导入Eclipse这样的集成开发环境,以便于学习、调试或修改Hadoop源码。这通常涉及到克隆Hadoop仓库,配置构建工具如Maven...
开发环境通常选择Eclipse。 **结构与概念** - **索引** - 由域名(词)和指向包含该词的文档的指针构成。 - **索引库** - 存储索引的文件夹,用户可自定义。 - **Term(词元)** - 代表单个词,是Lucene的基本单位...
此外,开发Go语言程序可以使用多种开发工具和IDE,如LiteIDE、Eclipse、Sublime等,这些工具支持代码高亮、智能提示、调试等功能,有助于提升开发效率。 在数据库连接方面,Go语言由于其轻量级和高性能的特点,被...
在笔记本电脑上安装和配置Java开发环境,通常需要以下几个步骤: 1. 下载Java开发工具包(Java Development Kit,JDK):Oracle提供免费的JDK下载,根据操作系统(Windows、macOS或Linux)选择合适的版本。 2. 安装...
7. **开发工具**: 笔记可能还会涉及常用的开发工具,如IDE(集成开发环境,如Visual Studio Code、Eclipse)、版本控制工具(如Git)、调试器、自动化工具(如Jenkins)等,这些都是现代开发人员必备的技能。...
1. **IDEA**:IntelliJ IDEA是一款流行的Java集成开发环境,提供了代码提示、调试、版本控制等多种功能,极大地提高了开发效率。 2. **Eclipse**:Eclipse是另一款广泛应用的Java IDE,它具有开放源码、插件丰富的...
1. 集成开发环境(IDE):Infosys开发者可能使用Eclipse、IntelliJ IDEA或者Visual Studio Code等IDE,这些工具提供了强大的代码编辑、调试和项目管理功能。 2. 测试工具:Infosys注重软件质量,JUnit、Selenium、...
9. **开发工具**:熟悉使用IDE(集成开发环境)如Eclipse或IntelliJ IDEA进行Java开发,以及版本控制工具如Git。 10. **单元测试**:学习JUnit或TestNG进行单元测试,确保代码质量。 通过这些内容的学习,Manuel ...