1、 安装开发hadoop插件
将hadoop安装包hadoop\contrib\eclipse-plugin\hadoop-0.20.2-eclipse-plugin.jar拷贝到eclipse的插件目录plugins下。
需要注意的是插件版本(及后面开发导入的所有jar包)与运行的hadoop一致,否则可能会出现EOFException异常。
重启eclipse,打开windows->open perspective->other->map/reduce
可以看到map/reduce开发视图。
2、设置连接参数
打开windows->show view->other-> map/reduce Locations视图,在控制台新建hadoop location
(1)General选项卡各个参数说明:
Location name:本地视图的location名称,自己自定义一个名称即可
Map/Reduce Master组内 host和port: 为 Map/Reduce Master的地址与端口号,此地址端口与hadoop服 务器安装配置过程中 conf/mapred-site.xml文件中 mapred.job.tracker节点值一致。
DFS Master组内host和port: 此为HDFS服务器Master的地址与端口号, 此地址与hadoop服务器安装配置 过程中 conf /core-site.xml文件中 fs.default.name节点值一致。
Username: 远程hadoop服务器登陆用户名。
SOCKS proxy: 如果登陆hadoop服务器需要代理的话,此组填入代理服务器的地址和端口
(2)Advanced parameters选项卡部分参数说明(各个未提及参数请参见hadoop官方文档):
fs.defualt.name:与core-site.xml里fs.default.name设置一致。
mapred.job.tracker:与mapred-site.xml里面mapred.job.tracker设置一致。
dfs.replication:与hdfs-site.xml里面的dfs.replication一致。
hadoop.tmp.dir : HDFS文件存取缓存目录, 此项与hadoop服务器安装配置过程中 conf /core-site.xml文件中 hadoop.tmp.dir节点值一致。
dfs.name.dir: HDFS 的namenode 节点 name存储目录,此项与hadoop服务器安装配置过程中 conf /hdfs-site.xml文件中dfs.name.dir节点值一致。 如此节点未配置,取默认选项 ${ hadoop.tmp.dir }/dfs/name, 此目录 namenode节点上出现
fs.data.dir : HDFS的datanode节点data存储目录,此项hadoop服务器安装配置过程中 conf /hdfs- site.xml文件中dfs.data.dir节点值一致。如此节点未配置,取默认选项 ${ hadoop.tmp.dir }/dfs/data,此目 录在各 datanode节点上出现
Hadoop.job.ugi: 登陆HDFS用户及用户组,使用格式为: 用户名,用户组
问题:
用eclipse连接HDFS但是报Error:failure to login错误:
试试先把原来的那个plugin jar文件从Eclipse/plugins删除,启动eclipse,关闭eclipse,再把修改过的plugin复制到Eclipse/plugins/,启动eclipse,应该就可以了。估计是plugin被eclipse cach住了
分享到:
相关推荐
Hadoop伪分布式部署文档是指在单台机器上模拟分布式Hadoop集群的部署文档,包括服务器伪分布式部署、本地Hadoop开发环境部署、Eclipse远程连接Hadoop服务器等内容。下面是该文档的详细解释: 首先,需要安装JDK,...
- 通过Eclipse可以直接对远程Hadoop文件系统执行各种操作,如上传、下载文件,创建目录等。 三、Hadoop编程实战 1. **WordCount示例**: - WordCount是Hadoop入门的经典示例,用于统计文本中单词的出现次数。 -...
为了在Eclipse中调试和运行Hadoop程序,你需要安装Hadoop插件(如Hadoop插件for Eclipse或Eclipse for Big Data Developers),同时确保`HADOOP_HOME`已经正确配置,这样Eclipse才能正确地构建和连接到Hadoop集群。...
- 使用IDE(如Eclipse或IntelliJ IDEA)的远程调试功能,设置与`HADOOP_OPTS`中指定的地址相同的调试端口。 - 当作业运行时,IDE将自动连接到运行中的Java进程,从而可以在Win7上进行远程调试。 8. **监控和故障...
你需要确保已经安装并配置好Eclipse,同时在本地或远程服务器上安装了Hadoop环境。确保Hadoop集群运行正常,且Eclipse已配置好Hadoop的SDK,这样可以在Eclipse中直接创建和运行Hadoop项目。 接着,创建一个Hadoop...
利用Windows7作为主机,通过VMware虚拟化技术运行Fedora操作系统,并在此环境中搭建Hadoop和HBase的伪分布式环境,最后在Windows下的Eclipse中配置相应的开发环境以进行远程调试。 一、环境版本要求和准备 为了...
- 配置Eclipse的Hadoop连接,包括Hadoop的安装路径、HDFS URL、JobTracker(如果是旧版Hadoop)或ResourceManager地址。 - 创建Hadoop项目,选择适当的模板,如MapReduce或Spark项目。 6. **编写和运行Hadoop程序...
- 实现与Linux服务器的SSH连接,允许开发者通过Eclipse安全地执行命令,如启动、停止Hadoop服务。 - 提供HDFS的图形化浏览和管理,包括文件上传、下载、查看属性等操作。 - 可能有日志查看和任务监控功能,帮助...
使用Eclipse搭建Hadoop集群,首先需要在本地或远程服务器上配置好Hadoop环境,包括安装Java、配置Hadoop环境变量以及初始化HDFS和YARN。在Eclipse中,开发者可以创建新的MapReduce项目,导入所需的Hadoop库,并编写...
4. **配置Hadoop连接**:在项目的`pom.xml`文件中,添加Hadoop版本信息,并配置Hadoop的本地或远程运行环境,包括Hadoop的依赖库路径、HDFS地址等。 5. **编写MapReduce程序**:根据需求编写Map和Reduce类,继承自...
- 在搜索框中输入“ssh”,找到并勾选`openssh`相关的包,这将包含ssh服务器和客户端,用于Hadoop集群间的远程登录。 - 搜索其他必要的工具,如`tar`、`gzip`、`wget`等,它们在处理Hadoop相关的压缩文件和网络...
综上所述,搭建Hadoop与Eclipse的开发环境需要精确地配置Hadoop插件和连接参数,以确保Eclipse能够有效地与Hadoop集群通信。在遇到问题时,应检查配置和权限设置,以确保顺利进行Hadoop应用的开发工作。
2. **安装Hadoop**: 在本地或者远程服务器上安装Hadoop,并确保其正确启动并运行。这包括配置Hadoop的环境变量,如`HADOOP_HOME`,以及初始化NameNode和DataNode。 3. **安装Hadoop插件**: Eclipse有插件支持Hadoop...
这个插件简化了Hadoop项目开发过程,使得在本地或远程Hadoop集群上测试和部署应用变得更加便捷。 Hadoop-Eclipse-2.7.3插件是针对Hadoop 2.7.3版本的,这个版本引入了许多改进和优化,包括性能提升、错误修复以及对...
通过配置IDE,可以模拟远程Hadoop集群的行为,直接在本地运行和调试MapReduce任务,极大地提高了开发效率。 在Windows上远程执行Linux服务器上的Hadoop集群,通常需要借助SSH(Secure Shell)协议,允许用户在本地...
此时,需要在`Advanced parameters`中更新`hadoop.job.ugi`的值,确保它与远程Hadoop系统的用户和组匹配。 6. **运行Hadoop程序** - 将Hadoop安装包下的所有jar包导入到Eclipse工程中。 - 创建一个新的Java类,如...
#### 三、使用Eclipse连接Hadoop进行开发 在完成Hadoop的安装与配置后,下一步是使用Eclipse进行Hadoop应用的开发。 1. **下载Hadoop插件**: Eclipse有一个名为Hadoop Development Tools (HDT) 的插件,可以在...