本文参考了:http://www.douban.com/note/193721760/ 博文(在此感谢博主),该文中提到的参考文章地址:http://zettadata.blogspot.com/2011/12/eclipsenutch.html或http://peigang.iteye.com/blog/1682107无法打开(原因你懂的)我想办法打开了,参考个文章后将自己的配置过程记录下来,以供大家使用。
一、软件环境:
1、操作系统WindowsSp3
2、http://www.eclipse.org/downloads/ (MyEclipse安装Ivy存在问题,具体情况不明,建议使用eclipse官方版本)
3、JDK1.6*
4、SVN1.6*
5、IvyDE (安装参考:http://peigang.iteye.com/blog/1465410
)
二、安装:
安装MyEclipse,国内的大都喜欢用这个还是D版的,自己百度一下然后破解。
安装SVN插件参考http://peigang.iteye.com/blog/1461786
。
三、安装NUTCH:
1、 MyEclipse中选择File > New > Project > SVN > Checkout Projects from SVN
2、Create new repository location > https://svn.apache.org/repos/asf/nutch/trunk
3、选择根节点并选择Finish
4、从弹出窗口中选择Java > Java Project > next
5、设置项目名称为nutch,并确认选择参数 create separate folders for sources and class files ,点击NEXT
6、设置Default output folder 选项为 nutch/bin 点击 Finish.
7、svn checkout nutch
8、checkout完毕后不要编译,确认
四、配置nutch环境
工程nutch上点击右键选择如下目录:
2、在弹出的窗口中选择Source选项卡,删除nutch/src目录,然后点击Add Folder新增目录。
3、
Add Folder
窗口中选择src/bin, src/java, src/test , src/testresources.
4、展开nutch/src/plugin目录并将每个子目录中src/java、src/test选中
选择完毕后点击ok,返回下图:
5、 选择Libraries选项,点击Add JARs按钮,新增src/plugin/urlfilter-automaton/lib/automaton.jar 及
src/plugin/parse-swf/lib/javaswf.jar
6、Libraries中选择Add Library
To be continue;
分享到:
相关推荐
本文将详细介绍如何在Windows环境下配置Nutch 1.4,并使用Eclipse进行开发。以下是你需要知道的关键步骤: 1. **安装JDK**: 在配置Nutch之前,首先确保已安装Java Development Kit (JDK)。这里推荐使用JDK 1.6。...
- **操作系统:** 二次开发Nutch 1.7时,开发阶段的操作系统选择相对灵活,只要确保安装了JDK和Eclipse即可。 - **JDK:** 需要安装Java Development Kit,这是进行Java开发的基础环境。 - **Eclipse:** 作为主要的...
为了开始Nutch插件的开发工作,首先需要搭建一个适合的开发环境。这通常包括安装Java开发工具包(JDK)、Apache Ant构建工具以及Apache Nutch本身。此外,还需要安装其他可能需要的开发工具,如IDE(集成开发环境)或...
部分内容介绍了如何利用开源工具快速搭建具有搜索功能的系统,具体涵盖了Nutch和Lucene的基础知识及其在搜索引擎开发中的应用。 #### 二、Nutch与Lucene简介 1. **Lucene系统概述**: - **背景**: Lucene是由Doug ...
Nutch 与 Eclipse 结合开发时,通常需要先搭建 Hadoop 环境,因为 Nutch 基于 Hadoop 分布式计算框架,Hadoop 提供了数据存储和处理的能力。开发者需要了解 Hadoop 的基本命令和集群管理,确保 Nutch 在 Hadoop 上的...
- 在进行配置之前,确保已经安装了必要的软件,如Java环境(推荐使用Java 1.6以上版本)、Eclipse等开发工具。 - 下载并解压Nutch 1.2源码包。 2. **配置构建路径** - 打开Eclipse,导入Nutch 1.2项目。 - 在...
本教程旨在介绍如何搭建Nutch环境以及执行基本的爬虫任务。 **准备工作**: 1. **操作系统**:本教程要求在Linux环境下进行,因此你需要一台Linux机器或虚拟机。 2. **JDK安装**:推荐使用JDK 1.7版本。可以通过`...