`
peigang
  • 浏览: 171550 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

Eclipse开发nutch环境搭建

 
阅读更多

本文参考了:http://www.douban.com/note/193721760/ 博文(在此感谢博主),该文中提到的参考文章地址:http://zettadata.blogspot.com/2011/12/eclipsenutch.html或http://peigang.iteye.com/blog/1682107无法打开(原因你懂的)我想办法打开了,参考个文章后将自己的配置过程记录下来,以供大家使用。

一、软件环境:

 

1、操作系统WindowsSp3

2、http://www.eclipse.org/downloads/ (MyEclipse安装Ivy存在问题,具体情况不明,建议使用eclipse官方版本)

3、JDK1.6*

4、SVN1.6*

5、IvyDE (安装参考:http://peigang.iteye.com/blog/1465410 )

 

二、安装:

安装MyEclipse,国内的大都喜欢用这个还是D版的,自己百度一下然后破解。

安装SVN插件参考http://peigang.iteye.com/blog/1461786

 

三、安装NUTCH:

 

 1、 MyEclipse中选择File > New > Project > SVN > Checkout Projects from SVN

 


 2、Create new repository location > https://svn.apache.org/repos/asf/nutch/trunk

 

 

 

3、选择根节点并选择Finish

 

 

4、从弹出窗口中选择Java > Java Project > next

 

5、设置项目名称为nutch,并确认选择参数 create separate folders for sources and class files ,点击NEXT

 

 
 6、设置Default output folder 选项为 nutch/bin 点击 Finish.

 

 
 7、svn checkout nutch



 
 8、checkout完毕后不要编译,确认

 

 四、配置nutch环境

 工程nutch上点击右键选择如下目录:

 

2、在弹出的窗口中选择Source选项卡,删除nutch/src目录,然后点击Add Folder新增目录。


 3、 Add Folder 窗口中选择src/bin, src/java, src/test , src/testresources.

 

 

4、展开nutch/src/plugin目录并将每个子目录中src/java、src/test选中



选择完毕后点击ok,返回下图:

5、 选择Libraries选项,点击Add JARs按钮,新增src/plugin/urlfilter-automaton/lib/automaton.jar 及 src/plugin/parse-swf/lib/javaswf.jar

 6、Libraries中选择Add Library

 

 

 

To be continue;

 

分享到:
评论

相关推荐

    Nutch配置环境\Nutch1[1].4_windows下eclipse配置图文详解.docx

    本文将详细介绍如何在Windows环境下配置Nutch 1.4,并使用Eclipse进行开发。以下是你需要知道的关键步骤: 1. **安装JDK**: 在配置Nutch之前,首先确保已安装Java Development Kit (JDK)。这里推荐使用JDK 1.6。...

    Nutch1.7二次开发培训讲义

    - **操作系统:** 二次开发Nutch 1.7时,开发阶段的操作系统选择相对灵活,只要确保安装了JDK和Eclipse即可。 - **JDK:** 需要安装Java Development Kit,这是进行Java开发的基础环境。 - **Eclipse:** 作为主要的...

    Nutch插件开发和服务器发布流程

    为了开始Nutch插件的开发工作,首先需要搭建一个适合的开发环境。这通常包括安装Java开发工具包(JDK)、Apache Ant构建工具以及Apache Nutch本身。此外,还需要安装其他可能需要的开发工具,如IDE(集成开发环境)或...

    nutch+lucene开发自己的搜索引擎ch3.pdf

    部分内容介绍了如何利用开源工具快速搭建具有搜索功能的系统,具体涵盖了Nutch和Lucene的基础知识及其在搜索引擎开发中的应用。 #### 二、Nutch与Lucene简介 1. **Lucene系统概述**: - **背景**: Lucene是由Doug ...

    Nutch简要文档

    Nutch 与 Eclipse 结合开发时,通常需要先搭建 Hadoop 环境,因为 Nutch 基于 Hadoop 分布式计算框架,Hadoop 提供了数据存储和处理的能力。开发者需要了解 Hadoop 的基本命令和集群管理,确保 Nutch 在 Hadoop 上的...

    Nutch搜索引擎培训讲义

    - 在进行配置之前,确保已经安装了必要的软件,如Java环境(推荐使用Java 1.6以上版本)、Eclipse等开发工具。 - 下载并解压Nutch 1.2源码包。 2. **配置构建路径** - 打开Eclipse,导入Nutch 1.2项目。 - 在...

    网络爬虫教程

    本教程旨在介绍如何搭建Nutch环境以及执行基本的爬虫任务。 **准备工作**: 1. **操作系统**:本教程要求在Linux环境下进行,因此你需要一台Linux机器或虚拟机。 2. **JDK安装**:推荐使用JDK 1.7版本。可以通过`...

Global site tag (gtag.js) - Google Analytics