`

Cygwin+Nutch在windows上的配置(搜藏)

阅读更多


刚学习Nutch的使用,看到你多的好文章。搜藏在javaeye上很方便以后自己的查看.

原文的路径: http://blog.csdn.net/zjzcl/archive/2006/02/01/590537.aspx

非常希望有自己的原创,但是目前水平有限,不能呈现自己的作品。等我的能力和经验到了一定用自己的。


近来Nutch一词在网络中时有所见,但囿于平常工作繁忙而未能潜心细读与研究,只知道Nutch是Apache组织的一 个开源项目,利用它用户可以建立自己内部网的搜索引擎,也可以建立针对整个网络的搜索引擎。好在春节假日期间,终于得空可以从容对其进行一番解读与测试 了。在使用Nutch之前,当然是需要先对其进行安装了。用搜索引擎查找了一下相关内容,发现大部分关于Nutch如何安装的文章都是基于Linux的, 而基于Windows安装的文章虽有,但非常简略。由于运行Nutch自带的脚本命令需要Linux的环境,所以必须首先安装Cygwin来模拟这种环 境,而Cygwin本身的安装与使用也不是一件简单的事。下面,就让笔者对Nutch在Windows系统中的安装进行一番细解吧!
   
   1、安装Cygwin
   
  首先,我们去
http://www-inst.eecs.berkeley.edu/~instcd/iso/ 下载到Cygwin软件的ISO文件,用Daemon软件将其设为虚拟光驱后,双击其中的Setup文件,出现程序安装的向导界面 (如图1所示)。
     
    
  点击“下一步”后,安装向导要求选择Cygwin的安装方 式,如图2所示:
   
    
  图示中共有三种安装方式:
  (1)Install from Internet:从Internet上下载并安装软件;
  (2)Download Without Installing:从Internet上下载安装的文件,但暂时不安装;
  (3)Install from Local Directory:从本地含有安装文件的目录进行安装。
  我们选择第三项“Install from Local Directory”后,点击“下一步”,如图3所示:
   
    
  安装向导要求选择Cygwin的安装路径,我们 可以在“Root Directory”文本框中更改安装路径,点击“下一步”,如图4所示:
   
            
  安装向导要求选择Cygwin安装文件所在 的本地存储路径,可以在“Local Package Directory”中设置,点击“下一步”,如图5所示:
   
    
  安装向导显示出所要安装的内容列表,用户可以根据自己的实际 需要来决定安装哪些程序。点击循环箭头图标后面的文字,可以更改安装的方式,常用的方式有Default(表示只安装缺省的安装项)、Install(表 示安装全部程序,空间要求较大)、Reinstall(表示重新安装程序)。推荐选择“Install”方式,一步到位,以免后扰,不过用户应保证至少有 2G以上的空间可供使用。点击“下一步”后,就开始正式的安装了(如图6所示)。
   
    
  最后出现如图7所示的窗口,点击“完成”后,Cygwin安 装完毕。
   
    
  至此,笔者还要对Cygwin再多说几句。Cygwin是一 个在Windows平台上模拟运行Unix的环境,用户可以通过它来熟悉与学习Unix系统的操作。对于Unix系统还不甚熟悉的读者可以参阅笔者之前写 作的《Unix 操作系统的入门与基础 》、《Unix的轻巧 “约取而实得” 》系列文章,下文中对涉及使用到的Unix命令将不再给予详细解释。
   
  2、安装Nutch
   
  去
http://mirror.vmmatrix.net/apache/lucene/nutch/ 下载到Nutch的最新版本,将其解压到指定目录中,如笔者是将其解压到I:\nutch-0.7.1中。
   
   3、测试Nutch命令
   
  在运行Nutch的脚本命令前,需要设置一些环境变量。Cygwin提供了一个名为 cygwin.bat的文件,通过它可以自动完成必需环境变量的设置。该文件可在cygwin所在的根目录下找到,感兴趣的读者还可通过 UltraEdit等编辑器打开该文件一查究竟。其实Cygwin安装完成之后,会在Windows系统桌面生成一图标,如图8所示:
   
    
  此图标就是cygwin根目录下cygwin.bat文件的快捷 方式,双击此图标将打开一类似DOS窗口。由于先前笔者将Nutch的压缩包解压至I:\nutch-0.7.1中,故在此命令窗口中输入命令“cd /cygdrive/i/nutch-0.7.1”,读者可根据自己的安装路径进行相应的修改,然后使用命令“ls -l”可查看nutch-0.7.1中的所有子目录及文件信息。执行命令“bin/nutch”,如果读者能看到如图9所示的提示,那恭喜你,Nutch 在Windows系统中的安装已经大功告成了!
   
    
  至于Nutch的使用,且待后续分解:

参考文献:
  1、Getting Nutch Running With Windows

  2、Nutch 初体验   
  3、Nutch 于 winxp   
  4、Cygwin 使用指南

分享到:
评论

相关推荐

    Windows下cygwin+MyEclipse 8.5+Nutch1.2+Tomcat 6.0

    ### Windows下cygwin+MyEclipse 8.5+Nutch1.2+Tomcat 6.0 本文旨在详细介绍如何在Windows环境下搭建基于cygwin、MyEclipse 8.5、Nutch 1.2及Tomcat 6.0的开发环境,并对每个步骤进行深入解析。 #### 一、Cygwin的...

    Cygwin + OpenSSH FOR Windows的安装配置.docx

    Cygwin + OpenSSH FOR Windows的安装配置 Cygwin + OpenSSH 是一款功能强大且广泛应用的开源软件,主要用于远程连接和安全工具。在 Windows 操作系统中,使用 Cygwin + OpenSSH 可以提供一个非常好的解决方案,受到...

    Cygwin + OpenSSH FOR Windows的安装配置.pdf

    Cygwin + OpenSSH 在 Windows 操作系统中的安装配置 Cygwin + OpenSSH 是一个非常流行的开源软件,能够提供安全的远程连接工具,许多网管人员青睐于使用该软件。但是,对于初学者来说,安装配置该软件可能会有一定...

    windows+eclipse+cygwin+cdt+ndk配置

    总的来说,配置Windows上的Eclipse、Cygwin、CDT和NDK环境,主要是为了在Windows环境下进行C/C++的Android原生代码开发。通过Eclipse和CDT,我们可以得到一个强大的C/C++ IDE;Cygwin提供了Linux工具链,使得在...

    Cygwin+NDk配置流程(最新,最全)

    Cygwin+NDK配置最新最全,Cygwin配置,NDK配置

    Cygwin + Eclipse3.6 + NDK开发环境搭建

    首先,Cygwin是一个在Windows平台上模拟Linux环境的开源工具集,它提供了一个类似于Unix/Linux的命令行界面和许多实用工具,使得开发者能够在Windows上运行许多原本只适用于Linux的程序和脚本。安装Cygwin时,需要...

    PDF文档:Windows下Cygwin+NS-2.30安装配置详细精美过程

    详细介绍了在Windows下用Cygwin配置NS2的过程

    nutch和cygwin在Windows系统上的配置.pdf

    ### Nutch 和 Cygwin 在 Windows 系统上的配置指南 #### 一、JDK 安装及环境配置 为了确保 Nutch 能够在 Windows 上正常运行,首先需要安装 Java 开发工具包 (JDK)。以下是安装 JDK 的详细步骤: 1. **下载 JDK**...

    Cygwin+NS2安装过程

    Cygwin+NS2安装过程 本文将指导您从头开始安装Cygwin和NS2,整个过程分为两部分:首先安装Cygwin,然后安装NS2。 安装Cygwin 1. 首先下载Cygwin的setup.exe安装程序,并运行它,选择“Install from Internet”,...

    Windows + Cygwin + myNS2

    Cygwin提供了许多Unix工具和库,使得NS2可以在Windows上正常工作。myNS2是NS2的一个版本,包含了额外的模块,如TKN 802.11e EDCF模块、NOAH路由、MFlood、CSFQ、Poisson流量模型、无线随机均匀模型、GE错误模型以及...

    iphone开发环境 windows篇之 cygwin + toolschain

    要在Windows上搭建iPhone开发的Cygwin+Toolchain环境,可以按照"Windows平台上iPhone基于cygwin开发环境的搭建方法.htm"的指南进行。这个过程主要包括以下步骤: 1. **下载和安装Cygwin**:访问Cygwin官方网站,...

    windows+cygwin+ns2安装步骤

    以下是一个详尽的"Windows+Cygwin+ns2安装步骤": 1. **了解ns-2**: ns-2是一个开源的网络模拟器,广泛用于学术研究和教育,它能够模拟网络协议、节点间的数据传输和各种网络拓扑。 2. **安装Cygwin**: - 访问...

    Windows下配置nutch

    因为 Nutch 原生设计在 Linux 环境下运行,所以在 Windows 上配置 Nutch 需要一些额外的步骤。主要有两种方法: - **在 Eclipse 中使用 Nutch**: - 创建一个新的 Java 项目。 - 导入 Nutch 源码,将 `src\java`...

    Windows上安装配置SSH教程——win10下使用Cygwin+Expect自动登陆ssh

    安装Cygwin,安装上Tcl和Expect两个工具。 百度搜索:cygwin,在搜索结果中点击:Cygwin Installation 此刻,进入cygwin软件官网,根据自己操作系统,选择32位或64的setup 双击打开下载完成的cygwin,进入安装程序...

    nutch_1.4在windows下安装配置.pdf

    - **用途**: 由于 Nutch 的脚本采用 Linux Shell 编写,因此在 Windows 平台上需要 Cygwin 来模拟 Linux 系统环境。 3. **Nutch 1.4** - **下载地址**: [http://nutch.apache.org/](http://nutch.apache.org/) - ...

    Cygwin+NS2.33安装过程0-2

    通过上述步骤,你将能够在Windows系统上成功搭建起Cygwin+NS2.33的开发环境。这一环境不仅能够提供接近Unix/Linux的开发体验,还能够支持复杂的网络协议仿真,对于从事网络研究和教育的人员来说,是极其宝贵的资源。...

    Windows + Cygwin + NS-2安装

    Cygwin是一个开源工具集,可以在Windows上提供一个类UNIX的环境,使用户能够运行许多原本只支持Linux或Unix系统的应用程序。 首先,你需要下载Cygwin的安装包,通常以rar格式提供。解压缩后,找到并运行`setup.exe`...

    cygwin+eclipse搭建hadoop开发环境,运行wordcount

    接下来,"Cygwin+Eclipse搭建Hadoop开发环境"文档将指导你如何配置Eclipse IDE,使其能够与Cygwin集成,用于Hadoop项目开发。Eclipse是Java开发者常用的一款强大IDE,它提供了丰富的插件支持,包括Hadoop开发插件,...

Global site tag (gtag.js) - Google Analytics