`

谁能帮助我解决Nutch1.4找不到crawl类的问题!

阅读更多

   最近在自己用cygwin搞nutch.版本是1.4的,是因为找稳定的1.2找不到(不但官网找不到,各种百度各种谷歌都失败)

   可是每当运行crawl命令- bin/nutch crawl urls -dir mydir -depth 3 -topN 5命令后,就说找不到crawl类,我已经把crawl的jar包放在了jdk/lib和nutch/lib下了,还是找不到,弄了一天了,着实的郁闷。

   在网上找解决办法,网上解决办法很多啊,没一个起作用的,现在就剩了一个网民给的解决办法没试过了,我已经快死心了,今天很累了就没搞了,有没好心的好朋友们来搞搞,帮我解决?网名某说是因为Nutch只能在FAT32磁盘上用,我的是win7还是NTFS的......

     ErrorMassage放在附件中了,还有谁能告诉我如何在ITEYE中插入本地图片的。。

 

  • 大小: 12.8 KB
0
1
分享到:
评论
1 楼 水果硬糖 2012-03-01  
已经找到问题所在了  请大家看我的最新博客中有写  谢谢

相关推荐

    nutch1.4帮助文档

    nutch1.4帮助文档,学习nutch1.4必备,最新nutch1.4核心类解读!

    nutch_1.4配置

    ### Apache Nutch 1.4在Windows下的安装与配置详解 #### 一、Apache Nutch简介及重要性 Apache Nutch是一款用Java语言编写的开源网络爬虫项目,旨在自动化地抓取网页中的链接,检查并修复坏链接,以及创建已访问...

    nutch_1.4在windows下安装配置.pdf

    - **步骤**: 打开 Cygwin,进入 `nutch-1.4/runtime/local` 目录(如解压到 D 盘,则路径为 `/cygdrive/d/apache-nutch-1.4/runtime/local`)。 - **命令**: 输入 `bin/nutch`,如果显示命令信息提示,则表示 Nutch ...

    apache-nutch-1.4

    - **社区论坛**:活跃的用户社区能解答各种问题,并持续推动项目的改进和发展。 总的来说,Apache Nutch 1.4是一个功能强大的开源搜索引擎工具,适用于构建和维护大规模的网络数据索引。其灵活性和可扩展性使得它...

    apache-nutch-1.4-bin.tar.gz.part2

    apache-nutch-1.4-bin.tar.gz.part2

    Nutch1.4_windows下eclipse配置图文详解.docx

    ### Nutch 1.4 在 Windows 下 Eclipse 配置图文详解 #### 一、环境准备与配置 **1.1 JDK 安装** ...这些步骤详细地介绍了如何从环境准备到最终运行配置的整个过程,希望能帮助用户顺利完成 Nutch 项目的搭建。

    apache-nutch-1.4-bin.tar.gz

    Nutch 的设计目的是为了提供一种高效、可靠且易于维护的解决方案,尤其适用于大数据量的互联网内容处理。在这个"apache-nutch-1.4-bin.tar.gz"压缩包中,包含了运行 Nutch 的所有必要组件和配置文件,适合初学者和...

    apache-nutch-1.4-src.tar.gz_nutch_搜索引擎

    在“apache-nutch-1.4-src.tar.gz”这个压缩包中,包含了Nutch 1.4版本的源代码,用户可以根据自己的需求对代码进行定制和扩展。 Nutch 的主要组件包括以下几个方面: 1. **网络爬虫(Crawler)**:Nutch 的网络...

    nutch crawl代码解析

    在实际的抓取过程中,`Crawl` 类还会调用其他组件,如 `Fetcher`、`Injector`、`Generator`、`Fetcher`、`Parser` 和 `Indexer`,它们分别负责注入种子 URL、生成抓取列表、下载网页、解析内容以及将结果索引到搜索...

    解决Nutch摘要问题

    "解决摘要问题1.png"、"解决摘要问题2.png"可能展示了摘要生成前后的对比,帮助我们直观理解问题所在;"解决摘要问题1.txt"和"解决摘要问题3.txt"可能包含了一些具体问题的描述和解决方案,供我们分析和参考。 总的...

    nutch 爬到的CSDN数据 nutch crawl

    总的来说,"nutch 爬到的 CSDN 数据"是一个关于利用开源爬虫工具 Nutch 抓取并分析 CSDN 网站内容的过程,这个过程涉及到网络爬虫技术、数据抓取策略、数据分析等多个方面,具有广泛的应用前景和技术价值。...

    apache-nutch-1.4-bin.part2

    apache-nutch-1.4-bin.part2

    apache-nutch-1.4-bin.part1

    apache-nutch-1.4-bin.part1

    Nutch配置环境\Nutch1[1].4_windows下eclipse配置图文详解.docx

    本文将详细介绍如何在Windows环境下配置Nutch 1.4,并使用Eclipse进行开发。以下是你需要知道的关键步骤: 1. **安装JDK**: 在配置Nutch之前,首先确保已安装Java Development Kit (JDK)。这里推荐使用JDK 1.6。...

    把多次用nutch_crawl获得的所有目录合并在一起

    在Nutch的爬取过程中,每次`nutch crawl`操作都会生成一个新的目录,包含爬取的网页数据、链接数据库(linkdb)、网页数据库(crawldb)和索引文件。当需要将多次爬取的结果合并成一个统一的数据库时,可以使用`...

    apache-nutch-1.4-bin.tar.gz.part1

    apache-nutch-1.4-bin.tar.gz.part1

    nutch帮助文档;nutch学习 入门

    - **实践项目**:尝试建立自己的小规模搜索引擎项目,应用Nutch解决实际问题。 5. **参考资料** - 官方文档:Apache Nutch官网提供了详细的使用指南和API文档。 - 社区资源:参与Nutch的邮件列表、论坛讨论,...

    nutch10配置(解决代理问题)

    ### nutch10配置(解决代理问题) #### 知识点概述 在处理网络爬虫时,遇到代理问题是非常常见的。对于Nutch这样的开源爬虫框架来说,正确配置代理是确保能够顺利抓取互联网资源的关键步骤之一。本文将详细介绍...

    Nutch 1.2源码阅读

    Crawl类作为Nutch的核心入口,位于`org.apache.nutch.crawl`包内。当执行`crawlurls–dirmydir–depth5–threads5–topN100`命令时,Nutch的抓取流程便由此类启动。其中,`mydir`指定数据存储路径,包括crawlDb、...

    关于Nutch的安装

    【Nutch安装详解】 Nutch是一款开源的网络爬虫软件,用于抓取互联网上的网页并构建搜索引擎。本文将详细介绍如何安装Nutch version 0.8。...在实际操作过程中,可能会遇到各种问题,需要根据错误提示进行调试和解决。

Global site tag (gtag.js) - Google Analytics