`
qjwujian
  • 浏览: 16648 次
  • 性别: Icon_minigender_1
  • 来自: 重庆
最近访客 更多访客>>
社区版块
存档分类
最新评论

nutch出现org.apache.nutch.plugin.PluginRuntimeException错误

阅读更多

下载了nutch1.2在eclipse中配置好能正确的运行,然后自己又在此源代码上面用ant编译,然后把编译出来的war,job,jar包都放在了源代码的根目录下,然后在终端命令执行bin/nutch urls/url.txt  -depth 2出现了错误

org.apache.nutch.plugin. PluginRuntimeException : java.lang. ClassNotFoundException : org.apache.nutch.net .urlnormalizer.basic.BasicURLNormalizer

这种错误!

最后发现是conf下面的nutch-site.xml中plugin.fouders选项没有设置好,把他的值设置为build/plugins搞定!

分享到:
评论
1 楼 青花瓷101 2012-08-07  
亲,太感谢啦,就是这个问题,找了半天没找个原因,看到这个你写的,一下搞定,,呵呵,

相关推荐

    Nutch插件开发文档

    import org.apache.nutch.indexer.IndexingException; import org.apache.nutch.indexer.IndexingFilter; import org.apache.nutch.indexer.NutchDocument; import org.apache.nutch.parse.Parse; public class ...

    nutch2.3.1安装文档教程

    - 访问 Nutch 官网:[http://nutch.apache.org/downloads.html](http://nutch.apache.org/downloads.html) - 下载 Nutch 2.3.1 版本的 tar 文件。 - 使用命令 `tar -zxvf apache-nutch-2.3.1-src.tar.gz` 解压缩...

    基于ApacheNutch和Htmlunit的扩展实现AJAX页面爬虫抓取解析插件nutch-htmlunit.zip

    Nutch Htmlunit Plugin 重要说明: 当前项目基于Nutch 1.X系列已停止更新维护,转向Nutch 2.x系列版本的新项目:http://www.oschina.net/p/nutch-ajax 项目简介 基于Apache Nutch 1.8和Htmlunit...

    Nutch配置环境\Nutch1[1].4_windows下eclipse配置图文详解.docx

    (1)在conf/nutch-default.xml中,将`plugin.folders`的值更改为`./src/plugin`。 (2)创建一个名为urls的目录,里面放一个txt文件,包含你要抓取的初始网址。在conf/nutch-site.xml中,添加`http.agent.name`...

    nutch安装开发环境的配置

    2. **java.lang.RuntimeException: org.apache.nutch.plugin.PluginRuntimeException: java.lang.ClassNotFoundException: org.apache.nutch.net.RegexURLFilter** 这个问题可能是因为插件目录设置不正确。在 `...

    Nutch入门教程.pdf

    Apache Nutch 是一个开源的网络搜索引擎框架,允许用户通过一个可定制的、分布式的方式爬取和索引网页。学习Nutch可以提供对搜索引擎内部工作原理的深入了解,特别是对那些对搜索排序的透明度、搜索引擎的内部工作...

    nutch Eclipse

    具体来说,你需要在 src\plugin\parse-rtf\src\java\org\apache\nutch\parse\rtf 目录下的 RTFParseFactory.java 文件中: 1. 添加 `import org.apache.nutch.parse.ParseResult;` 2. 将 `public Parse getParse...

    eclipse配置nutch,eclipse配置nutch

    具体而言,将`plugin.folders`参数改为`"./src/plugin"`,以确保Nutch能够识别到项目的插件目录。 #### 步骤5:设置URL文件 在配置好基本环境后,还需要创建一个包含起始URL的文件,通常命名为`urls`,并将其放置...

    apache-nutch-1.4-src.tar.gz_nutch_搜索引擎

    Apache Nutch 是一款高度可扩展的开源全文搜索引擎框架,它为构建自定义的网络爬虫和搜索引擎提供了强大的工具集。Nutch 的设计目标是处理大量网页数据,进行高效的抓取、索引和搜索操作。在“apache-nutch-1.4-src....

    Nutch在MyEclipse下的配置[参照].pdf

    - 在`conf/nutch-default.xml`文件中,找到属性`plugin.folders`,将其值从`plugins`更改为`./src/plugin`。 #### 五、运行配置 1. **配置运行参数**: - 在MyEclipse中,右键点击项目,选择`Run As -> Run ...

    Nutch_插件深入研究

    5. **修改全局配置**:在`conf/nutch-default.xml`中,需要更新`plugin.includes`配置项,以包含新开发的插件。 #### 三、Mysql与Nutch的集成 除了插件开发,Nutch还支持将爬取的数据存储到MySQL数据库中。这一...

    Nutch1.4_windows下eclipse配置图文详解.docx

    - **修改 `nutch-default` 文件**:将 `plugin.folders` 的值从 `plugins` 更改为 `./src/plugin`。 - **创建 urls 目录**:在工程目录下创建 `urls` 文件夹,并在其中放置包含目标 URL 的文本文件。 - **修改 `...

    Nutch安装配置

    9. **日志监控**:在运行过程中,Nutch会产生大量的日志文件,通过分析这些日志可以了解抓取过程中的错误和警告,以便进行调试。 10. **扩展和优化**:Nutch支持插件机制,可以根据需求编写自己的插件,例如自定义...

    分布式搜索引擎nutch开发

    Apache官方网站上的Nutch项目页面是获取最新资讯和资源的主要渠道。 总之,Nutch是一个强大的分布式搜索引擎开发工具,它结合了Hadoop的分布式计算能力,为大规模网页抓取和搜索提供了高效解决方案。通过深入学习和...

    \Lucene Nutch和安装说明文旦

    标题中的“Lucene Nutch和安装说明文档”暗示了我们要讨论的是一个关于Apache Lucene和Nutch的安装过程。Lucene是一个全文搜索引擎库,它提供了核心的搜索功能,而Nutch则是一个基于Lucene的开源网络爬虫项目,用于...

    Nutch插件开发和服务器发布流程

    - 将插件的源代码保存在`/src/java/org/apache/nutch/parse/self/`目录下。在这个示例中,我们将实现一个名为`indexingFilter`的插件。 - 需要注意的是,插件的类应该遵循Nutch的命名规范,确保与其他模块兼容。 **...

Global site tag (gtag.js) - Google Analytics