`

nutch中plugin.folders的配置

XML 
阅读更多

今天在公司做nutch的调试时,犯了一个低级的错误,在这里记录下,提醒下大家,以后不要犯此类的错误。

我们知道nutch-default.xml中有一个:

 

<property>
  <name>plugin.folders</name>
  <value>plugins</value>
  <description>Directories where nutch plugins are located.  Each
  element may be a relative or absolute path.  If absolute, it is used
  as is.  If relative, it is searched for on the classpath.</description>
</property>

 

nutch在启动的时候就会把下面的所有的插件加载。如果我们自己写一个插件的话,那么必须告诉nutch.我是在./src/plugin下面写的plugin.嘿嘿,这个<value>plugins</value> 没改,害的我找了好半天。应该该为 <value>./src/plugin </value>才对。

关于插件的做法在上几篇的文章已经写过了。

分享到:
评论
2 楼 p_x1984 2009-12-26  
不客气,大家一起进步!
1 楼 comsci 2009-12-26  
非常感谢楼主把NUTCH的调试过程和经验分享给大家,再次表示感谢。。。

相关推荐

    nutch安装开发环境的配置

    在 `nutch-default.xml` 中,`plugin.folders` 的值应该指向你的插件目录。如果你尝试了将 `value` 改为 `./src/plugin` 但未成功,可以尝试改为 `build/plugins`,这通常是编译后的插件存放位置。 3. **No URLs to...

    Nutch配置环境\Nutch1[1].4_windows下eclipse配置图文详解.docx

    (1)在conf/nutch-default.xml中,将`plugin.folders`的值更改为`./src/plugin`。 (2)创建一个名为urls的目录,里面放一个txt文件,包含你要抓取的初始网址。在conf/nutch-site.xml中,添加`http.agent.name`...

    eclipse配置nutch,eclipse配置nutch

    本文将详细解析如何在Eclipse中配置Nutch,以便于开发者更好地理解和操作这一过程。 ### 一、理解Nutch与Eclipse的结合 Nutch是一个基于Hadoop的框架,用于构建可扩展且高性能的网络爬虫。它不仅能够抓取网页,还...

    Nutch在MyEclipse下的配置[参照].pdf

    - 在`conf/nutch-default.xml`文件中,找到属性`plugin.folders`,将其值从`plugins`更改为`./src/plugin`。 #### 五、运行配置 1. **配置运行参数**: - 在MyEclipse中,右键点击项目,选择`Run As -&gt; Run ...

    nutch2.3.1安装文档教程

    &lt;name&gt;plugin.folders &lt;value&gt;plugins &lt;name&gt;http.content.limit&lt;/name&gt; &lt;value&gt;1000000 &lt;name&gt;index.writer.class &lt;value&gt;org.apache.nutch.indexer.solr.SolrIndexWriter &lt;name&gt;index.reader....

    Nutch1.4_windows下eclipse配置图文详解.docx

    - **修改 `nutch-default` 文件**:将 `plugin.folders` 的值从 `plugins` 更改为 `./src/plugin`。 - **创建 urls 目录**:在工程目录下创建 `urls` 文件夹,并在其中放置包含目标 URL 的文本文件。 - **修改 `...

Global site tag (gtag.js) - Google Analytics