`

如何增加Nutch中Summary的长度

XML 
阅读更多

在nutch-site.xml添加以下配置,

<configuration>

...

<property>
  <name>searcher.summary.length</name>
  <value>50</value>//默认为20
  <description>
  The total number of terms to display in a hit summary.
  </description>
</property>

...

</configuration>

就可以了.个人认为Nutch的默认配置是在nutch-default.xml中设置的,如果您想覆盖它的配置只需在nutch-site.xml中添加相应的配置就好了.

分享到:
评论
1 楼 javalhl 2012-05-31  
不知最新的nutch 与 solr 组合后,summary该如何配置?

相关推荐

    Nutch中文教程nutcher.zip

    nutcher 是 Apache Nutch 的中文教程,在github上托管。nutch社区目前缺少教程和文档,而且教程对应版本号较为落后。nutcher致力于为nutch提供一个较新的中文教程和文档,供开发者学习。 github地址: ...

    nutch中文分词

    nutch应用,nutch中文分词,nutch中文乱码

    Nutch中文分词插件的编写与配置

    Nutch中文分词插件的编写与配置,由于Internet的迅猛发展,使得用户查找信息犹如大海捞针,而搜索引擎则能帮用户很好的解决这个问题。 Nutch是用java语言开发的,基于Lucene的完整的网络搜索引擎,并采用插件机制进行...

    基于Nutch中文分词的研究与实现

    作为舆情监测系统的一部分,本文的目标是基于Nutch,同时,结合目前最常用中文分词技术,根据不同的中文分词方法,实验并得出不同分词方法在性能以及使用环境上的优缺点,以此为舆情监测系统选择合适的中文分词方法...

    nutch 初学文档教材

    Nutch 是一个开源的、Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。 目 录 1. nutch简介...1 1.1什么是nutch..1 1.2研究nutch的原因...1 1.3 nutch的目标..1 1.4 nutch VS lucene.....2 2....

    Nutch入门教程.pdf

    Nutch API和OpenSearch API则允许开发者在应用程序中集成Nutch搜索引擎功能。 Nutch的目标是让每个人都能容易地、低成本地配置一个世界级的Web搜索引擎。Nutch的扩展性使其不仅适用于学术和政府站点的搜索,也可以...

    如何通过java程序获得Nutch中网页的详细信息

    在Java编程环境中,获取Nutch中的网页详细信息是一项常见的任务,尤其对于那些处理大量网络数据的项目来说。Nutch是一个开源的Web爬虫框架,它能够抓取互联网上的网页并进行索引,非常适合用于大数据分析和搜索引擎...

    eclipse配置nutch,eclipse配置nutch

    本文将详细解析如何在Eclipse中配置Nutch,以便于开发者更好地理解和操作这一过程。 ### 一、理解Nutch与Eclipse的结合 Nutch是一个基于Hadoop的框架,用于构建可扩展且高性能的网络爬虫。它不仅能够抓取网页,还...

    Eclipse中编译Nutch-1.0

    1. **添加必要的导入语句**:在文件顶部增加`import org.apache.nutch.parse.ParseResult;`。 2. **方法签名更改**:将`public Parse getParse(Content content)`更改为`public ParseResult getParse(Content ...

    基于Java的搜索引擎Nutch中文搜索技术研究

    3. **集成与测试**:将上述两个模块集成到Nutch系统中,并进行了全面的功能测试和性能评估。 #### 实验结果与分析 经过一系列实验验证,本文提出的中文搜索技术方案显著提高了Nutch搜索引擎对于中文信息的处理能力...

    nutch

    8. **搜索**:最后,Nutch 提供了一个简单的搜索接口,用户可以通过关键词搜索索引库中的内容。 **Nutch 和 Hadoop 的关系** Nutch 与 Hadoop 密切相关,因为 Nutch 是 Hadoop 生态系统的一部分。Hadoop 提供了...

    nutch使用&Nutch;入门教程

    Nutch提供了丰富的命令行工具,如`bin/nutch`,用于执行上述工作流程中的各个步骤。你可以单独运行每个命令,或者通过`bin/crawl`脚本自动化整个过程。 六、Nutch与其他技术的集成 Nutch可以与Solr或Elasticsearch...

    nutch开发资料 搜索引擎

    5. **Nutch源码结构**:压缩包中的"src"目录很可能包含了Nutch的源代码,这包括了各种模块,如爬虫模块(fetcher)、解析模块(parser)、索引模块(indexer)等。开发者可以通过阅读源码理解其内部机制,并进行二次...

    解决Nutch摘要问题

    2. **改进TF-IDF**:可以通过增加权重分配的复杂性,比如引入句子长度惩罚、邻近度信息等,使得关键词的选取更合理,提高摘要质量。 3. **融合多种摘要方法**:结合不同的摘要策略,如抽取式和生成式方法,通过集成...

    Nutch相关框架视频教程

    资源名称:Nutch相关框架视频教程资源目录:【】Nutch相关框架视频教程1_杨尚川【】Nutch相关框架视频教程2_杨尚川【】Nutch相关框架视频教程3_杨尚川【】Nutch相关框架视频教程4_杨尚川【】Nutch相关框架视频教程5_...

    nutch2.2.1安装步骤.docx

    为了存储和管理 Nutch 抓取的数据,你还需要在 MySQL 数据库中创建一个数据库和表。例如,创建名为 `nutch_test` 的数据库,采用 `latin1` 字符集和 `latin1_swedish_ci` 排序规则。然后创建一个名为 `collection1_...

Global site tag (gtag.js) - Google Analytics