Apache Lucene 是一个基于Java的、高性能的全文检索工具包,你可以利用它来为你的应用程序加入索引和检索功能。Lucene目前是著名的 Apache Jakarta 家族中的一个开源项目,也是目前最为流行的基于 Java 开源全文检索工具包。
下载地址:
http://www.apache.org/dyn/closer.cgi/lucene/java
该版本进行了大量优化、改进和Bug修复,包括:
1. 大大降低了控制开放的IndexReader上的协议索引的RAM占用(3~5倍)。
2. 新增IndexSearcher.searchAfter,可在指定ScoreDoc后返回结果(例如之前页面的最后一个文档),以支持deep页用例。
3. 新增SearcherManager,以管理共享和重新开始跨多个搜索线程的IndexSearchers。基本的IndexReader实例如果不再进行引用,则会被安全关闭。
4. 新增SearcherLifetimeManager,为跨多个请求(例如:paging/drilldown)的索引安全地提供了一个一致的视图。
5. 将IndexWriter.optimize重命名为forceMerge,以便去阻止使用这种方法,因为它的使用代价较高,且也不需要使用。
6. 新增NGramPhraseQuery,当使用n-gram分析时,可提升30%-50%的短语查询速度。
7. 重新开放了一个API(IndexReader.openIfChanged),如果索引没有变化,则返回空值,而不是旧的reader。
8. Vector改进:支持更多查询,如通配符和用于产生摘要的边界分析。
修复了若干Bug。
详细信息参阅:
http://lucene.apache.org/java/3_5_0/changes/Changes.html
分享到:
相关推荐
6. **倒排索引的优化**:在`MergePolicy`和`MergeScheduler`中,你可以看到Lucene如何决定何时和如何合并索引段,以保持索引的效率和空间利用率。 7. **近实时搜索(NRT)**:从3.0版本开始,Lucene引入了NRT机制,...
索引的创建和维护由`src/core/org/apache/lucene/index`下的类完成,如IndexWriter负责写入索引,TermVectorsWriter处理词项向量,SegmentMerger合并段以优化索引。 3. 索引结构 倒排索引是Lucene的核心数据结构,...
Lucene 是一个强大的开源全文搜索引擎库,由Apache软件基金会开发并维护。在3.5版本中,Lucene 提供了多种功能,使得开发者能够轻松地在应用程序中集成搜索功能。这个压缩包包含了Lucene 3.5版本的一些关键组件,如...
luke3.5 可查看lucene3.5索引
《Lucene 3.5:创建、增删改查详解》 ...然而,需要注意的是,尽管Lucene 3.5版本已经足够强大,但随着技术的发展,更现代的版本可能包含更多的优化和特性,对于新项目,建议考虑使用最新版的Lucene。
lucene3.5 IKAnalyzer3.2.5 实例中文分词通过,目前在网上找的lucene 和IKAnalyzer 的最新版本测试通过。内含:示例代码,以及最新jar包。 lucene lucene3.5 IKAnalyzer IKAnalyzer3.2.5 jar 中文 分词
《Lucene3.5实例详解:构建全文搜索引擎》 Apache Lucene是一个开源的全文检索库,为Java开发者提供了强大的文本搜索功能。在本实例中,我们将深入探讨如何使用Lucene 3.5版本来构建一个基本的全文搜索引擎,主要...
本篇文章将围绕“lucene3.5全文检索案例lucene+demo”,详细讲解Lucene 3.5的核心概念、关键功能以及如何通过实例进行操作。 一、Lucene 3.5核心概念 1. 文档(Document):Lucene中的最小处理单元,相当于数据库...
lucene3.5高亮
Lucene 3.5 API 是该库在2011年发布的一个版本,包含了对当时最新特性和改进的支持。 **核心组件** 1. **索引(Indexing)**: Lucene 的索引过程涉及将文档内容转化为可搜索的形式。它包括分析(Analyzer)步骤,...
总之,Lucene 3.5版本的更新带来了诸多改进,包括性能优化、新的查询功能和更好的多线程支持,使得开发者能够构建更强大、更高效的搜索引擎。同时,理解和解决在实际应用中遇到的问题也是优化Lucene性能的关键步骤。
Lucene 3.5是Apache Lucene项目的一个重要版本,它是一个高性能、全文本搜索库,为开发者提供了强大的文本搜索功能。作为开源软件,Lucene的源码对学习和理解搜索引擎技术具有极高的价值。下面我们将详细探讨Lucene ...
本文将深入探讨Lucene 3.5版本的相关知识点,帮助读者理解和掌握其核心功能和使用方法。 一、Lucene概述 Lucene是Java开发的全文检索引擎,由Doug Cutting创建,现为Apache软件基金会的顶级项目。它提供了索引和...
chm格式的Lucene帮助文档,Lucene3.5
在3.5版本中,Lucene已经支持了中文分词,这对于处理中文文档和搜索需求显得尤为重要。本文将深入探讨Lucene 3.5在中文分词方面的实现,以及如何利用其进行有效的中文信息检索。 一、Lucene 3.5中文分词基础 1. ...
Lucene 是一个由 Apache 软件基金会开发的全文搜索引擎库,它提供了强大的文本分析和索引功能,广泛应用于各种信息检索系统。在本文中,我们将深入探讨 Lucene 3.5 API,这是一个相对早期但仍然具有重要参考价值的...
Lucene 是一个开源的全文检索库,由 Apache 软件基金会开发。它提供了一个高效、可扩展的信息检索框架,广泛应用于搜索引擎和其他需要全文搜索功能的应用中。在本篇文章中,我们将深入探讨 Lucene 3.5 版本的 API,...
在“关于lucene3.5的使用”这个主题中,我们将深入探讨Lucene 3.5的关键特性、核心组件以及如何通过实例进行应用。首先,我们需要了解以下几个核心概念: 1. **索引(Index)**:Lucene 的工作基于索引,就像书籍的...
每个版本的发布通常会带来新的功能、性能优化和bug修复。3.5.0版本可能引入了一些关键改进,例如增强了多语言支持、提升了查询性能或者添加了新的API。 **lib目录**: 在提供的压缩包文件名称列表中,我们看到"lib...
使用lucene-3.5和IKAnalyzer2012,实现基础的全文检索实现