Apache Lucene
项目是一个完全用Java编写的高性能、全功能的文本搜索引擎库,最近它发布了2.9版
。此次发布在2.4.1版的基础上进行了许多增强:
- 单个Segment的查询及缓存,这使reopen操作的速度显著提高。
- 为IndexWriter增加了接近实时的搜索功能。
- 新的Query类型。
- 更智能,伸缩性更强的多词(multi-term)查询(如Wildcard,Range等等)。
- 最新优化过的Collector/Scorer API。
- 新增的Unicode支持及字符集(Collation)。
- 基于Attribute的TokenStream新API。
- 在contrib中提供了新的QueryParser框架,并替换了核心实现。
- 在基于字段搜索,或使用自定义的Collector的时候可取消Score功能,这样可以获得显著的性能提高。
-
这在自定义排序的时候性能会有提升,减少了score的计算
- 新的分析器(PesianAnalyzer,ArabicAnalyzer、SmartChineseAnalyzer)。
-
SmartChineseAnalyzer是基于词典的,基本功能应该是可以的。需要考察一下可扩展性。
- 为大型文本新增快速向量高亮工具(fast-vector-highlighter)。
- 对数字字段提供了高性能的查询支持。这些字段使用前缀树的结构进行索引,能直接支持简单而高效的数字范围查询,而不需要在外部对数字进行处理。
虽然Lucene团队打算在小版本的更新上做到完整的兼容,但是Lucene 2.9在不少方面破坏了这一点,详细信息可参考Changes
文档中“向前兼容策略的改变(Changes in backwards compatibilit policy)”一节。Lucene团队建议不要直接替换生产环境下的二进制包,而是在部署前重新编译应用程序,以便在出现兼容问题时获得提示并进行修补。
分享到:
相关推荐
《Lucene2.9开发指南》是一份专为初级开发者准备的资料,旨在详细介绍如何使用开源全文搜索工具包Lucene2.9.1。Lucene作为一个强大的文本搜索库,其核心功能包括建立索引和执行搜索。以下是关于Lucene2.9开发的一些...
lucene 2.9 API , lucene API,lucene 学习资料,lucene2.9 CHM
本文将深入探讨Lucene 2.9版本的API,解析其核心组件和主要功能。 ### 一、Lucene 2.9的核心组件 1. **索引(Indexing)**: Lucene首先通过`IndexWriter`类将文档转化为倒排索引。倒排索引是一种数据结构,可以...
在2.9版本中,Lucene 提供了更加优化的性能和丰富的功能,尤其对于中文分词处理有了显著提升,这使得它在中文信息检索领域具有广泛的应用。下面将深入探讨 Lucene 2.9 版本中的核心知识点。 1. **分词引擎**:...
lucene_2.9_api
总的来说,Lucene 2.9 API是一个功能强大且灵活的全文检索工具,能够帮助开发者快速构建自己的搜索引擎。通过深入了解其内部机制和API用法,开发者可以更好地利用Lucene来提升应用程序的搜索体验。对于所有涉及到...
《深入理解Lucene 2.9.1:构建与搜索的全方位解析》 Lucene,作为一款开源的全文搜索引擎库,被广泛应用于各种信息检索场景。本文将详细讲解Lucene 2.9.1版本的核心概念、架构以及索引创建与搜索的流程。 一、...
**Lucene.NET 2.9 搜索引擎源代码解析** Lucene.NET 是一个基于 Apache Lucene 的全文搜索引擎库,它是用 C# 实现的。Apache Lucene 是一个高性能、可扩展的信息检索库,广泛用于构建复杂的搜索功能。Lucene.NET ...
《深入剖析Lucene.NET 2.9.4.2源码》 Lucene.NET是一个开源全文搜索引擎库,它是Apache Lucene项目的.NET版本。这个源码版是2.9.4.2版本,相较于2.9.4版进行了一些局部改进,以适应.NET平台的需求和优化。在本文中...
【Lucene.Net 2.9 库详解】 Lucene.Net是一个基于.NET框架的信息检索库,它是Apache Lucene项目的一部分,专为.NET开发者提供强大的全文搜索引擎功能。Lucene最初是用Java开发的,但随着.NET平台的发展,Lucene.Net...
《深入理解Lucene.NET 2.9.4.2编译版》 Lucene.NET,作为.NET平台上的一款全文搜索引擎库,是Apache Lucene项目在Java平台上的移植,它为.NET开发者提供了强大的文本检索功能。本编译版为2.9.4.2,相较于2.9.4版...
Lucene,作为Apache软件基金会的一个顶级项目,是Java开发的全文检索库,它提供了强大的文本搜索功能,被广泛应用于各种信息检索和搜索引擎的构建。在本文中,我们将深入探讨Lucene 2.9.4这一经典版本,分享其核心...
标题"自己修改的基于lucene.net 2.9和highlighter插件的简单例子"表明这是一个示例项目,演示了如何在Lucene.NET 2.9版本上结合Highlighter插件进行操作。Lucene.NET是Apache Lucene搜索引擎库的.NET版本,用于实现...
《深入理解Lucene.NET 2.9.1.002:C#版搜索引擎核心技术剖析》 Lucene.NET,作为Apache Lucene项目的一部分,是一款高度可扩展、高性能的全文检索库,专为.NET Framework设计。它提供了核心的索引和搜索功能,为...
Version 2.9.2 本人倡导零分资源共享,欢迎大家按需下载。
Lucene.Net最新版 2.9.2 DLL
Lucene.Net是一个基于Java Lucene的.NET全功能搜索库,它提供了强大的文本分析、索引和搜索功能。这个版本2.9.1是该库的一个稳定版本,适用于.NET Framework的应用开发。Lucene.Net的核心设计目标是使开发者能够轻松...
Lucene.net是我从https://svn.apache.org/repos/asf/incubator/lucene.net/tags/Lucene.Net_2_9_2/ 上下载下来的,如果你想自己下载可以按照http://apps.hi.baidu.com/share/detail/22856972上面说的方法来下载。...
Lucene是一个开源的全文检索库,由Apache软件基金会开发,它提供了强大的文本搜索功能,被广泛应用于各种信息检索系统中。本文将围绕“lucene-2.9.2.jar”这个版本,结合源码,探讨其在中文分词和TF-IDF搜索引擎中的...
第1部分Lucene的核心,着重于Lucene的核心API介绍,并按照把Lucene集成到程序中的顺序组织;第2部分Lucene的应用,通过对Lucene内置工具的介绍,展示了Lucene技术的高级应用和在各种程序语言上的移植。