`
heaven022
  • 浏览: 6843 次
  • 性别: Icon_minigender_1
  • 来自: 天津
最近访客 更多访客>>
社区版块
存档分类
最新评论

lucene简介

阅读更多

Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。目前最新版本为3.0.3和2.9.4,3.0.3只支持jdk5以上。

Lucene作为一个全文检索引擎,其具有如下突出的优点:

  (1)索引文件格式独立于应用平台。Lucene定义了一套以8位字节为基础的索引文件格式,使得兼容系统或者不同平台的应用能够共享建立的索引文件。

  (2)在传统全文检索引擎的倒排索引的基础上,实现了分块索引,能够针对新的文件建立小文件索引,提升索引速度。然后通过与原有索引的合并,达到优化的目的。

  (3)优秀的面向对象的系统架构,使得对于Lucene扩展的学习难度降低,方便扩充新功能。

  (4)设计了独立于语言和文件格式的文本分析接口,索引器通过接受Token流完成索引文件的创立,用户扩展新的语言和文件格式,只需要实现文本分析的接口。

  (5)已经默认实现了一套强大的查询引擎,用户无需自己编写代码即使系统可获得强大的查询能力,Lucene的查询实现中默认实现了布尔操作、模糊查询(Fuzzy Search[11])、分组查询等等。  

分享到:
评论

相关推荐

    Lucene简介.介绍

    【Lucene 简介】 Lucene 是一个强大的开源全文搜索库,由 Java 编写,主要用于为应用程序添加全文检索功能。它不是一个完整的全文搜索引擎应用,而是一个工具包,允许开发者将其集成到自己的软件中,以实现高效、...

    Lucene简介

    Lucene简介,想了解lucene的朋友可以下载了看看。

    搜索引擎Lucene 简介.doc

    **Lucene搜索引擎简介** Lucene是一个开源的全文检索引擎库,最初由Doug Cutting教授编写,以Java语言实现,主要用于提供文本数据的快速索引和检索功能。随着时间的推移,由于市场需求,Lucene已被移植到.NET、C++...

    Lucene 使用正则表达式

    1. **Lucene简介** 2. **正则表达式(regex)在Lucene中的应用** 3. **regexQuery详解** 4. **示例代码解析** 5. **索引创建与查询流程** 6. **正则表达式的语法** #### Lucene简介 Lucene是一个高性能、全功能的全文...

    lucene所有的jar包

    一、Lucene简介 Lucene是Apache软件基金会的一个开放源代码项目,它提供了一个高性能、全文本搜索的API。Lucene支持索引和搜索文本,可以集成到各种Java应用程序中,帮助开发者轻松实现全文检索功能。其核心特性...

    java Lucene初级教程

    lucene简介 1.1 什么是lucene  Lucene是一个全文搜索框架,而不是应用产品。因此它并不像www.baidu.com 或者google Desktop那么拿来就能用,它只是提供了一种工具让你能实现这些产品。 2 lucene的工作方式  lucene...

    全文索引检索工具Lucene 简介,原来和应用实例

    Lucene是非常优秀的成熟的开源的免费的纯java语言的全文索引检索工具包。 Lucene是一个高性能、可伸缩的信息搜索(IR)库。 Information Retrieval (IR) library.它使你可以为你的应用程序添加索引和搜索能力。 Lucene...

    lucene 对 xml建立索引

    1. **Lucene简介** - Lucene是一个开源的全文搜索引擎库,能够帮助开发者构建应用程序内的搜索功能。 - Lucene的核心能力在于文档索引和查询,它提供了强大的API来实现高效的文档检索。 2. **XML简介** - XML...

    Lucene:基于Java的全文检索引擎简介

    1. 基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史 2. 全文检索的实现:Luene全文索引和数据库索引的比较 3. 中文切分词机制简介:基于词库和自动切分词算法的比较 4. 具体的安装和使用简介:系统结构...

    lucene in action 电子版

    #### 一、Lucene简介 - **书籍概述**:“Lucene in Action”是一本深入介绍Apache Lucene的书籍,由Otis Gospodnetic和Erik Hatcher共同撰写。该书旨在帮助读者理解和掌握如何使用Java构建高效搜索应用程序的技术...

    Lucene技术文档doc

    **一、Lucene简介** Lucene是Apache软件基金会下的Jakarta项目组的一个核心项目,它是一款高性能、可扩展的全文检索引擎库。作为一个开源的Java库,Lucene提供了完整的搜索功能,包括索引、查询、排序等。然而,值得...

    lucene_jar包

    Lucene简介** Lucene最初由Doug Cutting创建,现已成为Apache的顶级项目。它提供了一个高效、可扩展的信息检索库,支持索引和搜索大量文本数据。Lucene不仅处理文本,还可以处理其他类型的数据,如图片和视频,但...

    Lucene实战

    1. **Lucene简介** Lucene是Java编写的一个开源全文检索库,由Doug Cutting创建。它提供了索引和搜索大量文本数据的能力,包括文档、网页和其他类型的数据。Lucene包含了分词器(Tokenizer)、分析器(Analyzer)和...

    Lucene简单实例记录

    ### Lucene简介 Apache Lucene是一个高性能、全功能的文本搜索引擎库,由Java编写,提供了对文本进行索引和搜索的能力。它允许开发者将强大的搜索功能集成到他们的应用程序中,而无需深入了解底层搜索算法和数据...

    lucene:基于Java的全文检索引擎简介

    ### 基于Java的全文检索引擎Lucene简介 #### 1. Lucene概述与历史背景 Lucene是一个开源的全文检索引擎库,完全用Java编写。它为开发者提供了构建高性能搜索应用程序的基础组件。尽管Lucene本身不是一个现成的应用...

    Lucene 2.0.0下载安装及简单测试

    一、Lucene简介与版本选择 Lucene是一款高性能、全功能的文本搜索引擎库,由Java编写,旨在为应用提供快速、高效的全文检索能力。它不仅仅是一个简单的索引和搜索工具,还提供了丰富的查询语言、分词器和其他高级...

Global site tag (gtag.js) - Google Analytics