`
自治州
  • 浏览: 35157 次
  • 性别: Icon_minigender_1
  • 来自: 奥克兰
社区版块
存档分类
最新评论

lucene index 最简理解(实战中用到后继续更新)

阅读更多

lucene适用于unstructured data 存储, 相对于DBMS, 他能够提供独有匹配指数的搜索结果.

 

从技术上说, lucene index将一系列的document (由filed组成)index成为一个文件. (Index用的是IndexWriter类. 其中, 对于原始文件可以用不同的analyzer parse. ) 然后, 可以快速的search这个indexed文件, 用IndexSearcher类. IndexSearcher需要一个RequestParser的object. RequestParser的作用是parse query string. 它也需要用到analyzer. 注意, RequestParser和IndexWriter的analyzer需一致.

 

References: http://oak.cs.ucla.edu/cs144/projects/lucene/

 

*基于lucene2.0. 目前lucene的版本为4.6

分享到:
评论

相关推荐

    Lucene实战中文版第2版

    经典的Lucene资源

    Lucene实战

    《Lucene实战》第二版是一本深入探讨Apache Lucene搜索引擎库的权威指南。这本书主要针对开发者,特别是那些希望在自己的应用程序中集成全文搜索功能的人。Lucene是一个高性能、全文本检索库,它允许开发人员轻松地...

    解密搜索引擎技术实战 LUCENE & JAVA(第3版)PDF

    在《解密搜索引擎技术实战 LUCENE & JAVA(第3版)》中,作者罗刚会逐步引导读者理解搜索引擎的基本原理,如倒排索引、TF-IDF算法、布尔运算等。同时,他会讲解如何使用LUCENE API进行索引的创建、更新和删除,以及...

    Luke-Lucene Index Toolbox

    总的来说,Luke-Lucene Index Toolbox是开发者和搜索专家的必备工具,它提供了深入理解、检查和优化Lucene索引的强大能力,从而提升搜索系统的性能和用户体验。无论是开发阶段的调试还是生产环境的监控,Luke都发挥...

    Lucene实战(中文版第二版)对应Lucene版本

    《Lucene实战(中文版第二版)》是针对搜索引擎开发领域的经典著作,它详细介绍了如何使用Apache Lucene这个强大的全文搜索引擎库。Lucene是Java语言实现的开源项目,被广泛应用于各种信息检索系统中,包括网站搜索...

    Lucene实战源码

    源码中,`org.apache.lucene.index.IndexWriter`类是索引创建和更新的核心。 2. **分析器(Analyzer)**:Lucene允许自定义分析器,以适应不同语言和应用场景。例如,英文分析器会去除停用词,而中文分析器则需要进行...

    Lucene的简单介绍

    Lucene索引的结构由索引(Index)、段(Segment)、文档(Document)、域(Field)和词(Term)等基本单位组成。一个索引位于一个文件夹中,包含一个或多个段。段与段之间独立,新添加的文档会生成新的段,不同段随...

    lucene实战第二版(最新)

    全文搜索不同于简单的关键词匹配,它能够在数据中搜寻到最符合搜索需求的记录,并且能够理解单词的各种变形,使得搜索更加智能和精准。全文搜索引擎在信息时代扮演着重要角色,使得海量数据的检索成为可能。 本书...

    Lucene实战第二版中英文PDF(带书签)

    11. **实战案例**:书中提供了丰富的实战示例,帮助读者理解如何在实际项目中应用Lucene,解决各种搜索场景的问题。 12. **书签功能**:提供的PDF版本带有书签,方便读者快速定位到感兴趣的章节和内容,提高学习...

    Lucene 索引的简单使用

    - **索引(Index)**:索引是Lucene处理数据的核心,它将文本数据转换为可供快速搜索的结构。 - **分词器(Tokenizer)**:分词器将输入的文本分解为一系列的词语,这是建立索引的第一步。 - **分析器(Analyzer)...

    lucene for java 简单demo

    Lucene 是一个全文搜索引擎库,由Apache软件基金会开发并维护,它提供了一个高效、可扩展的搜索框架,使得开发者可以轻易地在自己的应用程序中集成全文检索功能。Java是Lucene的主要支持语言,因此"Lucene for Java...

    Lucene实战(中文版)

    Lucene实战(中文版),lucene是apache的用于构建搜索引擎的开源框架,本书由该项目的维护者撰写,是学习、使用lucene的经典图书

    luck 查看lucene index的利器

    用来查看lucene index的工具 分析index的结构。下载解压后直接点击运行即可!

    Lucene实战(第二版)

    在“lucene in action”这一标签下,我们可以理解本书着重于将Lucene应用到实际项目中的实践方法。Lucene是一个高性能、全文本搜索库,它提供了一个简单的API,使得开发人员可以轻松地在Java应用程序中实现全文检索...

    Lucene实战(第二版)源代码

    Analyzer负责将输入文本分解为可搜索的词项,IndexWriter则用于创建或更新索引,Directory是存储索引的接口,Document用来封装待索引的信息,而QueryParser则将用户输入的查询字符串转化为Lucene能理解的查询对象。...

    lucene搜索的简单入门例子源代码

    首先,我们要知道Lucene的核心组件包括文档(Document)、字段(Field)、索引(Index)和查询(Query)。在Lucene中,信息是以文档的形式存储,每个文档由多个字段组成,比如标题、内容等。索引是Lucene处理的关键...

    Lucene实战中文版第2版.pdf

    Lucene支持实时索引和搜索,即在文档发生变化后能够立即反映到搜索结果中。这对于需要频繁更新数据的应用场景来说非常重要。 ### 实战应用案例 - **电子商务**:利用Lucene构建商品搜索系统,支持关键词匹配、类别...

Global site tag (gtag.js) - Google Analytics