`

自学lucene的一些整理

阅读更多
最近自学lucene,去图书馆也接了两本lucene的书,看了,做了些笔记,分享下。
1 建立搜索引擎的第一步:创建索引。主要介绍IndexWriter,Document,Field,关系如下:

IndexWriter就像一本书,Document就像书里的文章,Field就像文章里的标题,正文,时间,作者。

2 Field field = new Field(Field 名称 , Field 内容, 存储方式, 索引方式);

存储的方式有三种: 不存储(Field.Store.NO),,,,, 完全存储(Field.Store.YES),,,,,,,压缩存储(Filed.Store.COMPRESS)

注释:出于性能的考虑,索引文件的内容越小越好,很少使用完全存储

索引方式:不索引(Field.Index.NO)通常用于只需要跟着搜索结果显示出来却不需要按照其内容进行搜索的字段,    索引但不分析(Field.Index. NOT_ANALYZED_NO_NORMS),   索引但不分词(Field.Index.NOT_ANALYZED)通常使用于精确查询的字段,   分词并索引(Field.Index.ANALYZED)通常使用于模糊搜索的字段

Document doc = new Document();     doc.add(field)
IndexWriter writer = new IndexWriter(存储索引路径,分析器的实例)     分析器是用来做词法分析的,有中文和英文分析器等 。。。。常用的用的StandardAnalyzer(标准分析器) CJKAnalyzer(二分法分析器) ChineseAnalyzer(中文分析器)
有了这些知识,一个简单的功能就可以实现啦。。哈哈
分享到:
评论

相关推荐

    整理Lucene.net一些简单属性说明

    标题:“整理Lucene.net一些简单属性说明” 在信息技术领域,搜索引擎是不可或缺的一部分,而Lucene.net作为Apache Lucene的.NET版本,为开发者提供了一套强大的全文搜索功能。这个文档将对Lucene.net的一些核心...

    lucene整理文档,lucene详细描述,安装使用过程。

    **Lucene 概述** Lucene 是一个高性能、全文本搜索库,由 Apache 软件基金会开发并维护。它是开源的 Java 库,广泛应用于各种应用程序中,为开发者提供了强大的文本检索功能。Lucene 提供了索引和搜索文本的基本...

    lucene,lucene教程,lucene讲解

    lucene,lucene教程,lucene讲解。 为了对文档进行索引,Lucene 提供了五个基础的类 public class IndexWriter org.apache.lucene.index.IndexWriter public abstract class Directory org.apache.lucene.store....

    lucene4.10.4 jar,手动整理,去除其他文件

    在Lucene 4.10.4版本中,我们看到这个压缩包文件"lucene4.10.4.jar"是该版本的核心库,包含了实现全文搜索功能所需的全部Java类和资源。这个版本的发布,是为了提供稳定且优化的搜索性能,同时也可能包括了错误修复...

    lucene3.0 lucene3.0

    lucene3.0 lucene3.0 lucene3.0 lucene3.0 lucene3.0

    lucene in action英文版 lucene 3.30包

    为了提升搜索效率,Lucene提供了一些优化策略,如缓存、位图过滤、近似搜索等。通过合理配置和调优,可以显著提高系统性能。 6. **Lucene 3.30版本** Lucene 3.30是该库的一个较早版本,它可能包含一些特定的功能...

    lucene 入门整理

    ### Lucene入门精要 #### 一、Lucene概览 Lucene,作为一款高性能的全文检索引擎架构,自诞生以来便因其卓越的性能、易用性和灵活性而在业界获得了广泛的应用与好评。它不仅能够独立运行,更可以无缝集成至各类...

    Lucene资料整理

    **Lucene 全文检索工具包详解** Lucene 是一个高性能、可伸缩的全文检索库,由 Apache 软件基金会开发并维护。它是一个开源项目,为开发者提供了构建全文检索应用程序的基础框架。Lucene 提供了丰富的索引和搜索...

    Lucene.net学习书记整理

    **Lucene.net学习笔记整理** 在信息技术领域,搜索引擎技术一直占据着重要的地位,尤其是在大数据时代,高效、精准的检索能力显得尤为重要。Lucene是Apache软件基金会的一个开源项目,它为Java开发者提供了一个高...

    Lucene3.5源码jar包

    以下是对这个版本中一些关键知识点的详细说明: 1. **索引结构**:Lucene的核心在于其高效的倒排索引结构。在源码中,你可以看到`IndexWriter`类如何处理文档的添加、删除和更新,以及`SegmentMerger`如何合并多个...

    lucene-4.7.0全套jar包

    【Lucene 4.7.0 全套JAR包详解】 Lucene是一个开源全文搜索引擎库,由Apache软件基金会开发并维护。它提供了一个高级、灵活的文本搜索API,允许开发者轻松地在应用程序中实现复杂的搜索功能。这次提供的“lucene-...

    lucene3源码分析

    ### Lucene3源码分析知识点概述 #### 一、全文检索的基本原理 ##### 1....以上是对Lucene3源码分析的一些关键知识点总结,通过对这些概念和技术的理解,可以更好地掌握Lucene的工作原理及其应用。

    Lucene简介.介绍

    【Lucene 简介】 Lucene 是一个强大的开源全文搜索库,由 Java 编写,主要用于为应用程序添加全文检索功能。它不是一个完整的全文搜索引擎应用,而是一个工具包,允许开发者将其集成到自己的软件中,以实现高效、...

    Annotated Lucene 中文版 Lucene源码剖析

    《Annotated Lucene 中文版 Lucene源码剖析》是一本深入探讨Apache Lucene的书籍,专注于源码解析,帮助读者理解这个强大的全文搜索引擎库的工作原理。Lucene是一款开源的Java库,它提供了高效的文本搜索功能,被...

    Lucene时间区间搜索

    Lucene是一款强大的全文搜索引擎库,广泛应用于各种数据检索场景。在C#环境下,利用Lucene进行时间区间搜索是提高数据检索效率和精确度的重要手段。本篇将深入探讨如何在C#中实现Lucene的时间区间查询匹配,以及涉及...

    lucene7.3常用jar包

    lucene7.3的一些常用jar包 Setting your CLASSPATH First, you should download the latest Lucene distribution and then extract it to a working directory. You need four JARs: the Lucene JAR, the ...

    Lucene资料大全(包括Lucene_in_Action书等)

    以下是一些关键知识点: 1. **文本分析**:Lucene使用Analyzer对输入文本进行分词、去除停用词、词形还原等预处理操作,以便更好地匹配查询。 2. **索引构建**:Lucene将文档转换为倒排索引结构,这是一种高效的...

    lucene 2.0 api以及lucene 3.0 api

    **Lucene 2.0 API 和 Lucene 3.0 API 深度解析** Lucene 是一个由 Apache 软件基金会开发的全文搜索引擎库,它为开发者提供了在 Java 应用程序中实现高性能、可扩展的全文搜索功能的能力。Lucene 的 API 设计得相当...

    Lucene示例 BM25相似度计算

    在IT领域,搜索引擎技术是至关重要的,而Lucene作为一个开源全文搜索引擎库,广泛应用于各种文本检索系统中。本文将深入探讨Lucene示例中的BM25相似度计算,旨在帮助初学者理解如何利用Lucene 4.7.1版本构建索引、...

Global site tag (gtag.js) - Google Analytics