`

lucene Field部分参数设置含义

 
阅读更多
         /**
         * Field.Store.COMPRESS:压缩保存,用于长文本或二进制数据
         * Field.Store.YES:保存
         * Field.Store.NO:不保存
         *
         * Field.Index.NO:不建立索引
         * Field.Index.TOKENIZED:分词,建索引
         * Field.Index.UN_TOKENIZED:不分词,建索引
         * Field.Index.NO_NORMS:不分词,建索引.但是Field的值不像通常那样被保存,而是只取一个byte,这样节约存储空间
         *
         * Field.TermVector.NO:不保存term vectors
         * Field.TermVector.YES:保存term vectors
         * Field.TermVector.WITH_POSITIONS:保存term vectors.(保存值和token位置信息)
         * Field.TermVector.WITH_OFFSETS:保存term vectors.(保存值和Token的offset)
         * Field.TermVector.WITH_POSITIONS_OFFSETS:保存term vectors.(保存值和token位置信息和Token的offset)
         */ 
 
分享到:
评论
1 楼 csdn_zuoqiang 2011-12-26  
Field.Store.YES:存储字段值(未分词前的字段值)
Field.Store.NO:不存储,存储与索引没有关系
Field.Store.COMPRESS:压缩存储,用于长文本或二进制,但性能受损

Field.Index.ANALYZED:分词建索引
Field.Index.ANALYZED_NO_NORMS:分词建索引,但是Field的值不像通常那样被保存,而是只取一个byte,这样节约存储空间
Field.Index.NOT_ANALYZED:不分词且索引
Field.Index.NOT_ANALYZED_NO_NORMS:不分词建索引,Field的值去一个byte保存

TermVector表示文档的条目(由一个Document和Field定位)和它们在当前文档中所出现的次数
Field.TermVector.YES:为每个文档(Document)存储该字段的TermVector
Field.TermVector.NO:不存储TermVector
Field.TermVector.WITH_POSITIONS:存储位置
Field.TermVector.WITH_OFFSETS:存储偏移量
Field.TermVector.WITH_POSITIONS_OFFSETS:存储位置和偏移量

相关推荐

    lucene 权重设置

    在Lucene中,权重设置是优化搜索结果的关键因素,它直接影响到文档的排序和相关性。权重主要体现在以下几个方面: 1. **文档权重(Document Boost)**:在Lucene中,可以通过`Document.SetBoost(float boost)`方法...

    Lucene索引器实例

    - **字段(Field)**:字段是文档的组成部分,如标题、正文、作者等。每个字段可以设置不同的属性,如是否存储、是否被索引、是否可被搜索等。 - **索引(Index)**:索引是Lucene对文档进行处理后生成的数据结构,...

    lucene全文搜素实例 java lucene 实例

    3. **字段(Field)**:文档中的每个部分都可以被定义为一个字段,如标题、内容、作者等。每个字段都有自己的索引和存储策略。 4. **分析器(Analyzer)**:分析器负责将输入文本分解成一系列的词项(Term),并...

    基于lucene技术的增量索引

    - **性能调优**:根据实际情况调整Lucene的配置参数,如缓存大小、分词器设置等,以达到最佳性能。 通过上述步骤,我们可以构建一个基于Lucene的增量索引系统,高效地处理数据变化,同时保持搜索效率。在实际应用中...

    Lucene 索引的简单使用

    - **字段(Field)**:字段是文档的组成部分,每个字段都有特定的类型(如文本、日期等),并可以被索引或存储。 - **索引(Index)**:索引是Lucene处理数据的核心,它将文本数据转换为可供快速搜索的结构。 - **...

    Lucene的的学习资料及案例

    2. **查询实现**: 演示如何构造Query,设置搜索参数,使用IndexSearcher执行查询,并打印出搜索结果。 3. **结果展示**: 可能包含如何从TopDocs获取匹配的Document,以及如何显示高亮的搜索结果。 通过研究这个案例...

    Lucene3.0创建索引

    ### Lucene3.0创建索引 在Lucene3.0中创建索引是一个关键功能,可以帮助用户快速地检索和管理大量的文本数据。本篇文章将详细介绍如何使用Lucene3.0来创建索引,并通过一个具体的例子来演示整个过程。 #### 一、...

    lucene实现全文搜索

    2. **Field**:是Document的组成部分,代表文档中的一个特定信息,如文件名、内容等。每个Field包含三个属性:是否切词、是否索引和是否存储,用于控制字段的处理方式。 3. **Directory**:存储索引的地方,Lucene...

    lucene-project.zip

    5. **配置文件(Configuration)**:可能包含Lucene的配置参数,如分词器设置、索引路径等。 **学习Lucene的好处** 学习Lucene能够帮助开发者: 1. **提升搜索体验**:通过全文检索技术,提供更准确、更快速的...

    lucene.net源代码

    3. 创建IndexWriter,设置相应的参数,如写入模式、最大文档数等。 4. 创建Document对象,添加Field,并设置Field的类型(是否存储、是否索引、是否可搜索等)。 5. 使用IndexWriter的AddDocument方法将Document加入...

    lucene 3.6

    每个 Field 都可以设置不同的存储和索引属性。 4. **IndexWriter**:用于创建或更新索引。通过 IndexWriter,我们可以添加、删除和更新文档,并控制段合并策略,以优化索引性能。 5. **Searcher**:执行搜索操作的...

    lucene 入门

    2. **文档(Document)**:在Lucene中,每份要被检索的数据被视为一个文档,可以包含多个字段(Field),每个字段都有特定的含义和用途,如标题、内容等。 3. **术语(Term)**:经过分析后的词汇单元,是构成索引...

    lucene3.5的创建和增删改查

    可以设置其他参数,如最大段数、写入模式等。 二、添加文档 1. 创建Document:Document对象代表一个要索引的文档,包含多个Field。每个Field都有名字和值,比如“title”和“content”。 2. 添加Field:在...

    lucene4.4 Demo事例

    - 创建`Document`对象,添加字段,如`Field`,并设置相应的分析器。 - 使用`IndexWriter`将`Document`写入索引。 3. **查询文档** - 构建`QueryParser`或`Analyzer`,解析用户输入的查询字符串。 - 创建`...

    lucene 3.6 全文检索

    3. 创建IndexWriter实例并设置相关参数。 4. 创建Document对象,添加Field,然后通过IndexWriter将文档添加到索引。 5. 关闭IndexWriter。 6. 创建IndexReader或DirectoryReader以读取索引。 7. 创建IndexSearcher并...

    Lucene全文检索案例

    在这个案例中,你可能需要创建一个`IndexWriter`对象,设置适当的参数如写入目录、段合并策略等,然后遍历数据,使用`Document`对象存储每条记录,并调用`addDocument()`方法将文档添加到索引中。 3. **分词与分析*...

    lucene简单demo

    3. **字段(Field)**: 字段是文档的组成部分,每个字段都有特定的属性,如是否可搜索、是否存储原始值等。 4. **分词器(Analyzer)**: 分词器负责将输入文本分解成一系列术语,这是建立索引的关键步骤。Lucene...

    lucene排序.zip

    然而,有时候我们可能需要根据关键词在文档中出现的次数来进行排序,这可以通过设置`SortField`类的`COUNT`参数实现。例如,我们可以创建一个`Sort`对象,指定其排序依据为关键词出现的次数,这样搜索结果就会按照...

Global site tag (gtag.js) - Google Analytics