`
longgangbai
  • 浏览: 7331351 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

luence学习的指南文档(五)

阅读更多

.搜索引擎的性能考虑信息:

   索引数字:针对数字的检索必须选择支持数字的分析处理器(WhitespaceAnalyzerStandardAnalyzer)但是SimpleAnalyzerStopAnalyzer不知此数字分析;针对数字一般采用 Field.Keyword被检索。在索引中添加它们的原始之前,Luence对域对象使用用字典顺序查找的。类似英语单词在字典中查询。

   索引日期:在检索日期时使用Field.Keyword(String,Date)DateField类,对日期检索,Luence内部使用DateField类将给定的日期转换为适合的字符串类型处理。对字符串的格式化采用字典顺序,这样的目的是便于针对日期范围做查询。

 

调整索引性能的参数

IndexWriter参数

系统属性

默认值

描述

mergeFactor

Org.apache.luence.mergeFactor

10

控制段的合并频率和大小

maxMergeDocs

Org.apache.luence.maxMergeDocs

Integer.MAX_VALUE

限制每个段的文档数量

minMergeDocs

Org.apache.luence.minMergeDocs

10

控制索引时RAM使用的总量

7. 内存中的索引:RAMDirectory

 Luence把新加的文档先保存在内存中后才把它们存到硬盘上,并通过这中方法来进行内存缓冲,如果你正在使用FSDirectory(一个基于文件的具体实现)以上的缓存操作将自动的,透明的的完成。但是你希望对索引过程,内存使用情况和从内存缓冲区到磁盘传送文件的频率某方面进行更多的控制。此时可以把RAMDirectory当作内存缓冲器使用。

     RAMDirectoy在内存中所进行的操作哦比FSDirectory在磁盘上所完成的工作快的多。

分享到:
评论

相关推荐

    luence客户端测试软件luke

    "luence客户端测试软件luke" 指的是一个名为"Luke"的工具,它是针对Apache Lucene(一个流行的全文搜索引擎库)的客户端测试和分析工具。Luence可能是“Lucene”的拼写错误,但在这里我们假设指的是Lucene。 **描述...

    Lucene 2.9 API CHM 官方API学习资料电子书

    lucene 2.9 API , lucene API,lucene 学习资料,lucene2.9 CHM

    lucene学习lucene学习

    1. 准备待索引的文档:确保你的文档是可以被 Lucene 处理的文本格式,例如 .txt 文件。如果文档是非文本格式,如 HTML 或 PDF,你需要先将其转换为纯文本。 2. 创建索引:清单 1 展示了一个简单的 Java 示例,演示...

    Luence.net搜索小程序

    通过"Luence.net搜索小程序",我们可以学习到如何实现实时搜索、高亮显示、盘古分词以及智能匹配等一系列高级搜索功能。 首先,Luence.net是Apache Lucene项目的一个.NET版本,Lucene作为业界知名的全文搜索引擎库...

    Luence和ElasticSearch面试准备.docx

    《Luence和ElasticSearch面试准备》 Lucene和ElasticSearch是两个在全文搜索引擎领域中广泛使用的开源工具。Lucene是一个高性能、全文本搜索库,而Elasticsearch则是在Lucene的基础上构建的一个分布式、RESTful风格...

    获取全部Luence数据

    ### 获取全部Luence数据 #### 知识点详解 **Lucene** 是一个高性能、全功能的文本搜索引擎库。在本文档中,我们将探讨如何通过Lucene获取索引中的所有文档,包括创建索引、查询索引以及遍历所有文档的具体步骤。 ...

    Luence搜索Demo

    总结来说,Luence.Net搜索Demo是一个极好的学习资源,它展示了如何利用Luence进行全文搜索,涵盖了从索引构建、查询解析到结果展示的全过程。通过深入研究和实践,开发者可以提升在.NET环境中构建高效搜索引擎的能力...

    Luence原理及源码分析

    lucene 原理与分析,底层源码解析,应用场景及实践,相关配置

    luence4.6例子

    5. **luence46**: 这个压缩包可能包含了Lucene 4.6版本的源代码,源码提供了深入了解其内部工作原理的机会。你可以通过阅读和分析源代码,学习如何实现自己的搜索功能,或者优化现有系统的搜索性能。 通过对...

    Luence简单实例

    **Lucene简介** Lucene是Apache软件基金会的一个开放源代码项目,它是一个高性能、全文本检索库,提供了Java实现的...这种实例有助于开发者快速理解和掌握Lucene的基本用法,为进一步深入学习和应用Lucene打下基础。

    IKAnalyzer和luence压缩包大全

    **"IKAnalyzer中文分词器V2012_FF使用手册.pdf"** 提供了详细的使用指南,对于初学者来说是非常宝贵的资源。它会解释如何安装IKAnalyzer,如何配置和使用,以及如何解决可能出现的问题。通过阅读这份手册,开发者...

    luence搜索

    1. 文档(Document):在Lucene中,文档是信息的基本单位,它可以包含多个字段(Field),每个字段都有自己的名称和内容,比如标题、内容等。 2. 字段(Field):字段是文档的组成部分,用于存储不同类型的数据,如...

    luence索引例子

    描述中提到“使用luence索引数据库中的记录”,意味着我们将学习如何将数据库中的数据转化为Lucene可处理的格式,并创建索引。这个过程通常包括以下步骤: 1. **初始化Lucene**: 创建一个`Directory`对象,这是...

    lucene基础学习笔记&源码

    **Lucene 基础学习笔记与源码分析** **一、Lucene 概述** Lucene 是一个高性能、全文本搜索库,由 Apache 软件基金会开发并维护。它是一个 Java 开发的开源项目,被广泛应用于各种搜索引擎的构建,支持多种编程...

    Luence in Action 中英文pdf 版

    《Lucene in Action》是一本深入探讨Apache Lucene的权威指南,这本书的中英文PDF版本提供了全面了解和学习这个搜索引擎库的机会。Lucene是Java开发的一款高性能、全文本搜索库,广泛应用于各种需要强大搜索功能的...

    lucene-5.5.3对应的源码文件

    五、高级特性 1. N-gram:支持短语查询,通过生成连续词语的n-gram进行匹配。 2. 断词查询:允许用户输入不完整词汇,利用前缀匹配找到相关结果。 3. 近似搜索:使用模糊匹配算法,如Levenshtein距离,找出拼写...

    lucene-core-7.3.1-API文档-中文版.zip

    包含翻译后的API文档:lucene-core-7.3.1-javadoc-API文档-中文(简体)版.zip; Maven坐标:org.apache.lucene:lucene-core:7.3.1; 标签:apache、lucene、core、中文文档、jar包、java; 使用方法:解压翻译后的API...

    lucene-搜索过程源码解析-Score树

    ### 五、`w.scorer(reader, true, false)`与`TermScorer` 对于基于术语的查询(Term Query),如使用特定关键词进行搜索,`TermScorer`会被构建。它依赖于读取器的`termDocs`方法,以及归一化因子(norms)和相似度策略...

    Lucene5学习之FunctionQuery功能查询

    **标题解析:** "Lucene5学习之FunctionQuery功能查询" Lucene5是Apache Lucene的一个版本,这是一个高性能、全文本搜索库,广泛应用于搜索引擎和其他需要高效文本检索的系统。FunctionQuery是Lucene中的一种查询...

    Luence的与盘古分词的使用软件

    总之,“Luence的与盘古分词的使用软件”是将Lucene.NET和盘古分词相结合,利用C# .NET技术在VS2013环境下构建的一款文本处理应用。它实现了对用户输入句子的分词,以及基于分词结果的索引查询,从而在大量文本数据...

Global site tag (gtag.js) - Google Analytics