`
deepfuture
  • 浏览: 4400317 次
  • 性别: Icon_minigender_1
  • 来自: 湛江
博客专栏
073ec2a9-85b7-3ebf-a3bb-c6361e6c6f64
SQLite源码剖析
浏览量:80073
1591c4b8-62f1-3d3e-9551-25c77465da96
WIN32汇编语言学习应用...
浏览量:70040
F5390db6-59dd-338f-ba18-4e93943ff06a
神奇的perl
浏览量:103345
Dac44363-8a80-3836-99aa-f7b7780fa6e2
lucene等搜索引擎解析...
浏览量:285784
Ec49a563-4109-3c69-9c83-8f6d068ba113
深入lucene3.5源码...
浏览量:15012
9b99bfc2-19c2-3346-9100-7f8879c731ce
VB.NET并行与分布式编...
浏览量:67553
B1db2af3-06b3-35bb-ac08-59ff2d1324b4
silverlight 5...
浏览量:32147
4a56b548-ab3d-35af-a984-e0781d142c23
算法下午茶系列
浏览量:45986
社区版块
存档分类
最新评论

lucene-索引日期与索引数字和排序

阅读更多

一、索引日期

1、Field.Keyword(String,Date)方法和DateField类进行索引

索引今天的日期可以这么做:

Document doc=new Document();

doc.add(Field.Keyword("indexDate",new Date()));

lucene内部使用了DateField类将日期转成字符串。

2、可以先转换为YYYYMMDD格式的字符串,再使用Fiedl.Keyword(String,String)方法。使用这种方式的另一个充分的理由是可以索引1970.1.1以前的日期。

3、字符串的排列是以字典顺序排列的。

二、索引数字

1、lucene通过在内部将数值处理为字符串的方式索引数值。如果需要索引的数字在自由形式文本出现,要选择支持数字的Analyzer类,可选择WhitespaceAnalyzer和StandardAnalyzer,能把数字提取为一个语汇单元并传递到索引中。

2、仅有单个数字值不要分析,可做为Keyword索引

3、lucene是按字典顺序排序,因此10,6,91为字典顺序,必须前补充0为:10,06,91,这样排序后为06,10,91

三、索引Field对象用于排序

1.如果希望能按某个域对象排序,它必须是一个被索引但不被语汇单元化的域对象增加到文档中.

2.域对象必须是可转换成整形、浮点型、字符串型。

分享到:
评论

相关推荐

    lucene-core-3.0.2.jar,lucene-demos-3.0.2.jar

    这里我们主要聚焦于Lucene 3.0.2版本,通过分析其核心组件和示例演示,来深入探讨这个版本的特性与应用。 首先,我们来看看`lucene-core-3.0.2.jar`。这是Lucene的核心库,包含了所有用于创建、索引和搜索文档的...

    lucene-core-2.4.0.jar

    作为Java实现的全文检索引擎,Lucene提供了一套高度可扩展的API,支持索引和搜索大量文本数据。在“lucene-core-2.4.0.jar”这个版本中,Lucene已经相当成熟,可以满足各种复杂的搜索需求。 二、核心组件 1. 文档...

    Lucene-core-2.0.0.jar

    首先,Lucene的核心概念包括文档(Document)、字段(Field)、索引(Index)和查询(Query)。一个文档可以包含多个字段,如标题、内容等,每个字段都可以被索引以便搜索。索引是Lucene的核心,它将文本数据转换...

    拼音分词 Pinyin4j+pinyinAnalyzer+lucene-analyzers

    pinyinAnalyzer是Lucene的一个分析器,它利用了Pinyin4j的功能,能够将输入的中文文本分词并转化为拼音形式,以便于Lucene这样的全文搜索引擎进行索引和查询。而lucene-analyzers则是Lucene的一系列分析器集合,包含...

    lucene-core-2.3.0 lucene-core2.4.0以及极易分词器 jar包

    `lucene-core-2.3.0` 是Lucene的一个早期版本,它包含了构建基本搜索引擎所需的基本组件,如文档处理、索引创建、查询解析和结果排序等。这个版本可能不包含后来版本中的一些优化和特性,比如更先进的分词技术、性能...

    lucene-memory-3.0.1.jar

    Apache Lucene是一个开源Java库,它提供了一套完整的搜索和分析工具,包括分词、索引、查询解析、评分和排序等功能。Lucene的主要任务是将非结构化的文本数据转化为可供快速检索的结构化索引,从而提升搜索效率。而...

    最新全文检索 lucene-5.2.1 入门经典实例

    - Lucene支持对已索引文档进行更新和删除,保证数据的实时性。 在提供的"lucene5.2.1入门经典案例"中,你可以找到如何创建索引、执行查询、高亮显示结果等具体操作的示例代码。这些案例可以帮助初学者快速理解和...

    lucene-5.0.0 完整资源(包含Jar包)

    1. **分词和索引**:Lucene能够对输入文档进行分词,创建一个高效的倒排索引,使得在大量数据中快速查找匹配项成为可能。这个过程包括分析、tokenization、词干提取和停用词处理等步骤。 2. **查询解析**:用户输入...

    最全的lucene-2.4.0jar包

    它可以评估查询与索引中文档的相关性,并根据评分排序返回结果。 - **Document和Field**:在Lucene中,信息以Document对象的形式存储,每个Document包含一个或多个Field,每个Field都有自己的名字和内容,可以设置...

    Lucene-core-2.0.0

    6. **学习路径**: 学习Lucene可以从理解基本概念和数据结构开始,然后通过编写简单的索引和搜索程序来实践,逐步深入到高级特性,如分片、分布式搜索、性能调优等。 7. **安全注意事项**: 使用第三方库时,应确保...

    MMAnalyzer 分词必导入jar包(lucene-core-2.4.1.jar je-analysis-1.5.3.jar)

    本篇文章将深入探讨MMAnalyzer的使用以及与之相关的两个核心JAR包:`jeasy.analysis.MMAnalyzer`和`lucene-core-2.4.1.jar`。 首先,MMAnalyzer是JeasyAnalysis的一部分,JeasyAnalysis是一个轻量级的中文分析库,...

    lucene-2.9.2.jar包+源码

    《深入理解Lucene-2.9.2:中文分词与TF-IDF搜索引擎解析》 Lucene是一个开源的全文检索库,由Apache软件基金会开发,它提供了强大的文本搜索功能,被广泛应用于各种信息检索系统中。本文将围绕“lucene-2.9.2.jar”...

    lucene-4.0.0-src.zip 【Lucene 4.0.0源码包src , source】

    5. **内存与磁盘存储(Memory & Disk Storage)**:Lucene利用`RAMDirectory`和`FSDirectory`等类管理索引在内存和磁盘上的存储,以平衡性能和资源消耗。 为了在Eclipse中查看和理解这些源码,我们需要进行以下步骤...

    lucene-4.2.1-src.tgz

    7. **高级功能**:Lucene还包括多线程支持、近实时搜索、自定义排序、过滤器(`Filter`)和拦截器(`Collector`)等高级特性,允许开发者进行更复杂的检索策略设计。 8. **扩展性**:Lucene本身只是一个库,开发者...

    lucene-5.5.3.zip

    - **DocValues**:用于存储字段的不可变值,如日期、分类标签等,提供高效的排序和过滤功能。 - **块级压缩**:改进了存储效率,降低了磁盘空间的占用。 3. **Lucene的使用** - **创建索引**:使用`IndexWriter`...

    lucene-project.zip

    5. **搜索(Search)**:用户提交查询后,Lucene会使用查询解析器解析输入,生成查询对象,然后与索引进行匹配,返回最相关的文档。 6. **评分(Scoring)**:Lucene会根据多个因素(如词频、文档频率等)对匹配的...

    lucene-core-4.9.3,开源jar包

    Apache Lucene是一个高性能、全文本搜索引擎库,被广泛应用于各种项目和产品中,提供强大的文本分析和索引功能。这里的“lucene-core-4.9.3.jar”正是这个开源项目的最新版本,它包含了Lucene的核心功能。下面我们将...

    java全文搜索lucene-3.0.0-src+lib.zip

    Lucene的工作流程主要包括索引创建、索引读取和搜索三个阶段: - 创建索引:使用Analyzer处理文档,生成Token流,然后通过IndexWriter写入索引。 - 读取索引:使用IndexReader打开已有的索引文件。 - 搜索:Searcher...

    最新版linux lucene-8.10.0.tgz

    - **Searcher**:负责查询执行和结果返回,包括Query解析、评分和排序。 - **Query**:表示用户的搜索请求,可以是简单的关键词查询,也可以是复杂的布尔表达式。 - **Score**:Lucene通过TF-IDF算法计算每个文档...

    最新版 lucene-9.3.0.tgz

    6. **更新与删除**:Lucene允许动态地更新和删除索引中的文档,确保信息的实时性。9.3.0可能会对这些操作的效率进行优化。 7. **内存管理**:为了提高性能,Lucene会缓存部分索引数据。9.3.0可能包含改进的内存管理...

Global site tag (gtag.js) - Google Analytics