lucene-索引日期与索引数字和排序 - 深未来(深度创造未来)[deepfuture@yeah.net] - ITeye博客

`

deepfuture

浏览: 4436068 次
性别:
来自: 湛江

最近访客更多访客>>

linxl2011

mars36

jccz_zys

zkm0309

博主相关

博客

微博

相册

收藏

留言

关于我

博客专栏

: SQLite源码剖析
浏览量：80430

: WIN32汇编语言学习应用...
浏览量：70973

: 神奇的perl
浏览量：104281

: lucene等搜索引擎解析...
浏览量：287821

: 深入lucene3.5源码...
浏览量：15192

: VB.NET并行与分布式编...
浏览量：68561

: silverlight 5...
浏览量：32666

: 算法下午茶系列
浏览量：46357

文章分类

社区版块

存档分类

最新评论

yoyo837： counters15 写道目前只支持IE吗？插件的东西是跨浏览 ...
Silverlight 5 轻松开启绚丽的网页3D世界
shuiyunbing：直接在前台导出方式：excel中的单元格样式怎么处理，比如某行 ...
Flex导出Excel
di1984HIT：写的很好~
lucene入门-索引网页
rjguanwen：在win7 64位操作系统下，pygtk的Entry无法输入怎 ...
pygtk-entry
ldl_xz： http://www.9958.pw/post/php_exc ...
PHPExcel常用方法汇总(转载)

lucene-索引日期与索引数字和排序

博客分类：

搜索引擎

阅读更多

一、索引日期

1、Field.Keyword(String,Date)方法和DateField类进行索引

索引今天的日期可以这么做:

Document doc=new Document（）；

doc.add(Field.Keyword("indexDate",new Date()))；

lucene内部使用了DateField类将日期转成字符串。

2、可以先转换为YYYYMMDD格式的字符串，再使用Fiedl.Keyword(String,String)方法。使用这种方式的另一个充分的理由是可以索引1970.1.1以前的日期。

3、字符串的排列是以字典顺序排列的。

二、索引数字

1、lucene通过在内部将数值处理为字符串的方式索引数值。如果需要索引的数字在自由形式文本出现，要选择支持数字的Analyzer类，可选择WhitespaceAnalyzer和StandardAnalyzer，能把数字提取为一个语汇单元并传递到索引中。

2、仅有单个数字值不要分析，可做为Keyword索引

3、lucene是按字典顺序排序，因此10,6,91为字典顺序，必须前补充0为：10,06,91，这样排序后为06,10,91

三、索引Field对象用于排序

1.如果希望能按某个域对象排序,它必须是一个被索引但不被语汇单元化的域对象增加到文档中.

2.域对象必须是可转换成整形、浮点型、字符串型。

分享到：

lucene-索引过程和搜索过程的核心类 | lucene-可追加的域

2009-12-25 22:26
浏览 2631
评论(0)
论坛回复 / 浏览 (0 / 2549)
分类:编程语言
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

lucene-core-3.0.2.jar,lucene-demos-3.0.2.jar: 这里我们主要聚焦于Lucene 3.0.2版本，通过分析其核心组件和示例演示，来深入探讨这个版本的特性与应用。首先，我们来看看`lucene-core-3.0.2.jar`。这是Lucene的核心库，包含了所有用于创建、索引和搜索文档的...

lucene-core-2.4.0.jar: 作为Java实现的全文检索引擎，Lucene提供了一套高度可扩展的API，支持索引和搜索大量文本数据。在“lucene-core-2.4.0.jar”这个版本中，Lucene已经相当成熟，可以满足各种复杂的搜索需求。二、核心组件 1. 文档...

Lucene-core-2.0.0.jar: 首先，Lucene的核心概念包括文档（Document）、字段（Field）、索引（Index）和查询（Query）。一个文档可以包含多个字段，如标题、内容等，每个字段都可以被索引以便搜索。索引是Lucene的核心，它将文本数据转换...

拼音分词 Pinyin4j+pinyinAnalyzer+lucene-analyzers: pinyinAnalyzer是Lucene的一个分析器，它利用了Pinyin4j的功能，能够将输入的中文文本分词并转化为拼音形式，以便于Lucene这样的全文搜索引擎进行索引和查询。而lucene-analyzers则是Lucene的一系列分析器集合，包含...

lucene-core-2.3.0 lucene-core2.4.0以及极易分词器 jar包: `lucene-core-2.3.0` 是Lucene的一个早期版本，它包含了构建基本搜索引擎所需的基本组件，如文档处理、索引创建、查询解析和结果排序等。这个版本可能不包含后来版本中的一些优化和特性，比如更先进的分词技术、性能...

lucene-memory-3.0.1.jar: Apache Lucene是一个开源Java库，它提供了一套完整的搜索和分析工具，包括分词、索引、查询解析、评分和排序等功能。Lucene的主要任务是将非结构化的文本数据转化为可供快速检索的结构化索引，从而提升搜索效率。而...

最新全文检索 lucene-5.2.1 入门经典实例: - Lucene支持对已索引文档进行更新和删除，保证数据的实时性。在提供的"lucene5.2.1入门经典案例"中，你可以找到如何创建索引、执行查询、高亮显示结果等具体操作的示例代码。这些案例可以帮助初学者快速理解和...

lucene-5.0.0 完整资源(包含Jar包): 1. **分词和索引**：Lucene能够对输入文档进行分词，创建一个高效的倒排索引，使得在大量数据中快速查找匹配项成为可能。这个过程包括分析、tokenization、词干提取和停用词处理等步骤。 2. **查询解析**：用户输入...

最全的lucene-2.4.0jar包: 它可以评估查询与索引中文档的相关性，并根据评分排序返回结果。 - **Document和Field**：在Lucene中，信息以Document对象的形式存储，每个Document包含一个或多个Field，每个Field都有自己的名字和内容，可以设置...

Lucene-core-2.0.0: 6. **学习路径**: 学习Lucene可以从理解基本概念和数据结构开始，然后通过编写简单的索引和搜索程序来实践，逐步深入到高级特性，如分片、分布式搜索、性能调优等。 7. **安全注意事项**: 使用第三方库时，应确保...

MMAnalyzer 分词必导入jar包（lucene-core-2.4.1.jar je-analysis-1.5.3.jar）: 本篇文章将深入探讨MMAnalyzer的使用以及与之相关的两个核心JAR包：`jeasy.analysis.MMAnalyzer`和`lucene-core-2.4.1.jar`。首先，MMAnalyzer是JeasyAnalysis的一部分，JeasyAnalysis是一个轻量级的中文分析库，...

lucene-2.9.2.jar包+源码: 《深入理解Lucene-2.9.2：中文分词与TF-IDF搜索引擎解析》 Lucene是一个开源的全文检索库，由Apache软件基金会开发，它提供了强大的文本搜索功能，被广泛应用于各种信息检索系统中。本文将围绕“lucene-2.9.2.jar”...

lucene-4.0.0-src.zip 【Lucene 4.0.0源码包src , source】: 5. **内存与磁盘存储（Memory & Disk Storage）**：Lucene利用`RAMDirectory`和`FSDirectory`等类管理索引在内存和磁盘上的存储，以平衡性能和资源消耗。为了在Eclipse中查看和理解这些源码，我们需要进行以下步骤...

lucene-4.2.1-src.tgz: 7. **高级功能**：Lucene还包括多线程支持、近实时搜索、自定义排序、过滤器（`Filter`）和拦截器（`Collector`）等高级特性，允许开发者进行更复杂的检索策略设计。 8. **扩展性**：Lucene本身只是一个库，开发者...

lucene-4.0.0完整包: - **性能优化**: 在4.0.0版本中，Lucene 对索引和搜索的性能进行了优化，提升了处理速度和内存效率。 - **查询解析器增强**: 查询解析器的改进使得查询表达式更易于理解和使用，同时支持更多的查询语法。 - **多字段...

lucene-5.5.3.zip: - **DocValues**：用于存储字段的不可变值，如日期、分类标签等，提供高效的排序和过滤功能。 - **块级压缩**：改进了存储效率，降低了磁盘空间的占用。 3. **Lucene的使用** - **创建索引**：使用`IndexWriter`...

lucene-project.zip: 5. **搜索（Search）**：用户提交查询后，Lucene会使用查询解析器解析输入，生成查询对象，然后与索引进行匹配，返回最相关的文档。 6. **评分（Scoring）**：Lucene会根据多个因素（如词频、文档频率等）对匹配的...

lucene-core-4.9.3，开源jar包: Apache Lucene是一个高性能、全文本搜索引擎库，被广泛应用于各种项目和产品中，提供强大的文本分析和索引功能。这里的“lucene-core-4.9.3.jar”正是这个开源项目的最新版本，它包含了Lucene的核心功能。下面我们将...

java全文搜索lucene-3.0.0-src+lib.zip: Lucene的工作流程主要包括索引创建、索引读取和搜索三个阶段： - 创建索引：使用Analyzer处理文档，生成Token流，然后通过IndexWriter写入索引。 - 读取索引：使用IndexReader打开已有的索引文件。 - 搜索：Searcher...

最新版linux lucene-8.10.0.tgz: - **Searcher**：负责查询执行和结果返回，包括Query解析、评分和排序。 - **Query**：表示用户的搜索请求，可以是简单的关键词查询，也可以是复杂的布尔表达式。 - **Score**：Lucene通过TF-IDF算法计算每个文档...

Global site tag (gtag.js) - Google Analytics