Lucene的Field类型 - java0 - ITeye博客

`

java0

浏览: 10236 次
性别:
来自: 杭州

最近访客更多访客>>

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

Lucene的Field类型

博客分类：

luecne应用收集

阅读更多

1. 2.0以前的版本

Keyword: Field的值将被保存到索引文件，为Field的值建立索引，建立索引时不需要分词。
UnIndexed: Field的值将被保存到索引文件，不为Field的值建立索引，因此不能通过该Field搜索文档。
UnStored: Field的值不被保存到索引文件，将Field的值分词后建立索引
Text: Field的值分词后建立索引。如果参数为String值将被保存，为Reader值不被保存

2. 2.0版本
用几个内部类的组合来区分Field的具体类型。

Store

COMPRESS:压缩保存。用于长文本或二进制数据

YES：保存

NO：不保存

Index

NO：不建索引

TOKENIZED：分词，建索引

UN_TOKENIZED：不分词，建索引

NO_NORMS：不分词，建索引。但是Field的值不像通常那样被保存，而是只取一个byte，这样节约存储空间

TermVector

NO：不保存term vectors

YES：保存term vectors。

WITH_POSITIONS：保存term vectors。（保存值和token位置信息）

WITH_OFFSETS：保存term vectors。（保存值和Token的offset）WITH_POSITIONS_OFFSETS：保存term vectors。（保存值和token位置信息和Token的offset）

分享到：

一个小工具 | Ajax应用演示

2007-09-19 19:25
浏览 1855
评论(0)
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

一步一步跟我学习Lucene源码之lucene的各种Field: 1. **Field类型**：Lucene中的Field有多种类型，如TextField、StringField、NumericField等。TextField适合全文检索，StringField则用于存储不可变的非全文数据，NumericField用于存储数值型数据，便于比较和排序。 ...

lucene索引文件格式介绍: 了解这些文件格式后，我们还要知道Lucene索引中使用的基本数据类型，如Byte、UInt32、UInt64和VInt。VInt是一种变长整数类型，它根据数值大小动态占用字节，有效地节省了存储空间。总的来说，Lucene的索引文件格式...

Lucene的使用与优化: Field是Document的组成部分，用于存储不同类型的字段，如标题、正文等。每个Field有存储和索引两个属性，可以根据需求来决定是否存储内容和是否建立索引。 4. **Term**： Term是搜索的基本单位，由词语和所在的...

基于Lucene的Lucene: Document由多个Field组成，每个Field包含不同类型的数据，如标题、正文等。 3. **Field**: Document中的一个属性，具有特定的名称和值，如“title”字段用于存储文档标题，“content”字段用于存储正文。 4. **...

Lucene3.0特性，Lucene3.0特性: - **其他优化**：新增了多种查询类型，扩展了多关键字查询（包括通配符、前缀等），并增强了对特定语言（如波斯语、阿拉伯语及中文）的分析能力。同时，Unicode支持得到加强，引入了新的查询分析框架，并加入了基于...

lucene 4.7.2 Demo: 在4.7.2版本中，Lucene引入了通用对象搜索，这意味着你可以根据自定义的对象类型进行搜索，这极大地扩展了Lucene的应用场景。范围搜索是Lucene的另一个亮点，允许用户按数值或日期范围进行过滤。例如，你可以搜索...

Annotated Lucene 中文版 Lucene源码剖析: 首先，Lucene的核心概念包括文档（Document）、字段（Field）、索引（Index）和查询（Query）。文档是信息的基本单位，可以包含多个字段，每个字段都有特定的类型，如文本、日期或数字。索引过程将文档中的文本转换...

C#调用Lucene方法-实现快速搜索: 它能够对文本进行分词，建立倒排索引，并支持布尔查询、短语查询等多种查询类型。为了在C#中使用Lucene，我们需要借助.NET上的Lucene.NET，这是一个与Java Lucene兼容的.NET框架版本。接下来，我们探讨C#调用...

Lucene3.5源码jar包: 9. **文档处理**：`Document`类和`Field`类是处理文档数据的基本单元，源码中可以看到它们如何封装和存储信息。 10. **性能调优**：通过分析源码，开发者可以了解到如何调整各种参数，如缓存大小、合并策略等，来...

lucene、lucene.NET详细使用与优化详解: - Token：term在文档中的具体出现实例，包含词语、位置信息和类型。 4. 优化策略 - 选择合适的Analyzer：针对不同的语言和应用场景，选择合适的分词规则可以显著提升搜索效果。 - 索引优化：合理设置Field的存储...

非常详细的Lucene文档: 4. **文档（Document）**: 在 Lucene 中，文档是由字段（Field）组成的，每个字段有其特定的含义和搜索属性。例如，`title` 和 `content` 字段。 5. **倒排索引（Inverted Index）**: 这是 Lucene 最重要的数据结构...

lucene3源码分析: - **基本类型**：定义了索引文件中使用的数据类型。 - **基本规则**：阐述了文件格式设计的基本原则。 - **具体格式**： - **正向信息**：包括段元数据、字段元数据和字段数据等信息。 - **反向信息**：涉及词典、...

Lucene搜索技术: - **org.apache.lucene.document**：定义了Document对象，作为存储结构，文档由多个Field组成，每个Field对应不同类型的文献数据。 - **org.apache.lucene.field**：表示文档中的各个字段，定义了字段的类型和属性。...

lucene的简单介绍以及使用: 5. 词元实例（Token）：词元在文档中的具体出现，包含位置信息和类型字符串。 6. 分区（Segment）：索引过程中，先将文档写入小文件（Segment），随后合并成大索引文件。 **Lucene 的结构** Lucene 主要包含以下包...

Lucene学习源码.rar: 一个文档可以包含多个字段（Field），每个字段都有特定的类型，如文本、数字或日期。 2. 字段（Field）：文档中的信息单元，如文章的标题、内容、作者等。字段具有可搜索、可存储和可索引等特性，这些特性可以在...

lucene教程（全文搜索引擎）: 每个Document可以包含多个Field，用于存储不同类型的元数据。 #### Field Field是Document的组成部分，每个Field有存储和索引两个属性。存储属性决定是否将Field内容保存以便后续检索，索引属性决定是否对Field...

Lucene全文搜索_LuceneJava全文搜索_: 首先，Lucene的核心概念包括文档（Document）、字段（Field）、索引（Index）和搜索（Search）。文档是信息的基本单位，可以包含多个字段，如标题、内容、作者等。每个字段可以设置不同的分析器来处理不同类型的文本...

lucene1.4.3.jar: 首先，我们需要了解Lucene的核心概念，如文档（Document）、字段（Field）、术语（Term）和倒排索引（Inverted Index）。每个文档是由多个字段组成的，字段可以设置不同的属性，如是否存储、是否可搜索等。术语是...

Lucene 索引的简单使用: - **字段（Field）**：字段是文档的组成部分，每个字段都有特定的类型（如文本、日期等），并可以被索引或存储。 - **索引（Index）**：索引是Lucene处理数据的核心，它将文本数据转换为可供快速搜索的结构。 - **...

lucene的jar包，欢迎下载: 2. **文档表示**：在Lucene中，每个文档都是由一系列字段（Field）组成，每个字段有自己的类型（如文本、数值或日期），并可以设置是否可被搜索或存储。 3. **查询解析**：用户输入的查询字符串会被转换成Lucene...

Global site tag (gtag.js) - Google Analytics