二、lucene索引_创建_域选项 -

youyang_java

浏览: 319672 次
性别:
来自: 重庆

最近访客更多访客>>

morelily

txlong_onz

LonelyMJ

tianxizhong

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

二、lucene索引_创建_域选项

博客分类：

lucene3.5

Field.Store.YES或者NO(存储域选项)

YES:将会存储域值，原始字符串的值会保存在索引中，以此可以进行相应的恢复操作，对于主键，标题可以是这种方式存储
NO：不会存储域值，通常与Index.ANAYLIZED合起来使用，索引一些如文章正文等不需要恢复的文档，此时内容无法完全还原(doc.get)

Field.Index(索引选项)
Index.ANALYZED:进行分词和索引，适用于标题、内容等
Index.NOT_ANALYZED:进行索引，但是不进行分词，如果身份证号，姓名，ID等，适用于精确搜索
Index.ANALYZED_NOT_NORMS:进行分词但是不存储norms信息，这个norms中包括了创建索引的时间和权值等信息
Index.NOT_ANALYZED_NOT_NORMS:即不进行分词也不存储norms信息
Index.NO:不进行索引

最佳实践：

索引选项存储选项

NOT_ANALYZED_NOT_NORMS    YES    标识符(主键、文件名)，电话号码，身份证号，姓名，日期
ANAYLZED                               YES    文档标题和摘要
ANAYLZED                               NO    文档正文
NO                                         YES    文档类型，数据库主键（不进行索引）
NOT_ANALYZED                        NO    隐藏关键字

索引文件的初步认识：

_0.fdt

_0.fdx

---存储域的值---

_0.fnm

---存储域的名称---

_0.frq

---分词出现的频率---

_0.nrm

---存储评分信息---

_0.prx

---位偏移量---

_0.tii

_0.tis

---索引信息---

文档和域的概念很重要
文档相当于表中的每一条记录，域相当于表中每一个字段

分享到：

三、索引建立步骤 | 一、初步认识lucene

2012-11-19 16:42
浏览 1045
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

二、lucene索引_创建_域选项

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

二、lucene索引_创建_域选项

评论

发表评论

相关推荐

二十七、Luence在项目中运用

二十六、solr的基本使用

二十五、solr与tomcat的整合

二十四、通过NRTManager和SearchManager实现近实时搜索

二十三、高亮显示

二十二、Tika

二十一、Luke

二十、自定义过滤器

十七、搜索过滤

十九、自定义QueryParser

十八、自定义评分

十六、搜索排序

十五、实现简单同义词分词器

十四、中文分词器

十三、自定义Stop分词器

十二、Attribute

十一、分词器的核心类

十、分页搜索

九、Queryparser

八、其他搜索Query

最近访客更多访客>>