lucene Field部分参数设置含义

csdn_zuoqiang

浏览: 848351 次
性别:
来自: 深圳

最近访客更多访客>>

wrgjwrrjurhj

qijojo

game438951

arpenker

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

Lucene

         /**
         * Field.Store.COMPRESS:压缩保存,用于长文本或二进制数据
         * Field.Store.YES:保存
         * Field.Store.NO:不保存
         *
         * Field.Index.NO:不建立索引
         * Field.Index.TOKENIZED:分词,建索引
         * Field.Index.UN_TOKENIZED:不分词,建索引
         * Field.Index.NO_NORMS:不分词,建索引.但是Field的值不像通常那样被保存，而是只取一个byte，这样节约存储空间
         *
         * Field.TermVector.NO:不保存term vectors
         * Field.TermVector.YES:保存term vectors
         * Field.TermVector.WITH_POSITIONS:保存term vectors.(保存值和token位置信息)
         * Field.TermVector.WITH_OFFSETS:保存term vectors.(保存值和Token的offset)
         * Field.TermVector.WITH_POSITIONS_OFFSETS:保存term vectors.(保存值和token位置信息和Token的offset)
         */

分享到：

UIManager | Lucene 3.5 代码片段

2011-12-26 15:47
浏览 5260
评论(1)
分类:编程语言
查看更多

1 楼 csdn_zuoqiang 2011-12-26

Field.Store.YES:存储字段值（未分词前的字段值）
Field.Store.NO:不存储,存储与索引没有关系
Field.Store.COMPRESS:压缩存储,用于长文本或二进制，但性能受损

Field.Index.ANALYZED:分词建索引
Field.Index.ANALYZED_NO_NORMS:分词建索引，但是Field的值不像通常那样被保存，而是只取一个byte，这样节约存储空间
Field.Index.NOT_ANALYZED:不分词且索引
Field.Index.NOT_ANALYZED_NO_NORMS:不分词建索引，Field的值去一个byte保存

TermVector表示文档的条目（由一个Document和Field定位）和它们在当前文档中所出现的次数
Field.TermVector.YES:为每个文档（Document）存储该字段的TermVector
Field.TermVector.NO:不存储TermVector
Field.TermVector.WITH_POSITIONS:存储位置
Field.TermVector.WITH_OFFSETS:存储偏移量
Field.TermVector.WITH_POSITIONS_OFFSETS:存储位置和偏移量

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论