`
wanglihu
  • 浏览: 918281 次
  • 性别: Icon_minigender_1
  • 来自: 黑龙江
社区版块
存档分类

lucene3.x的工作方式

阅读更多
lucene提供的服务实际包含两部分:一入一出。
所谓入是写入,即将你提供的源(本质是字符串)写入索引或者将其从索引中删除;
所谓出是读出,即向用户提供全文搜索服务,让用户可以通过关键词定位源。

1)写入流程
源字符串首先经过analyzer处理,包括:分词,分成一个个单词;去除stopword(可选)。
将源中需要的信息加入Document的各个Field中,并把需要索引的Field索引起来,把需要存储的Field存储起来。
将索引写入存储器,存储器可以是内存或磁盘。

2)读出流程
用户提供搜索关键词,经过analyzer处理。
对处理后的关键词搜索索引找出对应的Document。
用户根据需要从找到的Document中提取需要的Field。
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics