`
wanglihu
  • 浏览: 918240 次
  • 性别: Icon_minigender_1
  • 来自: 黑龙江
社区版块
存档分类

lucene3.x的目录结构

阅读更多
lucene包括core和sandbox两部分,其中core是lucene稳定的核心部分,sandbox包含了一些附加功能,例如highlighter、各种分析器。
Lucene core有七个包:analysis,document,index,messages,queryParser,search,store,collation,util。
1 analysis
Analysis包含一些内建的分析器,例如按空白字符分词的WhitespaceAnalyzer,添加了stopwrod过滤的StopAnalyzer,最常用的StandardAnalyzer。
2 document
Document包含文档的数据结构,例如Document类定义了存储文档的数据结构,Field类定义了Document的一个域。
3 index
Index 包含了索引的读写类,例如对索引文件的segment进行写、合并、优化的IndexWriter类和对索引进行读取和删除操作的 IndexReader类,这里要注意的是不要被IndexReader这个名字误导,以为它是索引文件的读取类,实际上删除索引也是由它完成, IndexWriter只关心如何将索引写入一个个segment,并将它们合并优化;IndexReader则关注索引文件中各个文档的组织形式。
4 queryParser
QueryParser 包含了解析查询语句的类,lucene的查询语句和sql语句有点类似,有各种保留字,按照一定的语法可以组成各种查询。 Lucene有很多种 Query类,它们都继承自Query,执行各种特殊的查询,QueryParser的作用就是解析查询语句,按顺序调用各种 Query类查找出结果。
5 search
Search包含了从索引中搜索结果的各种类,例如刚才说的各种Query类,包括TermQuery、BooleanQuery等就在这个包里。
6 store
Store包含了索引的存储类,例如Directory定义了索引文件的存储结构,FSDirectory为存储在文件中的索引,RAMDirectory为存储在内存中的索引,MmapDirectory为使用内存映射的索引。
7 util
Util包含一些公共工具类,例如时间和字符串之间的转换工具。
8 messages
9 collation
分享到:
评论

相关推荐

    IKAnalyzer 支持高版本最新Lucene 5.x、6.x、7.x

    3. **Lucene 5.x、6.x、7.x的关键特性**: - Lucene 5.x引入了新的DocValues格式,提高了索引的压缩率和查询速度。同时,支持更强大的多字段搜索和聚合功能。 - Lucene 6.x进一步优化了内存使用,增强了查询性能,...

    Lucene4.X实战类baidu搜索的大型文档海量搜索系统-15.Lucene高级进阶1 共23页.pptx

    【Lucene4.X实战类baidu搜索的大型文档海量搜索系统】课程主要涵盖了Lucene搜索引擎的各个方面,包括基础和高级进阶。以下是课程的主要知识点: 1. **Lucene入门与系统架构**:介绍Lucene的基本概念,以及其系统...

    Lucene4.X实战类baidu搜索的大型文档海量搜索系统-08.Lucene搜索实战2 共5页.pptx

    在"Lucene4.X实战类baidu搜索的大型文档海量搜索系统"课程中,涵盖了一系列关于Lucene的核心知识点,包括入门、系统架构、索引构建与优化、搜索机制以及高级进阶等内容。 **1. Lucene入门与系统架构** Lucene的入门...

    Lucene4.X实战类baidu搜索的大型文档海量搜索系统-11.Lucene搜索深入实战进阶1 共4页.pptx

    《Lucene4.X实战类百度搜索的大型文档海量搜索系统》系列课程主要涵盖了Lucene搜索引擎的各个核心概念和实战技巧,旨在帮助学习者深入理解并掌握Lucene的使用方法。在这一系列课程中,我们将逐步解析Lucene的系统...

    Lucene4.X实战类baidu搜索的大型文档海量搜索系统-03.Lucene索引里有什么 共17页.pptx

    《Lucene4.X实战类baidu搜索的大型文档海量搜索系统》课程主要涵盖了Lucene的基础概念、架构、索引原理及优化、搜索实现、实战应用等多个方面,旨在帮助学习者深入理解并掌握Lucene这一强大的全文搜索引擎库。...

    lucene3.0.1.zip

    《深入剖析Lucene 3.0.1:Java开源...然而,随着技术的发展,后续的版本(如Lucene 4.x及更高版本)引入了更多改进和新特性,如更强大的分布式支持和优化的内存管理,开发者应关注并适时升级以适应不断变化的技术需求。

    Lucene.Net.2.3

    - **索引(Index)**:这是Lucene的基础,它将非结构化的文本数据转换成可以高效搜索的结构化表示。索引过程包括分词、建立倒排索引等步骤。 - **文档(Document)**:一个文档对象用于存储要被索引的信息,如网页...

    lucene-jdbcdirectory:Lucene 5.x JdbcDirectory实现

    JdbcDirectory是Lucene对传统FSDirectory(文件系统目录)的一种扩展,它将索引文件存储在数据库中,而不是本地文件系统。这种设计使得索引可以在多台机器间共享,同时也支持分布式搜索环境。JdbcDirectory基于Java...

    IKAnalyzer fro lucence5.x

    IKAnalyzer for Lucene5.x 是一个专门为Lucene 5.x版本优化的中文分词器。在中文信息检索领域,分词器是至关重要的组件,它负责将连续的汉字序列分割成具有独立语义的词语,以便进行后续的索引和查询操作。IK...

    lucene-databasedirectory:Lucene 5.x数据库目录实现

    【标题】"lucene-databasedirectory:Lucene 5.x数据库目录实现"涉及的核心知识点是Lucene,一个流行的全文搜索引擎库,以及如何利用Java在Lucene 5.x版本中实现数据库目录。Lucene允许开发者高效地索引、搜索和管理...

    中文分词器(mmseg4j + luncene5.X)源码+jar包

    在Lucene5.x版本中,引入了更高效的倒排索引结构和查询优化策略,增强了对多语言的支持,包括对中文的处理。Lucene允许开发者自定义分词器,这就为mmseg4j与Lucene的结合提供了可能。 **mmseg4j与Lucene5.x整合** ...

    lucene2.9.4

    《Lucene 2.9.4:开源全文检索库的深度探索》 Lucene,作为Apache软件基金会的一个顶级项目,...尽管现在有更新的版本如Lucene 8.x,但2.9.4版本的知识仍然值得我们去挖掘和掌握,因为它奠定了Lucene后续发展的基础。

    Lucene.Net

    - Lucene.Net 1.x 至 2.x 的主要升级包括性能优化、错误修复和新特性的添加。随着版本的升级,对.NET框架的支持也逐步增强,兼容了更多的.NET版本。 - 特别提到的2.9.2和2.9.4版本,不仅包含了完整的库文件,还提供...

    lucene-6.5.1

    Lucene 6.5.1作为该系列的一个版本,继承了Lucene 6.x系列的诸多优点,并在此基础上进行了优化与增强,以提高搜索性能和稳定性。 ### 特性与改进 #### 1. 性能提升 - **索引速度**: Lucene 6.5.1通过改进内部算法...

    luke8用于查看lucene保存的索引库数据和文档数据

    - **版本兼容**:luke8与Lucene的版本相对应,例如这里的8.0.0版本,适用于Lucene 8.x系列。 - **可配置性**:用户可以根据需求自定义显示的字段和设置,比如隐藏某些不重要的字段,或者调整界面布局。 - **导出功能...

    lucene-core-3.0.2.jar,lucene-demos-3.0.2.jar

    《深入理解Lucene 3.0.2:核心与演示》 在信息技术领域,搜索引擎的构建是至关...然而,随着技术的不断发展,后续的版本(如6.x、8.x)带来了更多的改进和新特性,开发者在选择时也应考虑到版本的更新和兼容性问题。

    lucene索引查看工具luck7.4.0

    使用Luke 7.4.0,你可以深入了解Lucene 7.x版本的索引结构和工作原理,从而提高你的搜索引擎应用的效率和准确性。 总的来说,`Luck 7.4.0`是一款不可或缺的Lucene工具,它提供了对索引的深度洞察,使得开发和优化...

    ES2.xapi及2.x的权威指南英文版

    3. **平滑升级**:2.x版本旨在平滑升级自1.x版本,确保数据迁移的安全性。 4. **增强的搜索性能**:通过优化内部算法和数据结构,提高了搜索速度和效率。 5. **更强大的集群管理**:包括更智能的自动故障恢复和更好...

    lucene.rar

    3. **lucene.jar**:早期版本的Lucene所有组件的集合,可能包含3.x版本的其他组件。在3.6.0之后,Lucene的模块化设计使得各个组件分别打包,因此单独的`lucene.jar`可能不再更新。 4. **lucene-highlighter-3.5.0....

Global site tag (gtag.js) - Google Analytics