在Lucene第一个简单实例中,我们是直接把文件位置indexPah作为索引库位置:
IndexWriter indexWriter = new IndexWriter(indexPath,analyzer,true,MaxFieldLength.LIMITED);
今天我们将介绍Lucene提供的一个索引库位置的类Directory
String filePath = "G:\\work5\\luceneDemo\\luceneDatasource\\IndexWriter addDocument's a javadoc .txt";
String indexPath = "G:\\work5\\luceneDemo\\luceneIndex";
Analyzer analyzer = new StandardAnalyzer();
@Test
public void test1() throws Exception{
//Directory dir = FSDirectory.getDirectory(indexPath);//FSDirectory 索引库位置是文件系统
Directory dir = new RAMDirectory();//RAMDirectory 索引库位置是内存
Document doc = File2Document.file2Document(filePath);
IndexWriter indexWriter = new IndexWriter(dir,analyzer,true,MaxFieldLength.LIMITED);
indexWriter.addDocument(doc);
indexWriter.close();
}
Directory是一个抽象类,提供了2种实现,第一个是FSDirectory,另外一个是RAMDirectory
RAMDirectory在内存操作,效率比较高,但不保存
FSDirectory在磁盘操作,IO操作多的话,效率偏低,但可以保存
在工作中,我们可以将这2中方式结合起来,灵活运用,如图:
- 大小: 16.9 KB
分享到:
相关推荐
本文将重点介绍 Lucene 2.4 版本的基本概念和使用方法,帮助初学者快速入门。 ### 一、Lucene 概述 1. **核心概念**:Lucene 的主要组件包括索引(Index)、文档(Document)、字段(Field)和查询(Query)。索引...
【标题】"java拼车网雏形(Ext2.0+SSH+oracle10g+lucene2.4)" 涉及的核心技术是Java Web开发中的几个关键组件,包括ExtJS 2.0前端框架,Spring、Struts2和Hibernate(SSH)后端框架,Oracle 10g数据库以及Lucene ...
1. **环境配置**:首先,确保安装了Java开发环境(JDK),并添加Lucene 2.4库到项目类路径。 2. **创建索引**: - **文档分析**:使用Analyzer处理文本,分词、去除停用词等预处理操作。 - **字段创建**:定义...
在Lucene 2.4版本中,我们需要先创建一个索引,这个过程涉及读取文本文档,解析内容,然后将内容分词(Tokenization),构建倒排索引(Inverted Index)。倒排索引将每个词对应到包含该词的所有文档的列表,从而实现...
Lucene 是一个高性能、全文本搜索库,由 Apache 软件基金会开发。它为开发者提供了在 Java 应用程序中实现全文检索功能的强大工具。Lucene 2.4 版本是其历史上的一个重要版本,具有稳定性和效率的优势。本文将深入...
这个压缩包包含的文件名为"paoding-for-lucene-2.4",很可能是针对中文处理的Paoding Lucene库的源代码分析或扩展。Paoding Lucene是针对Java开发的、专门优化Lucene以提高中文搜索性能的第三方库。 在Lucene 2.4的...
在本文中,我们将深入探讨如何基于Lucene 2.4版本创建简单的全文索引并进行搜索操作。 一、Lucene基本概念 1. 文档(Document):在Lucene中,一个文档代表了要索引的信息源,它可以是网页、电子邮件、PDF文档等。...
Lucene是一个高性能、全文检索库,它由Apache软件基金会开发并维护。作为Java编写的一个开源项目,Lucene为构建复杂的搜索功能提供了强大的工具集。本次我们将深入探讨Lucene 2.4.1版本,了解其核心组件及演示示例。...
Lucene是一个开源的Java库,提供了强大的文本分析、索引和搜索功能,被广泛应用于各种信息检索系统中。 第一章 引言 在信息爆炸的时代,搜索引擎成为人们获取信息的重要工具。Apache Lucene作为一款强大的全文搜索...
在Lucene 2.4这个版本中,用户可能需要了解如何创建索引、执行查询以及对结果进行排序等基本操作。 【描述】"lunence 2.4 入门 例题 最新版" 表明这是一份针对Lucene 2.4入门的学习资源,包含了一些最新的例题。...
这款已经老了,2.4以后的lucene索引用不了。我上传了最新版本的,有需要的话!请到http://download.csdn.net/source/1423241 下。一款可以查看Lucene分词后在索引的排名以及是否有无该词,很多时候用于查看有无需要...
1. **lucene-core-2.4.0.jar**:这是Lucene的核心库,包含了所有基本的搜索和索引功能。它包括文档的索引和存储,倒排索引的构建,搜索算法(如布尔运算符、短语查询、模糊查询等),评分机制以及结果排序。此库还...
《深入剖析Lucene:庖丁解牛分词法2.4版本》 在中文信息处理领域,Lucene作为一个强大的全文检索引擎库,扮演着至关重要的角色。然而,由于中文的复杂性,简单的英文分词策略无法满足需求,于是有了针对中文的分词...
Lucene.NET是一个开源的、高性能的全文检索库,它实现了信息检索的理论和算法,包括分词、索引、查询解析、评分和排序等核心功能。它提供了API,让开发者能够轻松地将全文搜索功能集成到.NET应用程序中。Lucene.NET ...
开发者可以利用Lucene的API来处理和索引地理位置信息,提供精确的地理定位服务,这在现代导航系统、地图应用和位置数据服务中具有广泛的应用。 在Web开发中,jQuery的普及使得前端交互变得更加顺畅。尽管Lucene本身...
Lucene 是一个开源的全文搜索引擎库,由 Apache 软件基金会开发。它提供了一个高性能、可扩展的信息检索框架,使得开发者能够轻易地在应用中实现全文搜索功能。本篇文章将深入探讨 Lucene 创建索引的过程以及如何...
《Lucene原理与代码分析》全面解析 Lucene是一个开源的全文搜索引擎库,由Apache...本文仅对Lucene做了基础介绍,实际应用中,开发者还需要根据具体需求对Lucene进行深度学习和实践,以充分利用其功能并解决实际问题。
### 2.4 索引器(IndexWriter) 索引器(IndexWriter)负责构建和更新Lucene索引。它可以添加、删除和修改文档,并根据需要优化索引。 ### 2.5 搜索器(Searcher) 搜索器(Searcher)执行查询并返回结果。它使用...