`
longzhun
  • 浏览: 372086 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

Lucene2.4 索引库位置介绍

 
阅读更多

在Lucene第一个简单实例中,我们是直接把文件位置indexPah作为索引库位置:

IndexWriter indexWriter = new IndexWriter(indexPath,analyzer,true,MaxFieldLength.LIMITED);

 

今天我们将介绍Lucene提供的一个索引库位置的类Directory

String filePath = "G:\\work5\\luceneDemo\\luceneDatasource\\IndexWriter addDocument's a javadoc .txt";
	String indexPath = "G:\\work5\\luceneDemo\\luceneIndex";
	Analyzer analyzer = new StandardAnalyzer();
	@Test
	public void test1() throws Exception{
		//Directory dir = FSDirectory.getDirectory(indexPath);//FSDirectory 索引库位置是文件系统
		Directory dir = new RAMDirectory();//RAMDirectory 索引库位置是内存
		
		Document doc = File2Document.file2Document(filePath);
		
		IndexWriter indexWriter = new IndexWriter(dir,analyzer,true,MaxFieldLength.LIMITED);
		indexWriter.addDocument(doc);
		indexWriter.close();
	}

 Directory是一个抽象类,提供了2种实现,第一个是FSDirectory,另外一个是RAMDirectory

 

RAMDirectory在内存操作,效率比较高,但不保存

FSDirectory在磁盘操作,IO操作多的话,效率偏低,但可以保存

 

在工作中,我们可以将这2中方式结合起来,灵活运用,如图:

 



 

 

 

 

  • 大小: 16.9 KB
分享到:
评论

相关推荐

    Lucene2.4入门总结

    本文将重点介绍 Lucene 2.4 版本的基本概念和使用方法,帮助初学者快速入门。 ### 一、Lucene 概述 1. **核心概念**:Lucene 的主要组件包括索引(Index)、文档(Document)、字段(Field)和查询(Query)。索引...

    java拼车网雏形(Ext2.0+SSH+oracle10g+lucene2.4)

    【标题】"java拼车网雏形(Ext2.0+SSH+oracle10g+lucene2.4)" 涉及的核心技术是Java Web开发中的几个关键组件,包括ExtJS 2.0前端框架,Spring、Struts2和Hibernate(SSH)后端框架,Oracle 10g数据库以及Lucene ...

    Lucene 2.4 入门例子

    1. **环境配置**:首先,确保安装了Java开发环境(JDK),并添加Lucene 2.4库到项目类路径。 2. **创建索引**: - **文档分析**:使用Analyzer处理文本,分词、去除停用词等预处理操作。 - **字段创建**:定义...

    lucene2.4+nutch学习笔记三:lucene 在多个文本文档里找出包含一些关键字的文档

    在Lucene 2.4版本中,我们需要先创建一个索引,这个过程涉及读取文本文档,解析内容,然后将内容分词(Tokenization),构建倒排索引(Inverted Index)。倒排索引将每个词对应到包含该词的所有文档的列表,从而实现...

    Lucene2.4完美样例+中文文档

    Lucene 是一个高性能、全文本搜索库,由 Apache 软件基金会开发。它为开发者提供了在 Java 应用程序中实现全文检索功能的强大工具。Lucene 2.4 版本是其历史上的一个重要版本,具有稳定性和效率的优势。本文将深入...

    庖丁解牛 源码 for Lucene 2.4

    这个压缩包包含的文件名为"paoding-for-lucene-2.4",很可能是针对中文处理的Paoding Lucene库的源代码分析或扩展。Paoding Lucene是针对Java开发的、专门优化Lucene以提高中文搜索性能的第三方库。 在Lucene 2.4的...

    lucene全文检索简单索引和搜索实例

    在本文中,我们将深入探讨如何基于Lucene 2.4版本创建简单的全文索引并进行搜索操作。 一、Lucene基本概念 1. 文档(Document):在Lucene中,一个文档代表了要索引的信息源,它可以是网页、电子邮件、PDF文档等。...

    Lucene2.4.1

    Lucene是一个高性能、全文检索库,它由Apache软件基金会开发并维护。作为Java编写的一个开源项目,Lucene为构建复杂的搜索功能提供了强大的工具集。本次我们将深入探讨Lucene 2.4.1版本,了解其核心组件及演示示例。...

    基于lucene的索引与搜索

    Lucene是一个开源的Java库,提供了强大的文本分析、索引和搜索功能,被广泛应用于各种信息检索系统中。 第一章 引言 在信息爆炸的时代,搜索引擎成为人们获取信息的重要工具。Apache Lucene作为一款强大的全文搜索...

    lunence2.4例题

    在Lucene 2.4这个版本中,用户可能需要了解如何创建索引、执行查询以及对结果进行排序等基本操作。 【描述】"lunence 2.4 入门 例题 最新版" 表明这是一份针对Lucene 2.4入门的学习资源,包含了一些最新的例题。...

    lucene索引查看工具

    这款已经老了,2.4以后的lucene索引用不了。我上传了最新版本的,有需要的话!请到http://download.csdn.net/source/1423241 下。一款可以查看Lucene分词后在索引的排名以及是否有无该词,很多时候用于查看有无需要...

    基于lucene2.4.0的开发jar包

    1. **lucene-core-2.4.0.jar**:这是Lucene的核心库,包含了所有基本的搜索和索引功能。它包括文档的索引和存储,倒排索引的构建,搜索算法(如布尔运算符、短语查询、模糊查询等),评分机制以及结果排序。此库还...

    Lucene 庖丁解牛分词法2.4版本jar包

    《深入剖析Lucene:庖丁解牛分词法2.4版本》 在中文信息处理领域,Lucene作为一个强大的全文检索引擎库,扮演着至关重要的角色。然而,由于中文的复杂性,简单的英文分词策略无法满足需求,于是有了针对中文的分词...

    Lucene.net2.4.0

    Lucene.NET是一个开源的、高性能的全文检索库,它实现了信息检索的理论和算法,包括分词、索引、查询解析、评分和排序等核心功能。它提供了API,让开发者能够轻松地将全文搜索功能集成到.NET应用程序中。Lucene.NET ...

    lucene-2.3.1.jar

    开发者可以利用Lucene的API来处理和索引地理位置信息,提供精确的地理定位服务,这在现代导航系统、地图应用和位置数据服务中具有广泛的应用。 在Web开发中,jQuery的普及使得前端交互变得更加顺畅。尽管Lucene本身...

    lucene索引

    Lucene 是一个开源的全文搜索引擎库,由 Apache 软件基金会开发。它提供了一个高性能、可扩展的信息检索框架,使得开发者能够轻易地在应用中实现全文搜索功能。本篇文章将深入探讨 Lucene 创建索引的过程以及如何...

    Lucene+原理与代码分析完整版

    《Lucene原理与代码分析》全面解析 Lucene是一个开源的全文搜索引擎库,由Apache...本文仅对Lucene做了基础介绍,实际应用中,开发者还需要根据具体需求对Lucene进行深度学习和实践,以充分利用其功能并解决实际问题。

    Lucene教程

    ### 2.4 索引器(IndexWriter) 索引器(IndexWriter)负责构建和更新Lucene索引。它可以添加、删除和修改文档,并根据需要优化索引。 ### 2.5 搜索器(Searcher) 搜索器(Searcher)执行查询并返回结果。它使用...

Global site tag (gtag.js) - Google Analytics