`
wanglihu
  • 浏览: 919364 次
  • 性别: Icon_minigender_1
  • 来自: 黑龙江
社区版块
存档分类

lucene3.5更新索引

阅读更多
lucene索引的更新操作其实就是删除索引和添加索引的组合。
具体代码如下:
//按term更新文档(lucene并没有提供专门的索引更新方法,我们需要先将相应的document删除,然后再将新的document加入索引)
public class MyUpdateIndexer{
	public static final String STORE_PATH = "E:/lucene_index";
	public static void updateIndexes(String field , String keyword) throws IOException{
		long startTime = System.currentTimeMillis();
		//首先,我们需要先将相应的document删除
		Directory dir = FSDirectory.open(new File(STORE_PATH));
		IndexReader reader = IndexReader.open(dir,false);
		Term term = new Term(field,keyword);
		reader.deleteDocuments(term);
		reader.close();
		//然后,将新的document加入索引
		Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_35);
		//CREATE - creates a new index or overwrites an existing one
		//APPEND - opens an existing index.
		//CREATE_OR_APPEND - creates a new index if one does not exist,otherwise it opens the index and documents will be appended.
		IndexWriterConfig config = new IndexWriterConfig(Version.LUCENE_35,analyzer).setOpenMode(OpenMode.CREATE);
		IndexWriter writer = new IndexWriter(dir, config);
		for(int i = 0;i<100;i++){
			Document doc = new Document(); 
			doc.add(new Field("title", "lucene title"+i, Field.Store.YES, Field.Index.ANALYZED)); 
			doc.add(new Field("content", "Apache Lucene(TM) is a high-performance", Field.Store.YES, Field.Index.ANALYZED));
			//纯文本文件索引起来,而不想自己将它们读入字符串创建field
			//这里的file就是该文本文件。该构造函数实际上是读去文件内容,并对其进行索引,但不存储。
			//doc.add(new Field("path", new FileReader(new File("路径"))));
			writer.addDocument(doc);
		}
}
		writer.close();
		long endTime = System.currentTimeMillis();
		System.out.println("total time: " + (endTime - startTime) + " ms");
	}
}
分享到:
评论

相关推荐

    luke3.5 查看lucene3.5索引

    luke3.5 可查看lucene3.5索引

    Lucene3.5源码jar包

    在源码中,你可以看到`IndexWriter`类如何处理文档的添加、删除和更新,以及`SegmentMerger`如何合并多个段以优化索引。 2. **分词器(Tokenizer)与过滤器(Filter)**:Lucene支持自定义的分词规则,如`...

    lucene3.5的各种包

    2. **核心包**: Lucene 的核心包包含了一些基础且核心的类和接口,如`IndexWriter`用于创建和更新索引,`Directory`用于存储索引,`Analyzer`用于文本分析,`QueryParser`用于解析用户输入的查询,以及`IndexReader`...

    lucene 3.5 官网 源代码

    4. 索引写入器(IndexWriter):用于创建或更新索引的工具。 5. 查询解析器(QueryParser):将用户输入的查询字符串转化为可执行的查询对象。 6. 搜索器(Searcher):执行查询并返回结果。 二、源代码解析 1. ...

    lucene3.5的创建和增删改查

    本文将详细介绍如何在Lucene 3.5中进行索引的创建、文档的添加、删除、修改和查询操作。 一、创建索引 1. 初始化环境:首先,我们需要导入Lucene的相关库,包括核心库(lucene-core-3.5.0.jar)、分析库(lucene-...

    lucene3.5全文检索案例lucene+demo

    本篇文章将围绕“lucene3.5全文检索案例lucene+demo”,详细讲解Lucene 3.5的核心概念、关键功能以及如何通过实例进行操作。 一、Lucene 3.5核心概念 1. 文档(Document):Lucene中的最小处理单元,相当于数据库...

    Lucene3.5实例

    《Lucene3.5实例详解:构建全文搜索引擎》 Apache Lucene是一个开源的全文检索库,为Java开发者提供了强大的文本搜索功能。在本实例中,我们将深入探讨如何使用Lucene 3.5版本来构建一个基本的全文搜索引擎,主要...

    Lucene 3.5 api HTML版

    **Lucene 3.5 API 概述** Lucene 是一个高性能、全文本搜索库,由 Apache 软件基金会开发。它提供了高级文本检索功能,广泛用于构建搜索引擎和其他需要高效全文检索能力的应用。Lucene 3.5 API 是该库在2011年发布...

    lucene 3.5学习笔记

    2. **IndexWriter**:构建和更新索引的关键组件,控制索引的写入操作。 3. **Directory**:存储索引的接口,支持不同的存储方式,如内存或硬盘。 4. **Segment**:索引的基本单元,包含一组文档。 5. **Term**:代表...

    lucene3.5源码

    1. 分块索引(Compound File Format, CFS):Lucene 3.5引入了CFS,将多个索引段合并成一个大文件,减少了磁盘I/O,提高了性能。 2. 近实时搜索(Near Real-Time Search):通过NRTManager,Lucene能在添加或更新...

    lucene3.5中文分词案例

    《Lucene 3.5中文分词案例解析》 Lucene是一个开源的全文搜索引擎库,广泛应用于各种信息检索系统中。在3.5版本中,Lucene已经支持了中文分词,这对于处理中文文档和搜索需求显得尤为重要。本文将深入探讨Lucene ...

    Lucene3.5的学习研究报告

    Lucene 3.5是一个重要的版本更新,它在2011年11月26日发布,为搜索引擎开发者提供了更高效、更稳定的功能。该版本在性能优化、新特性和错误修复上取得了显著的进步。 首先,Lucene 3.5在内存管理上有了显著的提升,...

    Lucene 3.5&API,最新版

    3. **倒排索引增强**:Lucene 3.5 使用倒排索引来实现快速查找,每个 Term 对应一组文档编号。 4. **Filter 和 QueryWrapperFilter**:这些过滤器可以限制搜索结果,例如,只返回指定范围内的文档。 5. **分词器和...

    lucene3.5的API

    - **近实时搜索**:Lucene 3.5 支持 Near Real Time (NRT) 搜索,即使在持续索引时,也能快速反映最新的索引变化。 - **多字段搜索**:允许同时在多个字段上进行搜索,提高查询效率。 - **命中高亮**:...

    关于lucene3.5的使用

    在“关于lucene3.5的使用”这个主题中,我们将深入探讨Lucene 3.5的关键特性、核心组件以及如何通过实例进行应用。首先,我们需要了解以下几个核心概念: 1. **索引(Index)**:Lucene 的工作基于索引,就像书籍的...

    lucene3.5学习笔记

    `IndexWriter` 是 Lucene 中的核心类之一,用于创建或更新索引。它提供了添加文档、删除文档、优化索引等操作的功能。 **1.1.2 Directory** `Directory` 在 Lucene 中代表了存储索引的地方,可以是硬盘上的文件...

    solr_lucene3.5_lukeall-3.5.0.jar.zip

    标题中的"solr_lucene3.5_lukeall-3.5.0.jar.zip" 提供了关于这个压缩包的基本信息。它包含了Solr和Lucene的特定版本——3.5.0,以及一个名为"lukeall"的工具。"Luke"在Lucene和Solr的上下文中是一个非常有用的工具...

    Lucene测试程序3.5

    在Lucene 3.5中,我们通常会使用`IndexWriter`类来创建或更新索引。这个过程包括读取源文档,使用分词器(Analyzer)将文本分解成关键词,然后将这些关键词及其相关信息(如位置、频率等)存储到倒排索引中。在这个...

    lucene-3.5.0.jar

    - **IndexWriter**:用于创建和更新索引,它管理索引的生命周期,包括添加、删除和修改文档。 - **IndexReader**:用于读取索引,提供搜索操作。 - **IndexSearcher**:执行搜索查询,并返回匹配的Document结果。...

    全文检索lucence3.5+IKAnalzers3.5示例

    在实际项目中,你可能会遇到多线程索引、更新索引、删除索引等问题,Lucene 3.5对此都有很好的支持。同时,为了优化性能,可以考虑使用缓存、倒排索引压缩等技术。 总结,Lucene 3.5结合IKAnalyzer 3.5为开发者提供...

Global site tag (gtag.js) - Google Analytics