`
tuzi883
  • 浏览: 1147 次
  • 性别: Icon_minigender_1
  • 来自: 宁波
最近访客 更多访客>>
文章分类
社区版块
存档分类
最新评论

关于增量索引与非增量索引的一个注意点

阅读更多
在学习lucene的过程中。碰到一个小问题。就是在创建IndexWriter对象的过程中,如果使用
增量索引的话,也就是使用如下方式创建IndexWriter对象时:IndexWriter write=new IndexWriter(path,new StandardAnalyzer(),false).那么一定要保证索引文件已经存在,如果不存在,就会发生java.io.FileNotFoundException异常。no segments* file found in org.apche.lucene.store.FSDirectory@E:\lucene\index:files:
所以第一次创建索引的时候一定要用到true.等创建了以后,再可以改成false。
分享到:
评论
2 楼 springoflove 2009-05-08  
IndexWriter writer = null;
		try {
			writer = new IndexWriter(indexDir, 
					analyzer, false);
		} catch (FileNotFoundException ee) {
			writer = new IndexWriter(indexDir, 
					analyzer, true);
		}
1 楼 luckaway 2009-05-07  
恩。是的!如果不指定的话~~! 顺便附上判断索引目录是否为空的方法

public boolean isEmpty(String indexDirName) {
		final String indexDirPath = getIndexDirPath(indexDirName);
		boolean hasIndex = false;
		boolean hasSegments = false;
		File indexDir = new File(indexDirPath);
		if (indexDir.isDirectory() && indexDir.canRead()) {
			String[] indexList = indexDir.list();
			for (int i = 0; i < indexList.length; i++) {
				File file = new File(indexList[i]);
				if (file != null && file.getName() != null && file.getName().indexOf(".cfs") > 0) {
					hasIndex = true;
				} else if (file != null && file.getName() != null && file.getName().indexOf("segments") >= 0) {
					hasSegments = true;
				}
			}
		}
		return !(hasIndex && hasSegments);
	}

相关推荐

    基于lucene技术的增量索引

    通过上述步骤,我们可以构建一个基于Lucene的增量索引系统,高效地处理数据变化,同时保持搜索效率。在实际应用中,还需要结合具体的业务需求和数据特性进行定制化开发。通过持续监控和优化,我们可以确保系统的稳定...

    Lucene5学习之增量索引(Zoie)

    Lucene本身并不直接支持增量索引,因此,开发者们开发了Zoie系统,它是基于Lucene的一个扩展,旨在解决大数据量场景下的实时索引问题。Zoie的名字来源于“Zero Indexing Overhead”,即零索引开销,它的核心思想是...

    跟益达学Solr5之增量索引MySQL数据库表数据

    4. **触发增量索引**: Solr提供了一个命令行工具或API接口来触发增量索引。每次数据库有变更时,执行这个命令,Solr将只处理那些变化的数据。 5. **处理增量数据**: 当Solr接收到增量数据后,它会将这些数据转化为...

    Solr数据库插入(全量和增量)索引

    Solr 数据库插入全量和增量索引 Solr 是一个基于 Lucene 的搜索引擎,可以快速高效地对大量数据进行索引和查询。在实际应用中,我们需要将数据插入 Solr 索引库中,以便实现高效的搜索功能。本文将详细介绍 Solr ...

    lucene分词搜索,增量索引及全量索引

    《Lucene分词搜索、增量索引与全量索引详解》 在现代信息检索系统中,搜索引擎扮演着至关重要的角色。Apache Lucene是一个高性能、全文本搜索库,被广泛应用于构建复杂的数据检索应用。本文将深入探讨Lucene的分词...

    solr增量导入更新索引包

    在你的描述中提到了"solr增量添加更新索引包",这可能是一个包含增量更新信息的压缩文件。这个包可能包含了DIH从数据库中获取的变更记录,或者是用于更新Solr索引的特定指令集。解压并应用这个包,可以将这些变更...

    sphinx增量索引的一个问题

    标题中的“sphinx增量索引的一个问题”指的是在使用Sphinx搜索引擎时遇到的关于增量索引功能的问题。Sphinx是一个开源全文搜索引擎,它允许开发者通过API进行集成,以实现高效、精确的全文检索功能。增量索引是...

    增量索引2

    根据提供的文件信息,本文将重点解析“增量索引”这一概念及其在Lucene中的应用,并结合其他相关知识点进行深入探讨。 ### 增量索引概述 #### 1. 定义与背景 增量索引是指在现有索引的基础上,只对新增或更新的...

    coreseek mysql 索引配置文件 包含增量索引

    coreseek mysql 索引配置文件 增量索引

    slor定时增量更新索引dataimport.properties

    slor定时增量更新索引dataimport.properties

    Nutch开源搜索引擎增量索引recrawl的终极解决办法续

    在前一篇文章中,我们探讨了Nutch开源搜索引擎在进行增量索引更新(recrawl)时遇到的问题及其初步解决方案。然而,在实际操作过程中发现,尽管解决了基本的增量更新逻辑,但在执行`indexmerge`命令后,新旧索引合并...

    windows 下 mssql sphinx 增量索引配置文件

    windows 下 sphinx 增量索引配置文件 mssql

    niko-w#gitbook#增量索引1

    开始数据库中的数据索引情况后来插入数据针对增量索引太慢的问题已解决……

    java solr solrj 带账号密码增量查询添加索引

    主要讲解了 solr客户端如何调用带账号密码的solr服务器调用,实现添加索引和查询索引,以及分组查询

    Nutch开源搜索引擎增量索引recrawl的终极解决办法

    ### Nutch开源搜索引擎增量索引recrawl的终极解决办法 #### 知识点解析: **Nutch与Hadoop集成下的recrawl策略** Nutch是一款基于Java的开源搜索引擎框架,能够爬取网页、提取数据并建立索引。它利用Apache ...

    solr定时索引

    以上就是关于Solr定时索引的详细解释,包括增量索引和完整索引的实现方式,以及在Solr 7.3版本中配置和使用的步骤。理解并熟练掌握这些知识,将有助于你在实际项目中更好地利用Solr进行高效的数据检索。

    索引的正确使用

    - 在使用范围查询时,如 `SELECT * FROM EMP WHERE DEPTNO &gt;= 4`,应该注意,这种方式能够充分利用索引,但 `SELECT * FROM EMP WHERE DEPTNO &gt; 3` 则可能只能够查找第一个大于3的记录,而不是从第4个部门开始查找...

Global site tag (gtag.js) - Google Analytics