关于Lucene索引合并解决方法

damies

浏览: 239486 次
性别:
来自: 北京

最近访客更多访客>>

tpcrack

.zzzzzz

shenkerer

tingxuelouwq

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

JAVA技术

lucene Apache 中间件 Web F#

由于Clustor的问题造成无法对索引进行同步，脑子中马上浮现用rmi(双机)，UDP广播（多机）作通信中间件对clustor进行索引同步但这样经过测试后效率相对较低，故另辟蹊径，最终用索引合并的方式进行快速的索引整合，达到时间短索引同步快的目的。代码如下：

package com.pccw;

import java.io.File;

import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.store.FSDirectory;

public class AdvancedTextFileIndexer {
	/**
	 * @author Shane Zhao about merge Index in PCCW BJDEV
	 * 将小索引文件合并到大的索引文件中去
	 * 
	 * @param from
	 *            将要合并到to文件的文件
	 * @param to
	 *            将from文件合并到该文件
	 * @param sa
	 */
	private static void mergeIndex(File from, File to,StandardAnalyzer sa) {
		IndexWriter indexWriter = null;
		try {
			System.out.println("正在合并索引文件!\t ");
			indexWriter = new IndexWriter(to, sa, false);
			indexWriter.setMergeFactor(100000);
			indexWriter.setMaxFieldLength(Integer.MAX_VALUE);
			indexWriter.setMaxBufferedDocs(Integer.MAX_VALUE);
			indexWriter.setMaxMergeDocs(Integer.MAX_VALUE);
			FSDirectory[] fs = { FSDirectory.getDirectory(from, false) };
			indexWriter.addIndexes(fs);
			indexWriter.optimize();
			indexWriter.close();
			System.out.println("已完成合并!\t ");
		} catch (Exception e) {
			System.out.println("合并索引出错！");
			e.printStackTrace();
		} finally {
			try {
				if (indexWriter != null)
					indexWriter.close();
			} catch (Exception e) {

			}

		}

	}
	
	public static void main(String[] areg){
		File from = new File("F:/web/faq/lucene/indexDir");
		File to = new File("F:/indexDir");
		mergeIndex(from,to,new StandardAnalyzer());
	}

}

测试效率为两个150M的索引文件合并时间在10-15s 效率还是很令人满意的。

分享到：

txt读取字符串（为实习生作的例子） | 封掉MSN后仍可登录的方法

2008-01-28 10:21
浏览 9361
评论(3)
查看更多

3 楼 bluepeer 2011-08-18

有没有试过性能？？

2 楼 gml520 2010-04-06

非常谢谢！

1 楼 diddyrock 2009-03-11

thanks

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

关于Lucene索引合并解决方法

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

关于Lucene索引合并解决方法

评论

发表评论

相关推荐

Lucene全文检索样例（解决大文本建索引）

txt读取字符串（为实习生作的例子）

Spring 2.0 AOP 与事务配置

关于Soeckt 流操作的数据转换工具方法

Java socket开发实例入门

不使用webwork标签直接用Jsp取得Action中的值

23种模式趣味解释

关于领域逻辑的三个主要模式

又谈领域模型

简单Socket编程,来理解Socket

[JMX一步步来] 9、基于JBoss来写MBean

[JMX一步步来] 8、编写程序来连接MBean

[JMX一步步来] 7、用JDK5.0的JConsole来连接MBean

[JMX一步步来] 6、模型Bean：Model Bean

[JMX一步步来] 5、用Apache的commons-modeler来辅助开发JMX

[JMX一步步来] 4、动态MBean：DynamicMBean

[JMX一步步来] 3、Notification的使用

[JMX一步步来] 2、JMX简介

[JMX一步步来] 1、JMX的Hello World

JAVA RMI 实例

最近访客更多访客>>

[JMX一步步来]　9、基于JBoss来写MBean

[JMX一步步来]　8、编写程序来连接MBean

[JMX一步步来]　7、用JDK5.0的JConsole来连接MBean

[JMX一步步来]　6、模型Bean：Model Bean

[JMX一步步来]　5、用Apache的commons-modeler来辅助开发JMX

[JMX一步步来]　4、动态MBean：DynamicMBean

[JMX一步步来]　3、Notification的使用

[JMX一步步来]　2、JMX简介

[JMX一步步来]　1、JMX的Hello World