第一个lucene的简单实例....

wolftou

浏览: 1342 次
来自: ...

最近访客更多访客>>

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

2007-12 ( 1)
更多存档...

博客分类：

lucene

lucene Apache

这两天第一次接触lucene...对这东西很感兴趣...于是下载了lucene-2.2.0-src.zip下来研究研究...
按照网上的例子敲了敲代码....
却一直出错提示"document.add(Field.Text(...)"行"找不到符号"
后来才明白原来网上的例子大都是lucene 1.4.3版本的...
新版本2.0已经抛弃了原来的一些方法...
于是看了看文档写了个简单的入门实例...
首先是为文件建立索引:TestLucene.java

package wolftou;

import java.io.File;
import java.io.FileReader;
import java.io.Reader;
import java.util.Date;
import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.*;
import org.apache.lucene.document.*;
import org.apache.lucene.document.Field;
import org.apache.lucene.index.IndexWriter;

public class TestLucene {
	public static void main(String[] args) throws Exception {
		File indexDir = new File("D:\\test\\luceneIndex");//要建立索引的文件路径
		File dataDir = new File("D:\\test\\luceneData"); //索引的保存路径
		Analyzer luceneAnalyzer = new StandardAnalyzer();//为文档进行分词处理ChineseAnalyzer()还不会弄.就先用英文的试试
		File[] dataFiles = dataDir.listFiles();	
		IndexWriter indexWriter = new IndexWriter(indexDir, luceneAnalyzer,
				true);//把文件加到索引中来.
		long startTime = new Date().getTime();//记时测试建立索引的时间.
		for (int i = 0; i < dataFiles.length; i++) {
			if (dataFiles[i].isFile()
					&& dataFiles[i].getName().endsWith(".txt")) {//为TXT文件进行索引.
				System.out.println("Indexing file "
						+ dataFiles[i].getCanonicalPath());
				Document document = new Document();  
				Reader txtReader = new FileReader(dataFiles[i]);
				document.add(new Field("path", dataFiles[i].getCanonicalPath()
						.toString(), Field.Store.YES, Field.Index.TOKENIZED,
						Field.TermVector.YES));//向document中加入"path"字段
				document.add(new Field("contents", txtReader));//向document中加入"contents"字段..可以加很多字段.此处只加了两个
				indexWriter.addDocument(document);//将document信息写入索引.
			}
		}
		indexWriter.optimize();//建立完索引后要调用optimize()方法进行优化...
		indexWriter.close();
		long endTime = new Date().getTime();
		System.out.println("it takes " + (endTime - startTime)
				+ " milliseconds to create index for the files in directory "
				+ dataDir.getPath());//输出建立索引耗时...

	}
}

在建立好了索引的基础上进行简单的搜索...TestLuceneSearch.java

package wolftou;

import java.io.File;
import org.apache.lucene.document.Document;
import org.apache.lucene.index.Term;
import org.apache.lucene.search.Hits;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.TermQuery;
import org.apache.lucene.store.FSDirectory;

public class TestLuceneSearch {
	public static void main(String[] args) throws Exception {
		String queryStr = "wolftou";//要搜索的关键字...
		File indexDir = new File("d:\\test\\luceneIndex");//生成的索引存放的路径...
		FSDirectory directory = FSDirectory.getDirectory(indexDir);
		IndexSearcher searcher = new IndexSearcher(directory);//打开索引进行搜索...
		if (!indexDir.exists()) { 
			System.out.println("The lucene index is not exist");
			return;
		}
		Term term = new Term("contents", queryStr.toLowerCase());//对contents字段时行搜索...
		TermQuery luceneQuery = new TermQuery(term);
		Hits hits = searcher.search(luceneQuery);  //返回搜索结果
		if (hits.length() == 0) {
			System.out.println("not found any files with the Key of "
					+ queryStr);
		}
		for (int i = 0; i < hits.length(); i++) {//输出搜索信息...
			Document document = hits.doc(i);
			System.out.println("File: " + document.get("path"));
		}

	}

}

阶段目标:好好研究下中文切词

lucenetest.rar (7.6 KB)
描述: luceneTest
下载次数: 50

分享到：

2007-12-16 18:07
浏览 1342
评论(0)
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

第一个lucene的简单实例....

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

第一个lucene的简单实例....

评论

发表评论

相关推荐

最近访客更多访客>>