Lucene Paoding Demo

q_wong

浏览: 109956 次
性别:
来自: 深圳

最近访客更多访客>>

zhangweixing0

lbyzx123

wowygf

任正信

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

Java Core

lucene

/**
 * 
 * @author Q.Wong [2010-12-17]
 *
 */
public class QueryManager {

	private static Logger logger = LogManager.getLogger(QueryManager.class);

	/**
	 * 执行查询
	 * 
	 * @param analyzer
	 * @param searcher
	 * @param field
	 * @param keyWord
	 * @param n
	 * @return
	 * @throws ParseException
	 * @throws IOException
	 */
	public static TopDocs doQuery(Analyzer analyzer, Searcher searcher,
			String field, String keyWord, int n) throws ParseException,
			IOException {
		QueryParser parser = new QueryParser(Version.LUCENE_30, field, analyzer);
		Query query = parser.parse(keyWord);

		TopDocs hits = searcher.search(query, n);
		return hits;
	}

	/**
	 * 处理查询返回的结果
	 * 
	 * @param hits
	 * @param searcher
	 * @throws CorruptIndexException
	 * @throws IOException
	 */
	public static void resolvedResults(TopDocs hits, Searcher searcher)
			throws CorruptIndexException, IOException {

		ScoreDoc[] scoreDocs = hits.scoreDocs;
		for (ScoreDoc scoreDoc : scoreDocs) {
			Document doc = searcher.doc(scoreDoc.doc);
			logger.info(doc.getField("path") + "   " + scoreDoc.toString()
					+ "  ");
		}

	}

	/**
	 * 执行查询并处理查询结果
	 * 高亮关键字
	 * 
	 * @param analyzer
	 * @param reader
	 * @param fieldName
	 * @param keyWord
	 * @param n
	 * @throws ParseException
	 * @throws IOException
	 * @throws InvalidTokenOffsetsException
	 */
	public static void doQuery(Analyzer analyzer, IndexReader reader,
			String fieldName, String keyWord, int n) throws ParseException,
			IOException, InvalidTokenOffsetsException {
		QueryParser parser = new QueryParser(Version.LUCENE_30, fieldName,
				analyzer);
		Query query = parser.parse(keyWord);

		Searcher searcher = new IndexSearcher(reader);
		TopDocs hits = searcher.search(query, n);

		Highlighter highlighter = new Highlighter(new Formatter() {

			@Override
			public String highlightTerm(String originalText, TokenGroup group) {
				if (group.getTotalScore() <= 0) {
					return originalText;
				}
				return "【" + originalText + "】";
			}
		}, new QueryScorer(query));

		int maxNumFragmentsRequired = 5;
		String fragmentSeparator = "...";

		ScoreDoc[] scoreDocs = hits.scoreDocs;
		for (ScoreDoc scoreDoc : scoreDocs) {
			int docId = scoreDoc.doc;
			Document doc = searcher.doc(docId);
			String text = doc.get(fieldName);
			TermPositionVector tpv = (TermPositionVector) reader
					.getTermFreqVector(docId, fieldName);
			System.out.println(tpv.size());
			TokenStream tokenStream = TokenSources.getTokenStream(tpv);
			String result = highlighter.getBestFragments(tokenStream, text,
					maxNumFragmentsRequired, fragmentSeparator);
			System.out.println(result);
		}
	}

}

分享到：

Lucene Paoding Demo | Lucene Paoding Demo

2010-12-17 15:56
浏览 1392
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Lucene Paoding Demo

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Lucene Paoding Demo

评论

发表评论

相关推荐

Java通过ant调可执行程序

ant自定义任务

字符unicode转换

WSUploadDemo.7z

WS Demo

Lucene Paoding Demo

Lucene Paoding Demo

Sample Regular Expressions

Sample Regular Expressions

Java调BeyondCompare

upgrader3

upgrader1

BAT调Jar

Tomcat跨WebApp

Java获取windows根目录卷标

Java ZIP 压缩

处理Properties

antsvn更新打包部署提交自动化

从File Server上更新资料到本地

从CVS上更新资料到本地

最近访客更多访客>>