`

lucene入门代码五(在搜索结果中使用高亮)

阅读更多
1.本代码需要的jar包有:
lucene-core-3.0.0.jar
lucene-analyzers-3.0.0.jar
lucene-highlighter-3.0.0.jar

代码如下:
package com.yale.lucene;


import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.SimpleAnalyzer;
import org.apache.lucene.analysis.TokenStream;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.Term;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TermQuery;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.search.highlight.Highlighter;
import org.apache.lucene.search.highlight.QueryScorer;
import org.apache.lucene.search.highlight.SimpleSpanFragmenter;
import org.apache.lucene.search.highlight.TokenSources;
import org.apache.lucene.store.RAMDirectory;
import org.apache.lucene.util.Version;
/**
 * 
 * 为了简单起见,创建内存目录,存放索引,然后在contents高亮搜索关键字
 *
 */
public class HighlightAtSearchResult
{
	private static final String text =
			"In this section we'll show you how to make the simplest " +
			"programmatic query, searching for a single term, and then " +
			"we'll see how to use QueryParser to accept textual queries. " +
			"In the sections that follow, we’ll take this simple example " +
			"further by detailing all the query types built into Lucene. " +
			"We begin with the simplest search of all: searching for all " +
			"documents that contain a single term.";
	public static void main(String[] args) throws Exception
	{
		//创建索引
		RAMDirectory dir = new RAMDirectory();
		IndexWriter writer = new IndexWriter(dir,new StandardAnalyzer(
				Version.LUCENE_30), IndexWriter.MaxFieldLength.UNLIMITED);
		Document doc = new Document();
		doc.add(new Field("title","highlight matches in search results",Field.Store.NO,Field.Index.NOT_ANALYZED_NO_NORMS));
		doc.add(new Field("contents",text,Field.Store.YES,Field.Index.ANALYZED));
		writer.addDocument(doc);
		IndexReader reader = writer.getReader();
		//查询索引
		IndexSearcher searcher = new IndexSearcher(reader);
		TermQuery query = new TermQuery(new Term("contents", "term"));
		TopDocs hits = searcher.search(query,10);
		QueryScorer scorer = new QueryScorer(query, "contents");
		Highlighter highlighter = new Highlighter(scorer);
		highlighter.setTextFragmenter(new SimpleSpanFragmenter(scorer));
		Analyzer analyzer = new SimpleAnalyzer();
		for(ScoreDoc sd :hits.scoreDocs){
			Document docs = searcher.doc(sd.doc);
			String contents = docs.get("contents");
			TokenStream tokens = TokenSources.getAnyTokenStream(searcher.getIndexReader(),sd.doc,"contents",analyzer);
			String fragment =
					highlighter.getBestFragments(tokens, contents,3,"...");
					System.out.println(fragment);
		}
		reader.close();
		searcher.close();
		writer.close();
		
	}
}

分享到:
评论

相关推荐

    lucene搜索的简单入门例子源代码

    本篇将通过一个简单的入门例子,带你了解如何使用Lucene进行搜索。 首先,我们要知道Lucene的核心组件包括文档(Document)、字段(Field)、索引(Index)和查询(Query)。在Lucene中,信息是以文档的形式存储,...

    lucene 入门资料包

    以上是Lucene入门的基本知识和关键概念,通过深入学习和实践,你可以掌握如何利用Lucene构建强大的全文搜索引擎。记住,实践中遇到的问题往往是最好的学习资源,不断尝试和解决,你将逐渐成为Lucene的专家。

    luceneDemo(完整代码)

    在"luceneDemo4.0"中,你将会看到以上概念的具体应用,包括创建索引、执行查询、高亮展示结果以及调整排序逻辑的示例代码。通过实践这个项目,你不仅可以了解Lucene的基本操作,还能学习到如何在实际项目中优化搜索...

    lucene入门到项目开发.docx

    3. lucene-highlighter-2.4.1.jar:用于高亮搜索结果中的匹配关键字。 4. lucene-analyzers-2.4.1.jar:包含了各种语言的分析器,用于对文本进行预处理,如分词、去除停用词等。 二、基础概念 1. Document:在...

    lucene学习入门程序

    - Lucene提供Highlighter类,用于在搜索结果中高亮显示匹配的关键词。这有助于用户快速识别搜索结果中与查询相关的部分。 5. **范围搜索** - 范围搜索允许你在特定范围内查找值,例如日期或数字。在Lucene中,你...

    lucene3.6入门实例教程

    3. **查询与搜索**:讲解如何使用查询解析器将用户输入的字符串转换为Lucene查询对象,然后利用搜索器在索引中查找匹配的文档。此外,还会涉及评分系统(Scoring),它决定了搜索结果的相关性。 4. **结果集处理**...

    最新全文检索 lucene-5.2.1 入门经典实例

    在提供的"lucene5.2.1入门经典案例"中,你可以找到如何创建索引、执行查询、高亮显示结果等具体操作的示例代码。这些案例可以帮助初学者快速理解和应用Lucene-5.2.1的核心功能。通过实践,你可以更深入地了解Lucene...

    lucene 入门一

    总结起来,Lucene入门涉及理解其索引和查询机制,掌握如何在Java项目中创建、管理和使用索引,以及如何执行有效的查询。CargoSearchServiceImpl.java和ManageCargoIndexServiceImpl.java代表了具体实现这些功能的...

    Lucene索引搜索简介以及入门实例源码.rar

    4. **高亮显示**:突出显示搜索结果中的关键词。 5. **相似性(Similarity)**:调整评分算法,根据文档的相关性对结果排序。 6. **复杂查询语法**:支持布尔逻辑、短语查询、范围查询等多种复杂的查询表达式。 ...

    lucene中文下载

    - **高亮显示**:突出显示搜索结果中的匹配词汇。 - **近实时搜索**:Lucene 支持近实时搜索,即新增或更新的文档能在短时间内被搜索到。 **6. 学习资源** - **官方文档**:Apache Lucene 的官方文档是学习的最佳...

    lucene_demo例子

    在"lucene_demo"这个压缩包中,很可能包含了一些示例代码或者项目,用于演示如何使用Lucene进行实际的文本搜索开发。这些示例通常会涵盖以下几个关键知识点: 1. **安装与配置**:Lucene的下载、构建环境的搭建,...

    lucene基本使用

    在Java项目中使用Lucene,首先需要在项目中引入Lucene的依赖库。对于Maven项目,可以在pom.xml文件中添加对应的Lucene版本依赖。然后,根据项目需求选择合适的Analyzer,例如标准Analyzer用于处理英文文本,中文则...

    开发自己的搜索引擎《lucene2.0+heritrix》一书对应的源码资料

    在《开发自己的搜索引擎》一书中,通过`ch2-lucene入门小例子`,读者可以了解到如何使用Lucene 2.0创建简单的搜索引擎,例如建立索引、执行搜索等基本操作。而`myReserch-可用的网络搜索引擎`可能包含一个完整的搜索...

    个人搜索引擎开发的三种高亮显示的方法小结

    在个人搜索引擎的开发过程中,高亮显示是一种提升用户体验的关键技术,它能帮助用户快速定位到搜索结果中的关键词,使得信息的查找更为直观高效。本文将详细介绍三种常用的高亮显示方法,这些方法基于Lucene框架,...

    Apache Lucene3.0 入门实例介绍

    在`luceneDemo`项目中,你可以找到示例代码,它通常包含索引创建、查询执行以及结果处理的示例。通过学习这个实例,你将能够理解Lucene的基本工作流程,并能进一步探索其高级特性。记住,实践是掌握Lucene的关键,...

    Lucene入门源码

    **Lucene入门源码解析** Lucene是一款高性能、全文检索库,由Apache软件基金会开发,广泛应用于各种搜索引擎和信息检索系统。它提供了丰富的API,使得开发者可以方便地在应用程序中实现全文检索功能。本篇文章将...

    Lucene5学习之创建索引入门示例

    在实际应用中,我们可能还需要实现更复杂的功能,如多字段搜索、评分机制、高亮显示等。同时,Lucene还提供了工具类,如IndexReader和IndexSearcher,用于读取和搜索已建立的索引,这些在后续的Lucene学习中都是非常...

    Lucene搜索引擎资源大全

    - **高亮显示**: 在搜索结果中突出显示匹配的关键词。 - **拼写检查**: 自动纠正用户的拼写错误。 - **分布式搜索**: 通过Solr或Elasticsearch等扩展支持大规模数据的分布式搜索。 5. **实战应用** - **网站...

    lucene.net2.9.4.2编译版

    Lucene.NET,作为.NET平台上的一款全文搜索引擎库,是Apache Lucene项目在Java平台上的移植,它为.NET开发者提供了强大的文本检索功能。本编译版为2.9.4.2,相较于2.9.4版进行了一些局部改进,提升了性能和稳定性。 ...

    Lucene.zip

    3. **高亮显示**:使用Highlighter组件,将搜索关键词在结果中高亮显示。 4. **近实时搜索**:通过NRT(Near Real Time)模式,即使在持续索引时也能快速返回最新结果。 5. **分面搜索**:利用Facet API进行分类统计...

Global site tag (gtag.js) - Google Analytics