`

Lucene检索索引

 
阅读更多
package com;

import java.io.File;
import java.io.IOException;
import java.util.HashMap;
import java.util.Map;
import org.wltea.analyzer.lucene.IKAnalyzer;
import org.wltea.analyzer.lucene.IKQueryParser;
import org.wltea.analyzer.lucene.IKSimilarity;

public class Search {
	public static void main(String[] args) throws Exception {
		String fieldName = "discript";
		String keyword = "人民";
		/*Query IkQuery = searchIKQuery(fieldName, keyword);
		executeQuery(fieldName, keyword,IkQuery);*/
		BooleanQuery booleanQuery = searchBooleanQuery(keyword);
		executeQuery(fieldName, booleanQuery);
	}

	public static BooleanQuery searchBooleanQuery( String keyword) throws Exception {
		BooleanQuery bq = new BooleanQuery();

		Analyzer analyzer = new IKAnalyzer();
		String[] fn = {"name"};
		// 增加权重
		Map<String, Float> filedmap = new HashMap();
		filedmap.put("name", 50f);

		MultiFieldQueryParser multField = new MultiFieldQueryParser(Version.LUCENE_30, fn, analyzer, filedmap);
		Query muquery = multField.parse(keyword);
		
		Query ikquery = IKQueryParser.parseMultiField(fn,keyword);
		
		Term term1 = new Term("discript",keyword);
		TermQuery tq = new TermQuery(term1);  
		bq.add(tq,BooleanClause.Occur.MUST);
		bq.add(muquery, BooleanClause.Occur.SHOULD);
		//bq.add(ikquery, BooleanClause.Occur.MUST);
        System.out.println(bq);
		return bq;
	}
    
	public static Query searchIKQuery(String fieldName, String keyword) throws IOException{
		// 使用IKQueryParser查询分析器构造Query对象
		Query query = IKQueryParser.parse(fieldName, keyword);
		
		return query;
	}
	public static IndexSearcher createSeacher() throws Exception {
		IndexSearcher isearcher = null;
		Directory directory = null;
		File file = new File("C:/commFile/lucence");
		directory = FSDirectory.open(file);
		// 实例化搜索器
		isearcher = new IndexSearcher(directory);

		// 在索引器中使用IKSimilarity相似度评估器
		isearcher.setSimilarity(new IKSimilarity());
		if (directory != null) {
			directory.close();
		}
		return isearcher;
	}

	public static void executeQuery(String fieldName,Query query)throws Exception {
		// 实例化IKAnalyzer分词器
		Analyzer analyzer = new IKAnalyzer();
		IndexSearcher isearcher = createSeacher();
		try {
			Sort sort = new Sort();
			// 按字段的排序(一个或多个)
			SortField[] f = { new SortField("name", SortField.STRING, false) };
			sort.setSort(f);
			// 搜索相似度最高的10条记录
			//TopDocs topDocs = isearcher.search(query, null, 10, sort);
			TopDocs topDocs = isearcher.search(query, 10);

			// 关键字高亮显示
			Formatter formatter = new SimpleHTMLFormatter("<font color=\"red\">", "</font>"); // 前缀和后缀
			Scorer scorer = new QueryScorer(query);
			Highlighter highlighter = new Highlighter(formatter, scorer);
			highlighter.setTextFragmenter(new SimpleFragmenter(200)); // 字长度
			System.out.println("命中文章的篇数:" + topDocs.totalHits);
			// 输出结果
			ScoreDoc[] scoreDocs = topDocs.scoreDocs;
			for (int i = 0; i < topDocs.totalHits; i++) {
				int docId =scoreDocs[i].doc;
				Document targetDoc = isearcher.doc(docId);   
				System.out.println("内容:" + targetDoc.get(fieldName)+"===="+targetDoc.get("name"));//输出相应字段的内容
				String hupName = highlighter.getBestFragment(analyzer,fieldName,targetDoc.get(fieldName));
				//System.out.println(hupName);
			}

		} catch (Exception e) {
			e.printStackTrace();
		} finally {
			if (analyzer != null) {
				analyzer.close();
			}
			if (isearcher != null) {
				isearcher.close();
			}

		}

	}


}


分享到:
评论

相关推荐

    lucene全文检索简单索引和搜索实例

    《Lucene全文检索:简单索引与搜索实例详解》 Lucene是Apache软件基金会的开源项目,是一款强大的全文检索库,被广泛应用于Java开发中,为开发者提供了构建高性能搜索引擎的能力。在本文中,我们将深入探讨如何基于...

    Lucene检索文本,建立索引

    在这个场景中,我们将探讨如何利用Lucene来检索文本并建立索引,同时结合Struts框架构建一个Web程序。 首先,**Lucene** 是一个开源的Java库,它提供了完整的搜索功能,包括分词、索引创建、查询解析和结果排序。它...

    lucene检索文档、检索大数据量数据

    综上所述,Lucene是处理大数据量文本检索的理想选择,其强大的索引和查询功能,以及对分布式环境的支持,使得它在各种信息检索应用中表现出色。通过深入理解和有效利用Lucene,开发者可以构建出高效、灵活的全文搜索...

    lucene检索小例子

    这个"lucene检索小例子"程序展示了如何利用Lucene的强大功能来构建索引和执行搜索操作。Lucene的核心特性包括文本分析、索引创建、查询解析以及高效的搜索算法,使得开发者能够轻松地在大量文本数据中实现快速、准确...

    一种基于Lucene检索引擎的全文数据库的研究与实现

    ### 一种基于Lucene检索引擎的全文数据库的研究与实现 #### 1. 引言 随着信息技术的飞速发展和互联网的普及,大量的文本信息被数字化存储,这为信息检索带来了前所未有的挑战和机遇。传统的数据库管理系统(DBMS)...

    基于lucene技术的增量索引

    Apache Lucene是一个开源的全文检索库,被广泛应用于构建高效、可扩展的搜索功能。本文将深入探讨如何利用Lucene实现增量索引,这是一种在数据库或文件系统更新时仅对新数据或变化数据进行索引的技术,以降低资源...

    Lucene读取索引文件

    总的来说,Lucene通过精心设计的索引结构和高效的读取机制,实现了对大量文本数据的快速检索。开发者在使用Lucene时,应充分理解其内部机制,以便更好地优化查询性能和维护索引。 在开发过程中,有时会遇到需要查看...

    lucene检索新闻数据演示

    【标题】"lucene检索新闻数据演示"涉及的是利用Apache Lucene这个开源全文搜索引擎库,对新闻数据进行索引和搜索的实践操作。Lucene是一个高性能、可伸缩的信息检索库,它提供了一个简单但功能强大的API,可以用于在...

    基于lucene的索引与搜索

    Lucene是一个开源的Java库,提供了强大的文本分析、索引和搜索功能,被广泛应用于各种信息检索系统中。 第一章 引言 在信息爆炸的时代,搜索引擎成为人们获取信息的重要工具。Apache Lucene作为一款强大的全文搜索...

    Lucene全文检索引擎

    3. **索引(Index)**:索引是Lucene的核心,它是对文档集合的结构化表示,使得能快速进行全文检索。Lucene通过分词(Tokenization)、词干提取(Stemming)、去除停用词(Stopword Removal)等过程将原始文本转换...

    lucene实现索引查询

    Lucene 是一个高性能、全文本搜索库,被广泛用于构建高效的搜索引擎和信息检索系统。它提供了完整的搜索功能,包括分析、索引、查询以及结果排序等。在Java开发中,Lucene 提供了丰富的API来简化这些操作。以下是...

    lucene索引结构原理

    **Lucene索引结构原理** Lucene是Apache软件基金会的开放源代码全文搜索引擎库,它为Java开发人员提供了强大的文本搜索功能。理解Lucene的索引结构原理对于优化搜索性能和设计高效的搜索应用至关重要。 首先,我们...

    lucene 索引小示例

    《Lucene索引小示例解析》 Lucene是一个高性能、全文检索库,它由Apache软件基金会开发并维护。在Java编程环境中,Lucene被广泛应用于构建搜索功能,特别是对于大量文本数据的高效检索。本篇文章将通过一个简单的小...

    Lucene全文检索案例

    Lucene的核心是建立索引,这是全文检索的基础。索引过程包括读取数据源(如文本文件或数据库),分词(Tokenization),并为每个文档创建倒排索引(Inverted Index)。在这个案例中,你可能需要创建一个`...

    Lucene 索引的简单使用

    Lucene,作为Apache软件基金会的一个开源项目,是Java平台上的全文检索库,它提供了文本检索的核心工具,使得开发者能够快速地在应用程序中实现高级的搜索功能。本篇文章将详细阐述如何使用Lucene来创建和查询索引,...

    Lucene检索数据库支持中文检索

    ### Lucene检索数据库支持中文检索 #### 一、Lucene简介与原理 ##### 1. Lucene概述 Lucene是一款高性能、全功能的文本搜索引擎库,由Java编写而成。其核心功能是为开发者提供构建搜索应用程序的基础框架。Lucene...

    lucene并行索引

    Lucene的核心是基于倒排索引(Inverted Index)的数据结构,这种结构非常适合于文档检索。倒排索引的基本思想是为每个文档中的每个词建立索引,并记录该词出现在哪些文档中及其位置信息。 - **倒排索引**:对于每个...

    lucene索引查看程序及代码

    在信息技术领域,搜索引擎的高效运作离不开底层索引技术的支持,而Lucene作为Apache软件基金会的一个开放源代码项目,正是一个强大的全文检索库,它提供了高效的文本搜索功能。本文将围绕“lucene索引查看程序及代码...

    Lucene3.0创建索引

    在Lucene3.0中创建索引是一个关键功能,可以帮助用户快速地检索和管理大量的文本数据。本篇文章将详细介绍如何使用Lucene3.0来创建索引,并通过一个具体的例子来演示整个过程。 #### 一、Lucene3.0简介 Lucene是一...

    lucene索引查看工具及源码

    在使用 Lucene 进行信息检索时,有时我们需要对建立的索引进行查看、调试或分析,这时就需要借助 Lucene 的索引查看工具。 Luke 是一个非常实用的 Lucene 索引浏览器,全称为 Lucidworks Luke。它允许用户以图形化...

Global site tag (gtag.js) - Google Analytics