`

Lucene_demo07_Sort匹配度

阅读更多
Lucene_demo07_Sort匹配度



/**
 * @see 1、相同的结构,相同的关键词,得分一样
 * @see 2、相同的结构,不同的关键词,得分不一样,一般情况下,中文高于英文
 * @see 3、不同的结构,相同的关键词,关键词的得分越高,排名越靠前.关键词出现的频率越高,得分越高
 * @see 4、lucene的竞价排名
 */
public class SortTest {
	@Test
	public void testSearchIndex() throws Exception {
		IndexSearcher indexSearcher = new IndexSearcher(LuceneUtils.directory);
		QueryParser queryParser = new MultiFieldQueryParser(Version.LUCENE_30, new String[] { "title", "content" }, LuceneUtils.analyzer);
		Query query = queryParser.parse("NBA");
		TopDocs topDocs = indexSearcher.search(query, 28);
		int count = topDocs.totalHits;// 总的记录数
		System.err.println("============================命中总条数:" + count);
		ScoreDoc[] scoreDocs = topDocs.scoreDocs;
		List<Article> articleList = new ArrayList<Article>();
		for (int i = 0; i < scoreDocs.length; i++) {
			int index = scoreDocs[i].doc;
			float score = scoreDocs[i].score;// 相关度得分
			System.err.println("======================当前关键字匹配度:" + score);
			Document document = indexSearcher.doc(index);
			Article article = DocumentUtils.document2Article(document);
			articleList.add(article);
		}

		// 输出查询出来的信息
		for (Article article : articleList) {
			System.out.println(article.getId());
			System.out.println(article.getTitle());
			System.out.println(article.getContent());
		}
	}
}





分享到:
评论

相关推荐

    lucene_demo例子

    在"lucene_demo"这个压缩包中,很可能包含了一些示例代码或者项目,用于演示如何使用Lucene进行实际的文本搜索开发。这些示例通常会涵盖以下几个关键知识点: 1. **安装与配置**:Lucene的下载、构建环境的搭建,...

    vb.net2.0_Lucene_test.rar_lucene_lucene vb.n_lucene.net vb

    标题中的“vb.net2.0_Lucene_test.rar_lucene_lucene vb.n_lucene.net vb”表明这是一个关于使用VB.NET 2.0版本实现Lucene搜索引擎的测试项目。Lucene是一个高性能、全文本搜索库,广泛应用于Java开发,而这里则是将...

    java+lucene)1236.rar_Lucene 搜索_Luncene_lucene_lucene web

    【标题】"java+lucene)1236.rar_Lucene 搜索_Luncene_lucene_lucene web" 提供的信息表明这是一个使用Java和Lucene框架实现的搜索系统,特别是针对公交数据的搜索。Lucene是Apache软件基金会的一个开源全文检索库,...

    lucene_in_action中文版

    lucene_in_action中文版lucene_in_action中文版lucene_in_action中文版lucene_in_action中文版lucene_in_action中文版lucene_in_action中文版

    luceneDemo_pure1aa_DEMO_clucene_

    5. **结果处理**:最后,DEMO会遍历Hits,输出匹配的文档及其得分。 六、调试与优化 在vc6中,你可以设置断点,逐行运行代码,观察变量状态,了解Clucene内部的工作流程。遇到错误时,查看编译器的错误提示,对...

    ssd.rar_lucene_搜索 lucene_搜索引擎_文本搜索

    4. 结果排序:找到的匹配文档会根据相关度进行排序,通常使用TF-IDF(词频-逆文档频率)算法计算。 5. 显示结果:只显示排名较高的部分结果给用户,如前10条。 在这个"ssd.rar"压缩包中,"yudong"和"tool"可能是...

    lucene_cn.jar

    “META-INF”目录则包含了Lucene的相关元数据,如MANIFEST.MF文件,它记录了jar包的基本信息和依赖关系,这对于构建和运行环境的配置至关重要。在部署和运行Lucene_CN.jar时,这些元数据会帮助系统正确地加载和执行...

    Lucene资料大全(包括Lucene_in_Action书等)

    1. **文本分析**:Lucene使用Analyzer对输入文本进行分词、去除停用词、词形还原等预处理操作,以便更好地匹配查询。 2. **索引构建**:Lucene将文档转换为倒排索引结构,这是一种高效的数据结构,允许快速查找包含...

    chinese_lucene.rar_Lucene C#_Lucene for .net_PanGu4Lucene_lucene

    通常,中文分词库会采用基于词典的匹配方法,结合统计学和自然语言处理技术,确保在复杂语境下也能准确识别词语。 “PanGu4Lucene”是一个专门为Lucene设计的中文分词插件。Pangu(盘古)是知名的中文分词引擎,以...

    lucene_web项目应用实例

    《Lucene Web项目应用实例详解》 在信息技术领域,搜索引擎技术是不可或缺的一部分,Apache Lucene作为一款开源全文搜索引擎库,为开发者提供了强大的文本检索能力。本文将深入探讨一个名为“lucene_web”的项目,...

    lucene_jar包

    - **搜索(Searching)**: 用户输入查询后,Lucene将查询解析成术语,并在索引中搜索匹配项。它使用TF-IDF(Term Frequency-Inverse Document Frequency)和其他算法来计算相关性,返回最相关的文档。 - **分析器...

    Lucene_in_ Action

    Lucene_in_Action english版

    JAVA_Lucene_in_Action教程完整版

    ### JAVA_Lucene_in_Action教程知识点概述 #### 一、Lucene简介与背景 - **Lucene的起源**:Lucene最初作为一个私有项目由Doug Cutting创建于1997年末,目的是为了学习Java并尝试创建搜索软件。由于缺乏销售经验,...

    lucenevideao(eddy).rar_Lucene.net a_eddy_lucene_lucene web_luce

    这个名为“lucenevideao(eddy).rar_Lucene.net a_eddy_lucene_lucene web_luce”的资源,包含了一份由Eddy精心制作的Lucene.NET视频教程,以及相关的学习材料,是深入理解和应用Lucene.NET的好帮手。 首先,视频...

    Lucene_in_ Action java search engine.PDF 搜索引擎教程

    Lucene_in_ Action java search engine.PDF 搜索引擎教程

    Lucene_3.6.2_api帮助文档

    核心 Lucene3.6_api.chm 放心下载

Global site tag (gtag.js) - Google Analytics