Lucene_demo07_Sort匹配度
/**
* @see 1、相同的结构,相同的关键词,得分一样
* @see 2、相同的结构,不同的关键词,得分不一样,一般情况下,中文高于英文
* @see 3、不同的结构,相同的关键词,关键词的得分越高,排名越靠前.关键词出现的频率越高,得分越高
* @see 4、lucene的竞价排名
*/
public class SortTest {
@Test
public void testSearchIndex() throws Exception {
IndexSearcher indexSearcher = new IndexSearcher(LuceneUtils.directory);
QueryParser queryParser = new MultiFieldQueryParser(Version.LUCENE_30, new String[] { "title", "content" }, LuceneUtils.analyzer);
Query query = queryParser.parse("NBA");
TopDocs topDocs = indexSearcher.search(query, 28);
int count = topDocs.totalHits;// 总的记录数
System.err.println("============================命中总条数:" + count);
ScoreDoc[] scoreDocs = topDocs.scoreDocs;
List<Article> articleList = new ArrayList<Article>();
for (int i = 0; i < scoreDocs.length; i++) {
int index = scoreDocs[i].doc;
float score = scoreDocs[i].score;// 相关度得分
System.err.println("======================当前关键字匹配度:" + score);
Document document = indexSearcher.doc(index);
Article article = DocumentUtils.document2Article(document);
articleList.add(article);
}
// 输出查询出来的信息
for (Article article : articleList) {
System.out.println(article.getId());
System.out.println(article.getTitle());
System.out.println(article.getContent());
}
}
}
分享到:
相关推荐
在"lucene_demo"这个压缩包中,很可能包含了一些示例代码或者项目,用于演示如何使用Lucene进行实际的文本搜索开发。这些示例通常会涵盖以下几个关键知识点: 1. **安装与配置**:Lucene的下载、构建环境的搭建,...
标题中的“vb.net2.0_Lucene_test.rar_lucene_lucene vb.n_lucene.net vb”表明这是一个关于使用VB.NET 2.0版本实现Lucene搜索引擎的测试项目。Lucene是一个高性能、全文本搜索库,广泛应用于Java开发,而这里则是将...
【标题】"java+lucene)1236.rar_Lucene 搜索_Luncene_lucene_lucene web" 提供的信息表明这是一个使用Java和Lucene框架实现的搜索系统,特别是针对公交数据的搜索。Lucene是Apache软件基金会的一个开源全文检索库,...
lucene_in_action中文版lucene_in_action中文版lucene_in_action中文版lucene_in_action中文版lucene_in_action中文版lucene_in_action中文版
5. **结果处理**:最后,DEMO会遍历Hits,输出匹配的文档及其得分。 六、调试与优化 在vc6中,你可以设置断点,逐行运行代码,观察变量状态,了解Clucene内部的工作流程。遇到错误时,查看编译器的错误提示,对...
4. 结果排序:找到的匹配文档会根据相关度进行排序,通常使用TF-IDF(词频-逆文档频率)算法计算。 5. 显示结果:只显示排名较高的部分结果给用户,如前10条。 在这个"ssd.rar"压缩包中,"yudong"和"tool"可能是...
“META-INF”目录则包含了Lucene的相关元数据,如MANIFEST.MF文件,它记录了jar包的基本信息和依赖关系,这对于构建和运行环境的配置至关重要。在部署和运行Lucene_CN.jar时,这些元数据会帮助系统正确地加载和执行...
1. **文本分析**:Lucene使用Analyzer对输入文本进行分词、去除停用词、词形还原等预处理操作,以便更好地匹配查询。 2. **索引构建**:Lucene将文档转换为倒排索引结构,这是一种高效的数据结构,允许快速查找包含...
通常,中文分词库会采用基于词典的匹配方法,结合统计学和自然语言处理技术,确保在复杂语境下也能准确识别词语。 “PanGu4Lucene”是一个专门为Lucene设计的中文分词插件。Pangu(盘古)是知名的中文分词引擎,以...
《Lucene Web项目应用实例详解》 在信息技术领域,搜索引擎技术是不可或缺的一部分,Apache Lucene作为一款开源全文搜索引擎库,为开发者提供了强大的文本检索能力。本文将深入探讨一个名为“lucene_web”的项目,...
- **搜索(Searching)**: 用户输入查询后,Lucene将查询解析成术语,并在索引中搜索匹配项。它使用TF-IDF(Term Frequency-Inverse Document Frequency)和其他算法来计算相关性,返回最相关的文档。 - **分析器...
Lucene_in_Action english版
### JAVA_Lucene_in_Action教程知识点概述 #### 一、Lucene简介与背景 - **Lucene的起源**:Lucene最初作为一个私有项目由Doug Cutting创建于1997年末,目的是为了学习Java并尝试创建搜索软件。由于缺乏销售经验,...
这个名为“lucenevideao(eddy).rar_Lucene.net a_eddy_lucene_lucene web_luce”的资源,包含了一份由Eddy精心制作的Lucene.NET视频教程,以及相关的学习材料,是深入理解和应用Lucene.NET的好帮手。 首先,视频...
Lucene_in_ Action java search engine.PDF 搜索引擎教程
核心 Lucene3.6_api.chm 放心下载
8. **ScoreDoc**: 用于存储搜索结果,包括文档ID和匹配度(分数)。 9. **HitCollector** 和 **TopDocs**: 用于收集和返回搜索结果的前N个最相关文档。 在实际应用中,Lucene常与其他技术结合,如Solr或Elastic...