Solr debugQuery使用体会

dacoolbaby

浏览: 1272388 次
性别:
来自: 广州

最近访客更多访客>>

leoeco2000

peacherdiy

quduaitao

yangshuguozhi

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

solr

solr 打分

使用solr，就使用到各种的排序和boost。

在公司的站内搜索引擎，就遇到了排序的问题，各种各样的条件，融合在最后一个分数里面。

开启debugQuery，就可以看到每个document的打分逻辑原理。

比如说，我们的查询是这样的：

/solr/select?q=ddr&defType=dismax&qf=name^1000+description^100&bf=pow(price,1.5)&debugQuery=true&indent=true

开启了debugQuery后，获得的结果是这样的：

1.6771803 = (MATCH) sum of:  
   0.64883727 = (MATCH) max of:  
      0.64883727 = (MATCH) weight(name:ddr^1000.0 in 6), product of: 
         0.99999994 = queryWeight(name:ddr^1000.0), product of:  
            1000.0 = boost  
             2.446919 = idf(docFreq=3, maxDocs=17)  
             4.0867718E-4 = queryNorm  
         0.6488373 = (MATCH) fieldWeight(name:ddr in 6), product of:  
            1.4142135 = tf(termFreq(name:ddr)=2)  
            2.446919 = idf(docFreq=3, maxDocs=17)  
            0.1875 = fieldNorm(field=name, doc=6)  
   1.028343 = (MATCH) FunctionQuery(pow(float(price),const(1.5))), product of:  
      2516.272 = pow(float(price)=185.0,const(1.5))  
      1.0 = boost  
      4.0867718E-4 = queryNorm

按照这个格式，把你的debugQuery的信息取出来，格式化就得到了。

首先，最上面的分数是这个document的总分：1.6771803

这个分数是怎么来的？

总分 = 字段得分 + 每个FunctionQuery 的得分。

Solr的dismax引擎，会选择一个最高得分的字段，作为该document的基础。

然后通过FunctionQuery进行调整。

加入，被查询的字段有：

productName^100

productDesc^10

那么2者都马努匹配的情况下，productName^100 的得分是0.9 ，productDesc^10的得分是0.8.

取0.9作为分数基底。

然后有2个FunctionQuery，分别是促销排名值0.012，和上架时间排名值0.011

那么这个document的分值= max(0.9 , 0.8) + 0.012 + 0.011 = 0.923

在debug信息中，queryNorm 一般会是个常量，不用管它。

tf 是词条在文本中出现的次数

idf 是词条在文本中的重要性程度

OK，总结到这里。

分享到：

配置Capacity Scheduler | python使用smtp库发送邮件

2014-08-06 14:41
浏览 4197
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

solr查询语法.pdf: 在使用Solr进行数据查询时，必须输入查询内容，这通常通过“q”参数实现，可以使用不同的查询运算符来对搜索内容进行精确的控制。在Solr的查询语法中，“q”参数代表查询输入，是必须的。例如，我们可以按照字段名...

solr全文检索开发: 在Solr中，我们可以通过配置和使用不同的参数来优化和定制我们的搜索行为。首先，了解Solr中的Query参数至关重要。`q`参数是必需的，用于指定查询字符串。`q.op`可以覆盖`schema.xml`中的`defaultOperator`，用来...

MATLAB中的紧束缚模型求解器.rar: 1.版本：matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点：参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象：计算机，电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。

模型量化校准数据集-ImageNet2012分类图片100张: 从ImageNet2012分类数据集中选取的100张图片，用于对常见分类模型进行量化。数据集介绍数据背景：静态离线量化方法需要少量校准数据，这个数据集用于量化演示示例。数据来源：基于Imagenet2012测试数据集，取前100张图片和标签作为本数据集。

### 【计算机组成原理】计算机发展历程与关键技术解析：从冯·诺依曼架构到量子计算的未来展望: 内容概要：本文详细介绍了计算机的发展历程及其核心组成部分，从早期计算工具的演进到现代计算机的诞生，重点探讨了冯·诺依曼体系结构的重要性。文章回顾了从机械计算器、ENIAC到微处理器的科技进步，阐述了计算机五大组成部分（运算器、控制器、存储器、输入设备、输出设备）的功能与协作机制。同时，文中还讨论了操作系统、编程语言、数据库管理系统等软件层面的内容，以及量子计算和神经形态计算等前沿技术对未来计算机发展的影响。; 适合人群：计算机专业学生、计算机爱好者及对计算机技术感兴趣的读者。; 使用场景及目标：①帮助读者理解计算机硬件的基本组成和工作原理；②解释软件与硬件之间的协同关系；③介绍量子计算和神经形态计算等新兴技术的发展趋势及挑战。; 其他说明：掌握计算机组成原理有助于读者深入了解计算机系统的工作机制，培养硬件思维和系统思维，为后续学习操作系统、编译原理、计算机网络等课程打下坚实基础。同时，对于广大计算机爱好者而言，了解计算机组成原理可以让他们更好地理解计算机的运行机制，在使用计算机的过程中更加得心应手。

中国移动2024年6G通感算智融合技术体系白皮书1.053页.pdf: 中国移动2024年6G通感算智融合技术体系白皮书1.053页.pdf

汽车电子：MATLAB_开发电池管理系统SOC估算算法.pdf: 文档支持目录章节跳转同时还支持阅读器左侧大纲显示和章节快速定位，文档内容完整、条理清晰。文档内所有文字、图表、函数、目录等元素均显示正常，无任何异常情况，敬请您放心查阅与使用。文档仅供学习参考，请勿用作商业用途。你是否渴望高效解决复杂的数学计算、数据分析难题？MATLAB 就是你的得力助手！作为一款强大的技术计算软件，MATLAB 集数值分析、矩阵运算、信号处理等多功能于一身，广泛应用于工程、科学研究等众多领域。其简洁直观的编程环境，让代码编写如同行云流水。丰富的函数库和工具箱，为你节省大量时间和精力。无论是新手入门，还是资深专家，都能借助 MATLAB 挖掘数据背后的价值，创新科技成果。别再犹豫，拥抱 MATLAB，开启你的科技探索之旅！

通信工程分包合同.docx: 通信工程分包合同.docx

基于Qt+C++实现的物联网景区地质灾害监测系统+源码+项目文档（毕业设计&课程设计&项目开发）: 基于Qt+C++实现的物联网景区地质灾害监测系统+源码+项目文档，适合毕业设计、课程设计、项目开发。项目源码已经过严格测试，可以放心参考并在此基础上延申使用，详情见md文档本项目利用Zigbee协议搭建了专属物联网，搭建了以Cortex-A8为主核的本地网关，租用阿里云组建系统服务器，并建立了相关网站。监测中心站通过客户端监控易发灾害点数据，在灾害爆发前做好预防工作；普通用户可以通过网站查看各项数据。基于Qt+C++实现的物联网景区地质灾害监测系统+源码+项目文档，适合毕业设计、课程设计、项目开发。项目源码已经过严格测试，可以放心参考并在此基础上延申使用，详情见md文档本项目利用Zigbee协议搭建了专属物联网，搭建了以Cortex-A8为主核的本地网关，租用阿里云组建系统服务器，并建立了相关网站。监测中心站通过客户端监控易发灾害点数据，在灾害爆发前做好预防工作；普通用户可以通过网站查看各项数据

CNC-控制器-STM32-开源项目: CNC_控制器_STM32_开源项目

世邦魏理仕：2022年北京房地产市场回顾与2023年展望.pdf: 世邦魏理仕：2022年北京房地产市场回顾与2023年展望

科学发展观与建筑企业管理论文.docx: 科学发展观与建筑企业管理论文.docx

Epson-L130-Series: 爱普生L130

基于javaScript+Springboot+Vue实现的校园社团信息管理系统+源码+演示视频+项目文档（毕业设计&课程设计&项目开发）: 基于javaScript+Springboot+Vue实现的校园社团信息管理系统+源码+演示视频+项目文档，适合毕业设计、课程设计、项目开发。项目源码已经过严格测试，可以放心参考并在此基础上延申使用，详情见md文档园社团信息管理系统管理员功能有个人中心，学生管理，社长管理，社团分类管理，社团信息管理，加入社团管理，社团成员管理，社团活动管理，活动报名管理，系统管理等。社长添加社团，管理员审核社团，学生加入社团，社长审核社团。因而具有一定的实用性。本站是一个B/S模式系统，采用Spring Boot框架，MYSQL数据库设计开发，充分保证系统的稳定性。系统具有界面清晰、操作简单，功能齐全的特点，使得校园社团信息管理系统管理工作系统化、规范化。本系统的使用使管理人员从繁重的工作中解脱出来，实现无纸化办公，能够有效的提高校园社团信息管理系统管理效率。

apk文件.zip: apk文件

JDK1.7及之前HashMap的put方法图解.png: JDK1.7及之前HashMap的put方法图解

珠宝鉴定：MATLAB高光谱成像在宝石内部包裹体分析中的实践.pdf: 文档支持目录章节跳转同时还支持阅读器左侧大纲显示和章节快速定位，文档内容完整、条理清晰。文档内所有文字、图表、函数、目录等元素均显示正常，无任何异常情况，敬请您放心查阅与使用。文档仅供学习参考，请勿用作商业用途。你是否渴望高效解决复杂的数学计算、数据分析难题？MATLAB 就是你的得力助手！作为一款强大的技术计算软件，MATLAB 集数值分析、矩阵运算、信号处理等多功能于一身，广泛应用于工程、科学研究等众多领域。其简洁直观的编程环境，让代码编写如同行云流水。丰富的函数库和工具箱，为你节省大量时间和精力。无论是新手入门，还是资深专家，都能借助 MATLAB 挖掘数据背后的价值，创新科技成果。别再犹豫，拥抱 MATLAB，开启你的科技探索之旅！

基于MATLAB_的无人机编队协同控制算法开发与半实物仿真.pdf: 文档支持目录章节跳转同时还支持阅读器左侧大纲显示和章节快速定位，文档内容完整、条理清晰。文档内所有文字、图表、函数、目录等元素均显示正常，无任何异常情况，敬请您放心查阅与使用。文档仅供学习参考，请勿用作商业用途。你是否渴望高效解决复杂的数学计算、数据分析难题？MATLAB 就是你的得力助手！作为一款强大的技术计算软件，MATLAB 集数值分析、矩阵运算、信号处理等多功能于一身，广泛应用于工程、科学研究等众多领域。其简洁直观的编程环境，让代码编写如同行云流水。丰富的函数库和工具箱，为你节省大量时间和精力。无论是新手入门，还是资深专家，都能借助 MATLAB 挖掘数据背后的价值，创新科技成果。别再犹豫，拥抱 MATLAB，开启你的科技探索之旅！

Epson-L301303.zip: Epson_L301303.zip

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论