目前Ik分词器相对来说是中文分词中用的相对较多的,比较流行的一种分词器了,与solr组合相当完美的一种中文分词器了,其他的庖丁和solr自带的分词器也相对较多,下面我主要说一下我在使用solr和Ik分词器做搜索时遇到的问题。IK分词器对中文分词是按照词组分的,效果如下
下面是英文字母和数字组合分词的效果
相信看到这个效果后,做搜索的朋友会想到,如果我的id是uuid或者某个对象的唯一属性是由数字或者字母组合成的,那么搜索出来的结果就会出现多个了,另外这些组合中如果含有_ +等特殊字符是不进行拆分的,直接忽略这些特殊字符跟上面效果一样。接下来我们看一下不分词的效果
上面不分词的效果是将schema.xml中的field的类型改为string了,string会将你输入的词组当作整体不拆分。
此时你在solrj客户端搜索时可以搜索到你想搜索的结果,但是写的程序就搜索不出来。程序搜索可能报空指针异常,这个时候你会很纠结为什么,我当时就纠结了很久,我使用facet进行查询时,查询条件都是正确的,但是就是搜索不出结果,最后发现在使用程序时多了引号导致的,之前使用ik分词时使用了引号将搜索的关键字引起来了,能搜索出结果,但是由于分词的原因将field类型改为string之后就出现了该问题。解决该问题的思路就是将你使用程序搜索的url和使用solrj客户端搜索的url对比,哪个能搜索出你要的结果就用哪个,如果你细心,你会发现在solrj客户端中字段与值加上引号和不加引号的结果一样,但是到了程序中就错了,此时你就该核对你的URL了,其中url中可能会出现%3A %22 %27等常见的字符,这个你使用URL编码冒号、引号就知道了,是因为你发送请求时,到了服务器端,服务器会将这些特殊字符进行转义,+号会转成空格,确定你的程序的URL与solrj客户端的URL地址一致问题就应该可以解决了,程序中一般是多了引号。
这个问题只是我在开发中遇到的问题,有不同见解的或者更好的解决方案的望分享一下,有更好的意见的请提出,谢谢。
相关推荐
白色大气风格的旅游酒店企业网站模板.zip
python实现用户注册
Matlab领域上传的视频均有对应的完整代码,皆可运行,亲测可用,适合小白; 1、代码压缩包内容 主函数:main.m; 调用函数:其他m文件;无需运行 运行结果效果图; 2、代码运行版本 Matlab 2019b;若运行有误,根据提示修改;若不会,私信博主; 3、运行操作步骤 步骤一:将所有文件放到Matlab的当前文件夹中; 步骤二:双击打开main.m文件; 步骤三:点击运行,等程序运行完得到结果; 4、仿真咨询 如需其他服务,可私信博主; 4.1 博客或资源的完整代码提供 4.2 期刊或参考文献复现 4.3 Matlab程序定制 4.4 科研合作
内容来源于网络分享,如有侵权请联系我删除。另外如果没有积分的同学需要下载,请私信我。
1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于计算机科学与技术等相关专业,更为适合;
内容概要:文档名为《平方表,派表集合.docx》,主要内容是1至1000的平方值以及1至1000与π的乘积结果。每个数字从1开始,逐步增加至1000,对应地计算了平方值和乘以π后的值。所有计算均通过Python脚本完成,并在文档中列出了详细的计算结果。 适合人群:需要进行数学计算或程序验证的学生、教师和研究人员。 使用场景及目标:用于快速查找特定数字的平方值或其与π的乘积,适用于教学、科研及程序测试等场景。 阅读建议:可以直接查阅所需的具体数值,无需从头到尾逐行阅读。建议在使用时配合相应的计算工具,以验证和拓展数据的应用范围。
1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于计算机科学与技术等相关专业,更为适合;
白色大气风格的健身私人教练模板下载.zip
白色简洁风的商务网站模板下载.zip
白色大气风格的前端设计案例展示模板.zip
内容概要:本文介绍了两个有趣的圣诞树项目方向:一是使用Arduino或Raspberry Pi开发可编程的圣诞树灯光控制系统;二是基于MATLAB开发一个圣诞树模拟器。前者通过硬件连接、编写Arduino/Raspberry Pi程序、MATLAB控制程序来实现LED灯带的闪烁;后者则通过创建圣诞树图形、添加动画效果、用户交互功能来实现虚拟的圣诞树效果。 适合人群:具备基本电子工程和编程基础的爱好者和学生。 使用场景及目标:①通过硬件和MATLAB的结合,实现实际的圣诞树灯光控制系统;②通过MATLAB模拟器,实现一个有趣的圣诞树动画展示。 阅读建议:读者可以根据自己的兴趣选择合适的项目方向,并按照步骤进行动手实践,加深对硬件编程和MATLAB编程的理解。
白色扁平风格的温室大棚公司企业网站源码下载.zip
Navicat.zip
内容概要:本文详细介绍了主成分分析(PCA)技术的原理及其在Scikit-learn库中的Python实现。首先讲解了PCA的基本概念和作用,接着通过具体示例展示了如何使用Scikit-learn进行PCA降维。内容涵盖了数据准备、模型训练、数据降维、逆转换数据等步骤,并通过可视化和实际应用案例展示了PCA的效果。最后讨论了PCA的局限性和参数调整方法。 适合人群:数据科学家、机器学习工程师、数据分析从业者及科研人员。 使用场景及目标:适用于高维数据处理,特别是在需要降维以简化数据结构、提高模型性能的场景中。具体目标包括减少计算复杂度、提高数据可视化效果和改进模型训练速度。 其他说明:本文不仅提供了详细的代码示例,还讨论了PCA在手写数字识别和机器学习模型中的应用。通过比较原始数据和降维后数据的模型性能,读者可以更好地理解PCA的影响。
VOC格式的数据集转COCO格式数据集 VOC格式的数据集转YOLO格式数据集。内容来源于网络分享,如有侵权请联系我删除。另外如果没有积分的同学需要下载,请私信我。
数字信号处理课程设计.doc
白色扁平化风格的灯饰灯具销售企业网站模板.zip
华豫佰佳组合促销视图.sql
白色大气风格的商务团队公司模板下载.zip
白色大气风格的VPS销售网站模板.zip