0 0

关于solr分词之后的查找0

下面这张是Ik分词的结果。
"dsdshk 鼎汉技术dhhkdc 553663@172.com hinachina"
dsdshk|鼎|汉|技术|dhhkdc|553663@172.com|553663|172|com

因为在这里,技术分为一个词,如果我直接输入一个"技",就查不出来这条记录。
但业务规定,只要包含这个词就能查询出来。如果这样的话,我只能用 "*技*"来查询不过,这个查询是很慢的。
类似这样的问题。在分词中会出现很多问题。比如查dhhkd或者是dsdsh都是查不出来的。这样的情况,我该怎么办?
2014年1月21日 14:06
  • 大小: 80.3 KB

1个答案 按时间排序 按投票排序

0 0

其实这完全是看你的需求和数据量了。。

对于“技术” 这本身就是最细的颗粒度了。。如果再分。你干脆不用分词算了。按字建索引。。

还有你说的那个方案貌似是最可行的。。速度慢就是慢谁也没办法。因为你的query相当于有所带有 技 的term。

对于单字的搜索。建议你作cache吧?可以减缓一些。毕竟常用汉字就那么几个。。
还有单字搜索大多是没有意义的。不用太在意。就算出来结果。也是没有意义的

2014年1月21日 20:03

相关推荐

    solr全文检索+IK分词器

    1. **索引**:索引是Solr处理数据的方式,类似于数据库的索引,通过预处理将文档内容转化为可快速查找的形式。 2. **Schema.xml**:这是Solr的配置文件,用于定义字段类型、字段以及索引和搜索的规则。 3. **Query...

    Solr分组统计

    而精确查询则确保返回的结果与查询词完全一致,这对于查找特定的术语或短语非常有用。 在`EasyNet.Solr.sln`中,这是一个Visual Studio解决方案文件,包含了整个项目的所有组件和依赖关系。`EasyNet.Solr`可能是...

    lucene、solr中文分词器

    ikanalyzer和IK Analyzer是基于字典的分词器,它们维护了大规模的中文词汇库,通过查找词汇表进行分词。IK Analyzer最初是基于ikanalyzer开发的,但随着时间的发展,它增加了更多的自定义扩展和优化,如短语查询、...

    solr+IK分词集成tomcat实现全文检索

    Solr+IK分词集成Tomcat实现全文检索是构建高效搜索引擎的关键步骤,尤其在电子商务等大量数据检索场景中,这一技术的应用尤为重要。本教程将详细阐述如何通过Solr结合IK分词器,在Tomcat服务器上搭建一个功能完备的...

    SOLR搭建企业搜索平台

    - 相对路径方式:在solr-tomcat目录启动Tomcat,SOLR会查找./solr。 - 环境变量方式:在Windows中设置系统环境变量solr.home,Linux中修改.bash_profile或catalina.sh。 - JNDI方式:在Tomcat的conf/Catalina/...

    跟益达学Solr5之拼音分词

    总之,Solr5的拼音分词功能结合了Pinyin4j等工具,为中文搜索引擎提供了强大的拼音支持,使得用户可以通过多种方式查找信息,提升了搜索体验。通过深入理解和配置,我们可以充分利用这一特性,构建更加智能和高效的...

    solr课件还有安装原件

    Solr的索引是其高效搜索的关键,它允许快速查找大量数据。索引构建过程中,Solr会将文本数据转换为倒排索引,便于快速匹配查询关键词。而查询则涉及查询语法、查询解析器和查询优化,确保用户能获得最相关的搜索结果...

    solr教材-PDF版

    - **3.6.4 Solr分词器、过滤器、分析器**:解释如何使用不同的分词器、过滤器和分析器来处理索引数据。 - **3.6.5 Solr高亮使用**:指导如何在搜索结果中突出显示关键词。 #### 四、SolrJ的用法 **4.1 搜索接口的...

    solr安装设置资料

    配置Solr分词器 - 在Solr的`schema.xml`文件中添加Paoding分词器的相关配置。 - 可能还需要调整Solr的其他配置文件,以便更好地支持中文搜索需求。 #### 四、注意事项 - Solr版本的选择应考虑兼容性和功能需求。 -...

    solr search

    1. 索引:Solr中的索引类似于数据库的索引,用于快速查找文档。它通过分词和建立倒排索引来实现高效的文本搜索。 2. 文档:Solr的基本处理单元是文档,它可以包含多个字段,每个字段都有特定的类型,如文本、日期或...

    solr的安装与使用

    Solr会查找./solr,因此在启动时需要切换到C:/solr-tomcat/目录。 2. 基于环境变量 在这种方式中,我们需要在Windows的环境变量中建立solr.home变量,值为C:/solr-tomcat/。在Linux中,我们需要在当前用户的环境...

    solr搜索服务器安装配置

    检查Solr的日志文件,查找具体的错误信息。 - **问题2:索引速度慢** - 解决方案:优化schema.xml中的字段类型;减少不必要的字段;使用批量索引而非单个文档索引。 - **问题3:搜索结果不准确** - 解决方案:检查...

    solr使用指南1

    Solr 的分词功能可以使用 smartcn 分词器,也可以使用其他的分词器,例如 mmseg 分词器。 要使用 Solr,首先需要下载官方网站提供的 Solr 安装包,并安装好 Java 和 PHP 环境。然后,使用命令 bin/solr start -e ...

    Solr 搜索引擎 asp.net实现 示例详细操作步骤

    我们网站搜索如果数据量大的话,我们使用数据库直接查搜索会很慢,而且由于不能自动分词,结果往往不是很理想,现在我提供了一个例子,内含详细操作步骤和简单增删改查 Solr是一个独立的企业级搜索应用服务器,它...

    solr 4.10&

    Solr 4.10是Apache Solr的一个版本,它是一个开源的企业级全文搜索引擎,广泛应用于数据检索、网站搜索、企业内部搜索等场景。Solr以其高性能、可扩展性和易于管理的特点,在IT行业中深受青睐。在Solr 4.10版本中,...

    ik分词与拼音分词jar包

    例如,在一个搜索系统中,用户可能通过输入拼音来查找目标信息,这时IK分词负责将中文文本进行细分,拼音分词则将这些词汇转换成拼音,从而匹配用户的输入。这种组合可以提高搜索的准确性和用户体验。 总的来说,...

    图片上传下载 整合solr 引擎搜索

    在IT行业中,搜索引擎技术在大数据处理和信息检索中扮演着至关重要的角色,而Apache ...通过这些技术,不仅可以实现快速查找图片,还能提供丰富的搜索体验,如分词搜索和高亮显示,这对于大型图片库的管理极具价值。

    solr-8.0.0.tgz

    1. **全文检索**:Solr以其强大的文本分析能力而闻名,它支持多种语言的分词,可以进行复杂的查询操作,如模糊匹配、短语查询和同义词搜索。 2. **多字段索引**:Solr允许用户为不同的数据字段创建独立的索引,这...

Global site tag (gtag.js) - Google Analytics