有人下载了solr4.7木有,我加入了IK分词之后,没有复杂操作,没有solrj,直接配置的dataimport一张测试表,字段title为默认搜索field,title为“你们去哪儿”,我搜“你们吃了吗”居然没有搜出结果,有图有真相:
在建好的索引中,确实能够看到“你们”的term
我以为我分词配置有问题,但是。。。
我还以为我输入有错误,结果。。。
郁闷啊,求解答,是不是IK不支持4.7啊,我下的是
额。。。终于找到问题了。。。
<fieldType name="text_ik" class="solr.TextField"
sortMissingLast="true" omitNorms="true" [color=red]autoGeneratePhraseQueries="false"[/color]>
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer" type="index">
</analyzer>
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer" type="query">
</analyzer>
</fieldType>
</types>
红色字体配置部分解释如下:
这个属性只能用于文本域。如果在查询文本分析时产生了多个词元,比如 Wi-Fi 分词为 Wi 和 Fi ,那么默认情况下它们只是两个不同的搜索词,它们没有位置上的关系。但如果 autoGeneratePhraseQueries 被设置,那么这两个词元就构造了一个词组查询,即“ WiFi ”,所以索引中“ WiFi ”必须相邻才能被查询到。在新 Solr 版本中,默认它被设置为 false 。
- 大小: 136.8 KB
- 大小: 147.8 KB
- 大小: 181.1 KB
- 大小: 566 KB
分享到:
相关推荐
### Solr 4.7 服务搭建详细指南 #### 一、环境准备 为了搭建 Solr 4.7 服务,我们需要确保以下环境已经准备好: ...通过以上步骤,用户可以成功搭建并配置好 Solr 4.7 服务,实现高效的数据索引和搜索功能。
Solr4.7服务器是基于Java的开源搜索和分析引擎,它在Apache Lucene库的基础上构建,用于提供高效、可扩展的全文检索、数据分析和分布式搜索服务。此版本的Solr适用于Java运行环境JDK1.6,这表明它是对较旧Java版本的...
### Apache Solr Guide 4.7 知识点解析 #### 一、Apache Solr 概述 **Apache Solr** 是一个高性能、基于 Lucene 的全文检索服务系统,广泛应用于互联网企业的搜索服务中。Solr 提供了高度可扩展且稳定的搜索功能,...
Solr 4.7 是一个流行的全文搜索引擎,它允许用户通过数据导入处理器(DataImportHandler, DIH)从关系型数据库如 SQL Server 导入数据并建立索引,以实现快速搜索。在这个教程中,我们将深入理解如何在 Solr 4.7 中...
综上所述,Solr 4.7 和 IK Analyzer 2012FF_hf1 的结合为搭建中文全文检索系统提供了一个高效且可定制的解决方案。用户可以通过提供的文档和源码进一步了解和优化这个系统,以适应不同业务场景下的搜索需求。
### Solr 4.7 从数据库导入数据创建索引详解 #### 一、概述 在实际工程应用中,从数据库导出数据并创建索引来优化搜索效率是一种常见的做法。本文将详细介绍如何使用Solr 4.7从SQL Server 2005数据库中导入数据并...
**meseg4j 分词技术详解** meseg4j 是一个专门为Java开发的中文分词库,它在信息检索、自然语言处理以及文本分析等领域...而solr4.7中文分词架包则为用户简化了部署过程,使得meseg4j的功能得以快速应用到实际项目中。
lucene-solr-4.7所有Jar包 tika包 IK包 mmseg4j包 包括索引、高亮、IK分词及MMSEG分词 其中MMSEG中的BUG: TokenStream contract violation: reset()/close() call missing, reset() called multiple times, or ...
### Solr安装与部署详细教程 #### 一、Solr简介 Solr是一款开源的、高性能的全文搜索...接下来,您可以进一步探索Solr的各种高级特性,如分词、高亮显示、排序等功能,以及如何通过Solr API进行索引操作和查询操作。
索引过程则是将这些分词结果转化为可快速查询的数据结构,比如倒排索引,这大大提高了搜索速度。搜索功能则允许用户根据关键词进行查询,并返回相关的文档。 在Apache Lucene 4.7中,有几个重要的特性值得一提: 1...
1. **分词与索引**:Lucene使用高效的分词器将文档内容分解成独立的词汇项(tokens),然后建立倒排索引。倒排索引是一种数据结构,它将每个词汇项映射到包含该词汇项的文档列表,极大地加速了搜索过程。 2. **搜索...