solr4.7 分词成功，索引成功，匹配不成功？！（解决） - - ITeye博客

`

会飞的拉布拉多

浏览: 15974 次
性别:
来自: 北京

最近访客更多访客>>

w592376568

chenjinjun40422p

Seagull_Johnson

zjy_369

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

xiaofeiyang：加油，我最近也要弄这个东东
solr4安装配置(windows)和eclipse项目搭建
bob007：嗯，不错，继续努力。
solr4安装配置(windows)和eclipse项目搭建
denverj：虽然看的不知所云。还是支持下。
solr4安装配置(windows)和eclipse项目搭建

solr4.7 分词成功，索引成功，匹配不成功？！（解决）

博客分类：

solr

阅读更多

有人下载了solr4.7木有，我加入了IK分词之后，没有复杂操作，没有solrj，直接配置的dataimport一张测试表，字段title为默认搜索field，title为“你们去哪儿”，我搜“你们吃了吗”居然没有搜出结果，有图有真相：
在建好的索引中，确实能够看到“你们”的term

我以为我分词配置有问题，但是。。。

我还以为我输入有错误，结果。。。

郁闷啊，求解答，是不是IK不支持4.7啊，我下的是

额。。。终于找到问题了。。。

<fieldType name="text_ik" class="solr.TextField"
			sortMissingLast="true" omitNorms="true" [color=red]autoGeneratePhraseQueries="false"[/color]>
			<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer" type="index">
			</analyzer>
			<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer" type="query">
			</analyzer>
		</fieldType>
  </types>

红色字体配置部分解释如下：
这个属性只能用于文本域。如果在查询文本分析时产生了多个词元，比如 Wi-Fi 分词为 Wi 和 Fi ，那么默认情况下它们只是两个不同的搜索词，它们没有位置上的关系。但如果 autoGeneratePhraseQueries 被设置，那么这两个词元就构造了一个词组查询，即“ WiFi ”，所以索引中“ WiFi ”必须相邻才能被查询到。在新 Solr 版本中，默认它被设置为 false 。

查看图片附件

0
顶

0
踩

分享到：

sed简明教程(转) | solr4.7 dataimport增量全量创建索引

2014-03-07 18:11
浏览 2907
评论(0)
分类:开源软件
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

solr4.7服务搭建: ### Solr 4.7 服务搭建详细指南 #### 一、环境准备为了搭建 Solr 4.7 服务，我们需要确保以下环境已经准备好： ...通过以上步骤，用户可以成功搭建并配置好 Solr 4.7 服务，实现高效的数据索引和搜索功能。

solr4.7服务器: Solr4.7服务器是基于Java的开源搜索和分析引擎，它在Apache Lucene库的基础上构建，用于提供高效、可扩展的全文检索、数据分析和分布式搜索服务。此版本的Solr适用于Java运行环境JDK1.6，这表明它是对较旧Java版本的...

apache solr guide 4.7: ### Apache Solr Guide 4.7 知识点解析 #### 一、Apache Solr 概述 **Apache Solr** 是一个高性能、基于 Lucene 的全文检索服务系统，广泛应用于互联网企业的搜索服务中。Solr 提供了高度可扩展且稳定的搜索功能，...

solr4.7从数据库导数据[归类].pdf: Solr 4.7 是一个流行的全文搜索引擎，它允许用户通过数据导入处理器（DataImportHandler, DIH）从关系型数据库如 SQL Server 导入数据并建立索引，以实现快速搜索。在这个教程中，我们将深入理解如何在 Solr 4.7 中...

solr4.7+中文分词器IK Analyzer 2012FF_hf1: 综上所述，Solr 4.7 和 IK Analyzer 2012FF_hf1 的结合为搭建中文全文检索系统提供了一个高效且可定制的解决方案。用户可以通过提供的文档和源码进一步了解和优化这个系统，以适应不同业务场景下的搜索需求。

solr4.7从数据库导数据[参照].pdf: ### Solr 4.7 从数据库导入数据创建索引详解 #### 一、概述在实际工程应用中，从数据库导出数据并创建索引来优化搜索效率是一种常见的做法。本文将详细介绍如何使用Solr 4.7从SQL Server 2005数据库中导入数据并...

meseg4j分词技术: **meseg4j 分词技术详解** meseg4j 是一个专门为Java开发的中文分词库，它在信息检索、自然语言处理以及文本分析等领域...而solr4.7中文分词架包则为用户简化了部署过程，使得meseg4j的功能得以快速应用到实际项目中。

lucene-solr-4.7所有Jar包 tika包 IK包 mmseg4j包: lucene-solr-4.7所有Jar包 tika包 IK包 mmseg4j包包括索引、高亮、IK分词及MMSEG分词其中MMSEG中的BUG： TokenStream contract violation: reset()/close() call missing, reset() called multiple times, or ...

solr安装于部署: ### Solr安装与部署详细教程 #### 一、Solr简介 Solr是一款开源的、高性能的全文搜索...接下来，您可以进一步探索Solr的各种高级特性，如分词、高亮显示、排序等功能，以及如何通过Solr API进行索引操作和查询操作。

apache Lucene4.7最全最新的jar包: 索引过程则是将这些分词结果转化为可快速查询的数据结构，比如倒排索引，这大大提高了搜索速度。搜索功能则允许用户根据关键词进行查询，并返回相关的文档。在Apache Lucene 4.7中，有几个重要的特性值得一提： 1...

lucene-4.7.0全套jar包: 1. **分词与索引**：Lucene使用高效的分词器将文档内容分解成独立的词汇项（tokens），然后建立倒排索引。倒排索引是一种数据结构，它将每个词汇项映射到包含该词汇项的文档列表，极大地加速了搜索过程。 2. **搜索...

Global site tag (gtag.js) - Google Analytics