`
guochunyang2004
  • 浏览: 80216 次
  • 性别: Icon_minigender_1
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

solr 4.9 suggest.txt词库默认应该是utf-8 无BOM文档

 
阅读更多

solr4.9

自动完成配置问题记录

<searchComponent class="solr.SpellCheckComponent" name="suggest">
    <lst name="spellchecker">
      <str name="name">suggest</str>
      <str name="classname">org.apache.solr.spelling.suggest.Suggester</str>
      <str name="lookupImpl">org.apache.solr.spelling.suggest.tst.TSTLookupFactory</str>
      <!-- Alternatives to lookupImpl: 
           org.apache.solr.spelling.suggest.fst.FSTLookupFactory   [finite state automaton]
           org.apache.solr.spelling.suggest.fst.WFSTLookupFactory [weighted finite state automaton]
           org.apache.solr.spelling.suggest.jaspell.JaspellLookupFactory [default, jaspell-based]
           org.apache.solr.spelling.suggest.tst.TSTLookupFactory   [ternary trees]
      -->
      <str name="field">AllContent</str>  <!-- the indexed field to derive suggestions from -->
      <float name="threshold">0.005</float>
      <str name="buildOnCommit">true</str>
	  <!-- 使用自定义suggest词库词  -->  
      <str name="sourceLocation">suggest.txt</str>    
      <!-- <str name="spellcheckIndexDir">spellchecker</str> -->
    </lst>
  </searchComponent>

这里的suggest.txt词库默认应该是utf-8 无BOM文档,否则solr读取有问题,

如果utf-8有BOM,那么词库第一行无法读取:



solr suggest 自定义词库和系统词库一起使用:

<!-- 可以定义多个,name查询spellchecker -->
	<lst name="spellchecker">
      <str name="name">suggestcustom</str>
      <str name="classname">org.apache.solr.spelling.suggest.Suggester</str>
      <str name="lookupImpl">org.apache.solr.spelling.suggest.tst.TSTLookupFactory</str>      
      <str name="field">AllContent</str>
      <float name="threshold">0.005</float>
      <str name="buildOnCommit">true</str>
	  <!-- 使用自定义suggest词库词  -->  
      <str name="sourceLocation">suggest.txt</str>  
      <!-- <str name="spellcheckIndexDir">spellchecker</str> -->
    </lst>

查询方式:http://localhost:8080/solr/resource/suggest?q=全&wt=json&indent=true&spellcheck=true&spellcheck.build=true&spellcheck.reload=true&spellcheck.dictionary=suggest&spellcheck.dictionary=suggestcustom
分享到:
评论

相关推荐

    ik-analyzer-solr-6.x.jar

    solr更新到6.x的版本了,ik-...ik-analyzer-solr-6.0.0.jar ik-analyzer-solr-6.2.1.jar ik-analyzer-solr-6.3.0.jar 更多的相关信息,请参照我的博客 http://blog.csdn.net/Bleachswh/article/details/53228614

    solr4.9与tomcat8,tomcat7整合

    &lt;?xml version="1.0" encoding="UTF-8"?&gt; &lt;solr&gt; &lt;Context docBase="C:/solr/tomcat-8.0.9/webapps/solr.war" debug="0" crossContext="true"&gt; &lt;Environment name="solr/home" type="java.lang.String" value="C...

    ik-analyzer-solr5-5.x.jar

    ik-analyzer分词器,支持solr5-5.x

    solr4.9开发所需jar包

    Solr4.9是Apache Solr的一个版本,它是一个基于Lucene的全文搜索服务器,用于构建高效的、可扩展的搜索应用。在这个版本中,Solr提供了丰富的查询功能、高效的索引和搜索性能,以及灵活的数据处理能力。"solr4.9开发...

    mmseg4j-solr-2.2.0.jar mmseg4j-analysis-1.9.1.jar mmseg4j-solr-2.2.0.jar

    本人用的solr是4.10的,经过本人亲测可用,放心下载,包含以下3个jar包: mmseg4j-analysis-1.9.1.jar, mmseg4j-core-1.9.1.jar, mmseg4j-solr-2.2.0.jar

    mmseg4j-solr-2.4.0.jar

    本文将深入探讨mmseg4j在Solr中的应用,以及如何在Solr 6.3版本中集成并使用mmseg4j-solr-2.4.0.jar这个库。 首先,mmseg4j是由李智勇开发的一个基于Java的中文分词工具,它的全称是“Minimum Match Segmentation ...

    solr-mongo-importer-1.1.0.jar

    solr-mongo-importer-1.1.0.jar solr-mongo-importer-1.1.0.jar solr-mongo-importer-1.1.0.jar

    apache-solr-3.5.0.jar

    这个名为"apache-solr-3.5.0.jar"的压缩包包含两个关键组件:`apache-solr-core-3.5.0.jar`和`apache-solr-solrj-3.5.0.jar`,它们对于成功搭建Solr 3.5.0环境至关重要。 1. `apache-solr-core-3.5.0.jar`: 这是...

    solr-8.6.3.tgz+hbase-2.3.3-bin.tar.gz

    标题中的"solr-8.6.3.tgz+hbase-2.3.3-bin.tar.gz"表明我们有两个重要的开源软件版本:Apache Solr 8.6.3和HBase 2.3.3。Solr是Apache软件基金会的一个项目,主要用于全文搜索、企业级搜索和大数据分析。而HBase则是...

    solr-4.10.3.gz

    Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。

    solr(solr-9.0.0.tgz)

    总的来说,Solr-9.0.0是一个强大且灵活的搜索平台,适用于需要大量数据搜索和分析的场景,如电商网站的商品搜索、新闻网站的内容检索、企业内部的文档搜索等。通过深入理解和熟练使用Solr,你可以为你的应用程序提供...

    solr-4.10.3.rar

    在下载的`solr-4.10.3.tgz.tgz`文件中,通常包含完整的Solr安装包,解压后你可以找到所有必要的文件和目录结构,如`server`、`example`、`dist`等,它们分别对应Solr服务器、示例应用和二进制库。 `xufuli.txt`可能...

    solr-dataimport-scheduler.jar 可使用于solr7.x版本

    Solr 数据导入调度器(solr-dataimport-scheduler.jar)是一个专门为Apache Solr 7.x版本设计的组件,用于实现数据的定期索引更新。在理解这个知识点之前,我们需要先了解Solr的基本概念以及数据导入处理...

    solr增量更新架包apache-solr-dataimportscheduler.jar

    "apache-solr-dataimportscheduler.jar" 是一个专门为Solr设计的扩展包,用于实现自动化的数据增量更新调度。 首先,我们要理解Solr的数据导入过程。Solr使用DataImportHandler(DIH)来从关系型数据库、XML文件或...

    ik-analyzer-solr7.zip

    对于处理中文文档,一个合适的中文分词器是必不可少的,IKAnalyzer就是这样一个解决方案。 IKAnalyzer在Solr中的集成使得用户可以方便地在Solr中使用它进行中文文本的预处理,包括分词、去停用词等步骤,这对于提高...

    solr-7.4.0.zip

    标题"solr-7.4.0.zip"表明这是一个包含了Solr 7.4.0版本的压缩包文件,该版本发布于2018年,包含了完整的Solr服务器及其相关组件。 在描述中提到,“solr7需要java8环境”,这是因为Solr的运行依赖于Java平台,特别...

    apache-solr-3.6.2.zip

    apache-solr-3.6.2.zipapache-solr-3.6.2.zipapache-solr-3.6.2.zipapache-solr-3.6.2.zipapache-solr-3.6.2.zipapache-solr-3.6.2.zipapache-solr-3.6.2.zip

    solr-4.10.3.tgz

    在你提供的信息中,“solr-4.10.3.tgz”是一个在Linux系统上使用的安装包,但在Windows环境下进行了初步解压。这是因为在Windows上,通常需要使用像7-Zip或WinRAR这样的工具来处理.tar.gz(也被称为tgz)格式的文件...

Global site tag (gtag.js) - Google Analytics