`
secondhrc
  • 浏览: 3652 次
  • 性别: Icon_minigender_1
  • 来自: 广州
文章分类
社区版块
存档分类
最新评论

ikanalysis兼容solr-4.9.0

 
阅读更多

       solr-4.9.0自带lucene-analyzers-smartcn-4.9.0.jar实现中文分词。可惜它的词库文件都是字节码的,添加自定义词库没有现成的java实现。

       而IKAnalyzer正好支持明文文本词库,可惜它从2012年起就没有维护了。于是只能参考smartcn和旧版的IKAnalyzer实现再适配一个。

      代码很简单,2个类就能适配好。

 

solr-ik-adapter.jar  懒人直接用这个jar包即可

IKAnalyzerFactory.rar  要看代码并编译的可下载这个

 

       

使用方法,定义filedtype时这个写即可

 

<fieldType name="text_general" class="solr.TextField" positionIncrementGap="100">  
      <analyzer type="index">  
      	<tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory"   />     
      	   
      	<!--以下内容可选-->
        <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/> 
        <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />  
        <filter class="solr.LowerCaseFilterFactory"/>   
        <filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt" />      
        <!--以下内容可选end-->           
      </analyzer>  
       
      <analyzer type="query">  
      	
        <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory"/>    
        <!--以下内容可选-->
        <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>   
        <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />  
        <filter class="solr.LowerCaseFilterFactory"/>         
        <filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt" />    
        <!--以下内容可选end-->           
      </analyzer>  
    </fieldType>  

 

 

分享到:
评论

相关推荐

    solr-4.9.0-安装部署文档

    - 将 C:\solr-4.9.0\example\resources\log4j.properties 复制到 C:\apache-tomcat-7.0.53\webapps\solr\WEB-INF\classes 3. **启动与测试** - 启动 Tomcat 服务器 - 在浏览器中访问 http://localhost:8080/solr...

    solr-core-4.9.0.jar

    solr-core-4.9.0.jar

    solr-solrj-4.9.0.jar

    solr-solrj-4.9.0.jar

    ik-analyzer-solr-6.x.jar

    solr更新到6.x的版本了,ik-...ik-analyzer-solr-6.0.0.jar ik-analyzer-solr-6.2.1.jar ik-analyzer-solr-6.3.0.jar 更多的相关信息,请参照我的博客 http://blog.csdn.net/Bleachswh/article/details/53228614

    ik-analyzer-solr5-5.x.jar

    ik-analyzer分词器,支持solr5-5.x

    solr-mongo-importer-1.1.0.jar

    solr-mongo-importer-1.1.0.jar solr-mongo-importer-1.1.0.jar solr-mongo-importer-1.1.0.jar

    solr6的中文分词器ik-analyzer-solr-6.0.jar

    solr6的中文分词器ik-analyzer-solr-6.0.jar,在solr上亲测可用

    IKAnalyzer 支持Solr-5.5.0

    标题中的"IKAnalyzer 支持Solr-5.5.0"表明了这个压缩包是为集成IK Analyzer到Apache Solr 5.5.0版本而准备的。IK Analyzer是一款针对中文分词的开源工具,它在处理中文文本时表现优秀,能够提高搜索引擎的检索效果。...

    ik-analyzer-solr7.zip

    解压"ik-analyzer-solr7.zip"后,你会得到ik-analyzer-solr7.x目录,这个目录包含了IKAnalyzer在Solr中的所有相关组件。通常,这些组件包括配置文件、分词器的JAR库以及可能的字典文件。配置文件(如`schema.xml`或`...

    ik-analyzer-solr-master_ik分词器_pocket7ce_源码_

    在标题"ik-analyzer-solr-master_ik分词器_pocket7ce_源码_"中,ik-analyzer-solr-master表明这是一个针对Apache Solr优化的ik分词器版本,适合与Solr集成进行全文检索。 **Ik Analyzer简介** Ik Analyzer是由国人...

    apache-solr-dataimportscheduler-1.0.zip_official54l_solr 5.x定时生成

    "apache-solr-dataimportscheduler-1.0.zip"是一个官方发布的54l版本,专门针对Solr 5.x的定时索引生成需求。 数据导入调度器(DataImportScheduler)是这个扩展的核心组件,它允许用户根据预设的时间间隔自动执行...

    ikanalyzer-solr5

    1. 将 ikanalyzer-solr5 解压后,将其中的 jar 包复制到 Solr 的 `server/solr-webapp/webapp/WEB-INF/lib` 目录下,这样 Solr 就可以加载这个分词器。 2. 配置 Solr 的 schema.xml 文件,指定使用 ikanalyzer 作为...

    ik-analyzer-solr-master

    《ik-analyzer-solr-master:为Solr提供强大的中文分词支持》 "ik-analyzer-solr-master"是一个专门为Solr搜索引擎优化的中文分词器项目,它适用于Solr 7.x和8.x版本。这个项目的核心目标是解决在处理中文文本时的...

    solr-import-export-json最新代码

    solr-import-export-json最新代码solr-import-export-json最新代码solr-import-export-json最新代码solr-import-export-json最新代码solr-import-export-json最新代码solr-import-export-json最新代码solr-import-...

    solr增量更新架包apache-solr-dataimportscheduler.jar

    "apache-solr-dataimportscheduler.jar" 是一个专门为Solr设计的扩展包,用于实现自动化的数据增量更新调度。 首先,我们要理解Solr的数据导入过程。Solr使用DataImportHandler(DIH)来从关系型数据库、XML文件或...

    apache-solr-3.5.0.jar

    这个名为"apache-solr-3.5.0.jar"的压缩包包含两个关键组件:`apache-solr-core-3.5.0.jar`和`apache-solr-solrj-3.5.0.jar`,它们对于成功搭建Solr 3.5.0环境至关重要。 1. `apache-solr-core-3.5.0.jar`: 这是...

    solr-dataimport-scheduler.jar 可使用于solr7.x版本

    Solr 数据导入调度器(solr-dataimport-scheduler.jar)是一个专门为Apache Solr 7.x版本设计的组件,用于实现数据的定期索引更新。在理解这个知识点之前,我们需要先了解Solr的基本概念以及数据导入处理...

Global site tag (gtag.js) - Google Analytics