`

solr 中文单字分词

 
阅读更多

solr单字分词很简单只需配置 相应fieldType就可以使用了。

例:

    <fieldType name="text_single_word" class="solr.TextField" positionIncrementGap="100">

      <analyzer type="index">

        <tokenizer class="solr.StandardTokenizerFactory"/>

        <filter class="solr.LowerCaseFilterFactory"/>

      </analyzer>

      <analyzer type="query">

        <tokenizer class="solr.StandardTokenizerFactory"/>

        <filter class="solr.LowerCaseFilterFactory"/>

      </analyzer>

    </fieldType>

分享到:
评论

相关推荐

    中文分词器ik-analyzer-solr5-5.x.jar

    中文分词器ik-analyzer-solr5-5.x.jar,已经打包好,直接用就可以

    solr中文解析器以及使用文档

    在处理中文文本时,Solr需要特定的中文解析器来正确地分词和理解语义,以实现有效的全文搜索。"solr中文解析器以及使用文档"这个主题主要涵盖了Solr在处理中文内容时的关键技术和实践。 1. **中文分词**:中文文本...

    IKAnalyzer中文分词器v2012使用手册.pdf

    比如智能分词模式会将文本按照词性、词义划分出有意义的词语,而最细粒度分词模式会将文本进一步切分成单字级别,这为不同的应用场景提供了灵活性。 描述中提到的使用指南部分,详细介绍了如何使用IKAnalyzer: - ...

    xmljava系统源码-IKAnalyzer2017_6_6_0:IK中文分词,兼容solr/lucene6.6.0,优化数字和英文搜索

    英文和数据支持单字分词; IK中文分词对于数字和英文的分词方式是:一个英文单词为一个语汇单元,一个数值为一个语汇单元。 比如:"2017 IK Analyzer是一个中文分词开源工具包。"这个句话使用IK中文分词后的结果为:...

    ik4solr4.3:ik分词器for Solr4.3,支持4.4,二进制不用修改也支持4.6,不放心可以改下POM中的依赖

    solr4.3的ik分词器(改了一些smart分词算法。使用maven编译),隔壁有我写的包 支持从solr自己的环境中获取自定义词典(使用solr的ResourceLoader,只需要把字典文件放到对应索引的conf目录里) 增加一个定时更新类...

    ik-analyzer:与lucene,solr版本同步的ik分词

    ik-analyzer是一款开源的、基于Java实现的中文分词器,它主要为Lucene、Solr等全文检索引擎提供中文分词支持。ik-analyzer的设计目标是提供快速、高效的中文分词解决方案,使得在进行中文文本处理时能够更准确地匹配...

    Lucene笔记

    - **analysis**:提供多种分词器实现,如标准分词器(StandardAnalyzer)、单字分词器等。 - **highlighter**:用于高亮显示搜索结果中的关键词。 - **queryparser**:解析用户的查询字符串,将其转换成Lucene可...

Global site tag (gtag.js) - Google Analytics