solr 中文单字分词 - 大石榴 - ITeye博客

`

limeng650419

浏览: 88086 次
性别:
来自: 北京

最近访客更多访客>>

贾斯汀柯腊乐

leimingchao

wangbo56916860

dream_xz

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

panghaoyu：实现一个智能提示功能需要ajax、数据库、jsp/php、算法 ...
solr 短文本搜索(模糊，拼音，单字分词)

solr 中文单字分词

博客分类：

solr特性配置

阅读更多

solr单字分词很简单只需配置相应fieldType就可以使用了。

例:

<fieldType name="text_single_word" class="solr.TextField" positionIncrementGap="100">

<analyzer type="index">

<tokenizer class="solr.StandardTokenizerFactory"/>

<filter class="solr.LowerCaseFilterFactory"/>

</analyzer>

<analyzer type="query">

<tokenizer class="solr.StandardTokenizerFactory"/>

<filter class="solr.LowerCaseFilterFactory"/>

</analyzer>

</fieldType>

分享到：

solr 短文本搜索(模糊，拼音，单字分词) | solr 中文分词配置

2016-05-27 11:15
浏览 1529
评论(0)
分类:开源软件
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

中文分词器ik-analyzer-solr5-5.x.jar: 中文分词器ik-analyzer-solr5-5.x.jar，已经打包好，直接用就可以

solr中文解析器以及使用文档: 在处理中文文本时，Solr需要特定的中文解析器来正确地分词和理解语义，以实现有效的全文搜索。"solr中文解析器以及使用文档"这个主题主要涵盖了Solr在处理中文内容时的关键技术和实践。 1. **中文分词**：中文文本...

IKAnalyzer中文分词器v2012使用手册.pdf: 比如智能分词模式会将文本按照词性、词义划分出有意义的词语，而最细粒度分词模式会将文本进一步切分成单字级别，这为不同的应用场景提供了灵活性。描述中提到的使用指南部分，详细介绍了如何使用IKAnalyzer： - ...

xmljava系统源码-IKAnalyzer2017_6_6_0:IK中文分词，兼容solr/lucene6.6.0，优化数字和英文搜索: 英文和数据支持单字分词； IK中文分词对于数字和英文的分词方式是：一个英文单词为一个语汇单元，一个数值为一个语汇单元。比如："2017 IK Analyzer是一个中文分词开源工具包。"这个句话使用IK中文分词后的结果为：...

ik4solr4.3:ik分词器for Solr4.3，支持4.4，二进制不用修改也支持4.6，不放心可以改下POM中的依赖: solr4.3的ik分词器（改了一些smart分词算法。使用maven编译），隔壁有我写的包支持从solr自己的环境中获取自定义词典（使用solr的ResourceLoader，只需要把字典文件放到对应索引的conf目录里）增加一个定时更新类...

ik-analyzer:与lucene,solr版本同步的ik分词: ik-analyzer是一款开源的、基于Java实现的中文分词器，它主要为Lucene、Solr等全文检索引擎提供中文分词支持。ik-analyzer的设计目标是提供快速、高效的中文分词解决方案，使得在进行中文文本处理时能够更准确地匹配...

Lucene笔记: - **analysis**：提供多种分词器实现，如标准分词器（StandardAnalyzer）、单字分词器等。 - **highlighter**：用于高亮显示搜索结果中的关键词。 - **queryparser**：解析用户的查询字符串，将其转换成Lucene可...

Global site tag (gtag.js) - Google Analytics