solr单字分词很简单只需配置 相应fieldType就可以使用了。
例:
<fieldType name="text_single_word" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>
相关推荐
中文分词器ik-analyzer-solr5-5.x.jar,已经打包好,直接用就可以
在处理中文文本时,Solr需要特定的中文解析器来正确地分词和理解语义,以实现有效的全文搜索。"solr中文解析器以及使用文档"这个主题主要涵盖了Solr在处理中文内容时的关键技术和实践。 1. **中文分词**:中文文本...
比如智能分词模式会将文本按照词性、词义划分出有意义的词语,而最细粒度分词模式会将文本进一步切分成单字级别,这为不同的应用场景提供了灵活性。 描述中提到的使用指南部分,详细介绍了如何使用IKAnalyzer: - ...
英文和数据支持单字分词; IK中文分词对于数字和英文的分词方式是:一个英文单词为一个语汇单元,一个数值为一个语汇单元。 比如:"2017 IK Analyzer是一个中文分词开源工具包。"这个句话使用IK中文分词后的结果为:...
solr4.3的ik分词器(改了一些smart分词算法。使用maven编译),隔壁有我写的包 支持从solr自己的环境中获取自定义词典(使用solr的ResourceLoader,只需要把字典文件放到对应索引的conf目录里) 增加一个定时更新类...
ik-analyzer是一款开源的、基于Java实现的中文分词器,它主要为Lucene、Solr等全文检索引擎提供中文分词支持。ik-analyzer的设计目标是提供快速、高效的中文分词解决方案,使得在进行中文文本处理时能够更准确地匹配...
- **analysis**:提供多种分词器实现,如标准分词器(StandardAnalyzer)、单字分词器等。 - **highlighter**:用于高亮显示搜索结果中的关键词。 - **queryparser**:解析用户的查询字符串,将其转换成Lucene可...