solr 短文本搜索(模糊，拼音，单字分词)

limeng650419

浏览: 87848 次
性别:
来自: 北京

最近访客更多访客>>

贾斯汀柯腊乐

leimingchao

wangbo56916860

dream_xz

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

solr特性配置

一、期望达到的效果

短文本模糊搜索，支持拼音搜索、数字的前后缀搜索、单字或者单字母搜索。最多支持20个字符长度，更多介绍及注意事项参见模糊搜索使用说明

如文档字段内容为“菊花茶”，则搜索“菊花茶”、“菊花”、“茶”、“花茶”、“菊”、“花”、“菊茶”、“ju”、“juhua”、“juhuacha”、“j”、“jh”、“jhc”等情况下可以召回。
如文档字段内容为手机号“13812345678”，则通过“^138”来搜索以“138”开头的手机号，通过“5678$”搜索以“5678”结尾的手机号；
如文档字段内容为“OpenSearch”，则通过单个字母或者组合都可以检索到。

二、步骤

1.先下载两个jar包，并将jar包上传到solrlib文件夹底下

pinyin4j-2.5.0.jar pinyinAnalyzer4.3.1.jar

2.在solr的schema文件底下配置如下

参数详解:

withOriginal:如果为true，那么在相同的位置产生原始的和反向的词元，如果为false,则只产生反向词元

maxPosAsterisk:指的是“*”最大在第几位会被翻转，默认是2，比如当前值等于2的时候，搜索*明星和女*明星都会被翻转，建议默认值就行。

maxPosQuestion:指的是?号最大在第几位查询此会被翻转，默认为1。设置为0，1和maxposasterisk扭转单纯的后缀查询

minTrailing:触发反转的附加参数,如果星号（“*”）的位置是低于这个分数查询标记长度。默认值为0.0f（禁用）

maxFractionAsterisk:最低数量的尾随字符通配符查询令牌过去后。为了好的性能，这应该设置为大于1的值。默认为2

分享到：

最新县及县以上行政区划代码 | solr 中文单字分词

2016-05-30 16:51
浏览 5804
评论(1)
分类:开源软件
查看更多

1 楼 panghaoyu 2017-03-20

实现一个智能提示功能需要ajax、数据库、jsp/php、算法等很多知识，
如果数据量大，还需要特殊优化
一个小功能，花费太大精力很不划算
92find.com上的一个js插件实现了搜索框自动补全托管服务，
只要一行javascript代码就可以实现百度、淘宝搜索框提示的全部功能
比如：汉字拼音匹配、拼音首字母匹配、模糊搜索、智能容错，还可以自定义提示词汇及其排序权重
花五分钟我的网站就可以部署同百度、淘宝一样强大好用的输入提示功能
同时兼容IE、Firefox、Safari、Chrome、Opera各种浏览器
兼容ios、Android、Windows

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论