本月博客排行
-
第1名
宏天软件 -
第2名
kaizi1992 -
第3名
vipbooks - wallimn
- ganxueyun
- arpenker
- daizj
- xpenxpen
- yeluowuhen
- zhangjijun
- sunnylocus
年度博客排行
-
第1名
青否云后端云 -
第2名
宏天软件 -
第3名
wy_19921005 - gashero
- gengyun12
- robotmen
- vipbooks
- 大家都说我很棒
- fantaxy025025
- wallimn
- hbxflihua
- qepwqnp
- e_e
- 解宜然
- ranbuijj
- javashop
- zw7534313
- ssydxa219
- jickcai
- sam123456gz
- gdpglc
- zysnba
- sichunli_030
- tanling8334
- appalese
- benladeng5225
- gaojingsong
- wiseboyloves
- zhangyi0618
- xpenxpen
- jh108020
- luxurioust
- xyuma
- nychen2000
- 龙哥IT
- arpenker
- wjianwei666
- wangchen.ily
- jbosscn
- lzyfn123
- 狂盗一枝梅
- Jameslyy
- hanbaohong
- java-007
- xiangjie88
- kaizi1992
- mengjichen
- silverend
- ajinn
- zxq_2017
最新文章列表
lucene和solr的分词器词库如何从数据库加载?
原创不易,转载请务必注明,原创地址,谢谢配合!
http://qindongliang.iteye.com/blog/2142783
对于中文的搜索来说,词库系统,也是一个比较重要的模块,本篇 ...
解决IkAnalyzer分词后文章字符全角变半角,字母大写变小写问题
工作中利用ik对 文章里的字符做分词 然后返回分词后的字符 进行关键字替换
最后处理后的字符 发下文章里的全角都被ik改成了半角,英文字母如果是大写的也被ik改成了小写 ,这是ik分词内部类规则的一个特性一般用来做搜索的时候用的,这个没错,但是在我的需求里用不到这个特性所以我必须把它去掉
打开ik的源码包org.wltea.analyzer.core.CharacterUtil类里
有个方法 叫r ...
IK的整个分词处理过程
首先,介绍一下IK的整个分词处理过程:
1. Lucene的分词基类是Analyzer,所以IK提供了Analyzer的一个实现类IKAnalyzer。首先,我们要实例化一个IKAnalyzer,它 ...
solr3.3 中文IK分词 (IKAnalyzer3.2.8 bin.zip) --亲测
solr3.3 中文IK分词(IKAnalyzer3.2.8 bin.zip)(亲测)
1.IK下载地址
http://code.google.com/p/ik-analyzer/downloads/detail? name=IKAnalyzer3.2.8%20bin.zip&can=2&q=a
2.解压到本地目录
suse@ser ...