IK分词热门博客列表 - ITeye博客频道

博客专栏推荐

本月博客排行

年度博客排行

博客首页 → IK分词

基于cdh5.7.5集群的solr(4.10.3-cdh5.7.5)+hbase(1.2.0-cdh5.7.5)构建二级索引方案

简述作为开发人员，在阅读该篇博客之前最好已具备以下基本技能：了解Linux命令、HBase Shell、Solr schema.xml文件的常用的标签含义、CDH集群基本操作(所� ...

全文搜索引擎 IK分词

fbinbin 评论(2) 有3527人浏览 2017-02-15 17:46

lucene和solr的分词器词库如何从数据库加载？

原创不易，转载请务必注明，原创地址，谢谢配合! http://qindongliang.iteye.com/blog/2142783 对于中文的搜索来说，词库系统，也是一个比较重要的模块，本篇� ...

solr lucene ik分词

qindongliang1922 评论(3) 有5093人浏览 2014-10-15 15:21

解决IkAnalyzer分词后文章字符全角变半角，字母大写变小写问题

工作中利用ik对文章里的字符做分词然后返回分词后的字符进行关键字替换最后处理后的字符发下文章里的全角都被ik改成了半角，英文字母如果是大写的也被ik改成了小写，这是ik分词内部类规则的一个特性一般用来做搜索的时候用的，这个没错，但是在我的需求里用不到这个特性所以我必须把它去掉打开ik的源码包org.wltea.analyzer.core.CharacterUtil类里有个方法叫r ...

ik分词

zqb666kkk 评论(0) 有2332人浏览 2014-07-18 16:34

IK的整个分词处理过程

首先，介绍一下IK的整个分词处理过程： 1. Lucene的分词基类是Analyzer，所以IK提供了Analyzer的一个实现类IKAnalyzer。首先，我们要实例化一个IKAnalyzer，它� ...

IK分词

fengbin2005 评论(0) 有14819人浏览 2013-06-12 14:06

lucene4.2自带demo

lucene是做什么的网上可以搜到很多资料，就不多说了。我想说了有一下几点 1.为什么不直接用数据库而选用lucene 因为lucene是全文搜索引擎，所以它比较擅长从一个词语中反过来找到那个词在哪篇文章中，是反着的，假如用数据，从2000个字中like那个字段效率很低，而lucene通过生成索引反过来的方式，这样可以提高查询的效率。 2.建立索引主要涉及到的方法和类为了对文档进行索引 ...

lucene solr lucene分词 Ik分词中文分词

xuehanxin 评论(0) 有3868人浏览 2013-04-20 21:05

compass 查询分词

compass 指定查询关键字分词：首先在spring 配置文件里配置 <prop key="compass.engine.analyzer.default.type"> org.wltea.analyzer.lucene.IKAnalyzer </prop> compass.engine.analyz ...

compass lucene IK分词

黎明lm 评论(2) 有1576人浏览 2011-09-27 15:31

solr3.3 中文IK分词 (IKAnalyzer3.2.8 bin.zip) --亲测

solr3.3 中文IK分词(IKAnalyzer3.2.8 bin.zip)(亲测) 1.IK下载地址 http://code.google.com/p/ik-analyzer/downloads/detail? name=IKAnalyzer3.2.8%20bin.zip&can=2&q=a 2.解压到本地目录 suse@ser ...

solr IK分词

黎明lm 评论(0) 有2228人浏览 2011-08-26 09:12

最近博客热门TAG

Java(141741) C(73643) C++(68602) SQL(64557) C#(59604) XML(59131) HTML(59042) JavaScript(54916) .net(54782) Web(54511) 工作(54116) Linux(50906) Oracle(49861) 应用服务器(43285) Spring(40811) 编程(39452) Windows(39380) JSP(37540) MySQL(37266) 数据结构(36420)

博客人气排行榜

博客电子书下载排行

>>浏览更多下载