最新文章列表

基于cdh5.7.5集群的solr(4.10.3-cdh5.7.5)+hbase(1.2.0-cdh5.7.5)构建二级索引方案

简述 作为开发人员,在阅读该篇博客之前最好已具备以下基本技能: 了解Linux命令、HBase Shell、Solr schema.xml文件的常用的标签含义、CDH集群基本操作(所 ...
fbinbin 评论(2) 有3471人浏览 2017-02-15 17:46

lucene和solr的分词器词库如何从数据库加载?

原创不易,转载请务必注明,原创地址,谢谢配合! http://qindongliang.iteye.com/blog/2142783 对于中文的搜索来说,词库系统,也是一个比较重要的模块,本篇 ...
qindongliang1922 评论(3) 有5041人浏览 2014-10-15 15:21

解决IkAnalyzer分词后文章字符全角变半角,字母大写变小写问题

工作中利用ik对 文章里的字符做分词 然后返回分词后的字符 进行关键字替换 最后处理后的字符 发下文章里的全角都被ik改成了半角,英文字母如果是大写的也被ik改成了小写 ,这是ik分词内部类规则的一个特性一般用来做搜索的时候用的,这个没错,但是在我的需求里用不到这个特性所以我必须把它去掉 打开ik的源码包org.wltea.analyzer.core.CharacterUtil类里 有个方法 叫r ...
zqb666kkk 评论(0) 有2241人浏览 2014-07-18 16:34

IK的整个分词处理过程

首先,介绍一下IK的整个分词处理过程: 1. Lucene的分词基类是Analyzer,所以IK提供了Analyzer的一个实现类IKAnalyzer。首先,我们要实例化一个IKAnalyzer,它 ...
fengbin2005 评论(0) 有14751人浏览 2013-06-12 14:06

lucene4.2自带demo

lucene是做什么的网上可以搜到很多资料,就不多说了。我想说了有一下几点 1.为什么不直接用数据库而选用lucene 因为lucene是全文搜索引擎,所以它比较擅长从一个词语中反过来找到那个词在哪篇文章中,是反着的,假如用数据,从2000个字中like那个字段效率很低,而lucene通过生成索引反过来的方式,这样可以提高查询的效率。 2.建立索引主要涉及到的方法和类 为了对文档进行索引 ...
xuehanxin 评论(0) 有3838人浏览 2013-04-20 21:05

compass 查询分词

compass 指定查询关键字分词:   首先在spring 配置文件里配置   <prop key="compass.engine.analyzer.default.type">         org.wltea.analyzer.lucene.IKAnalyzer </prop>     compass.engine.analyz ...
黎明lm 评论(2) 有1481人浏览 2011-09-27 15:31

solr3.3 中文IK分词 (IKAnalyzer3.2.8 bin.zip) --亲测

  solr3.3 中文IK分词(IKAnalyzer3.2.8 bin.zip)(亲测)   1.IK下载地址   http://code.google.com/p/ik-analyzer/downloads/detail?    name=IKAnalyzer3.2.8%20bin.zip&can=2&q=a   2.解压到本地目录      suse@ser ...
黎明lm 评论(0) 有2185人浏览 2011-08-26 09:12

最近博客热门TAG

Java(141747) C(73651) C++(68608) SQL(64571) C#(59609) XML(59133) HTML(59043) JavaScript(54918) .net(54785) Web(54513) 工作(54116) Linux(50906) Oracle(49876) 应用服务器(43288) Spring(40812) 编程(39454) Windows(39381) JSP(37542) MySQL(37268) 数据结构(36423)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics