IK热门博客列表 - ITeye博客频道

博客专栏推荐

本月博客排行

年度博客排行

IK如何实现同义词搜索

转载请声明出处，谢谢。翻译也很辛苦 solr学习交流扣扣群340954928 IK如何实现同义词搜索如何通过IK实现 1、 在schema.xml中配置 <fieldType name="tex ...

IK 同义词 IK同义词同义词搜索

韩悠悠评论(0) 有1721人浏览 2016-06-07 10:11

IK分词器原理与原码分析

本文链接: http://quentinXXZ.iteye.com/blog/2180215 引言做搜索技术的不可能不接触分词器。个人认为为什么搜索引擎无法被数据库所替代的原因主要有两点，一个是在数据量比较大的时候，搜索引擎的查询速度快，第二点在于，搜索引擎能做到比数据库更理解用户。第一点好理解，每当数据库的单个表大了，就是一件头疼的事，还有在较大数据量级的情况下，你让数据库去做 ...

分词器 IK 搜索引擎

quentinXXZ 评论(0) 有6758人浏览 2015-01-26 21:38

IkAnalyzer分词、词频、内链优化

IK 中文分词版本 5.0 package com.test; import java.io.IOException; import java.io.Reader; import java.io.StringReader; import java.util.Arrays; import java.util.HashMap; import java.util.LinkedHashM ...

zqb666kkk 评论(0) 有4053人浏览 2014-07-01 09:52

IKVM 的使用

今天发现一个强大的工具，可以直接把java 的jar 打包成dll文件，然后.net可以直接用里面的方法。引用：http://blog.sina.com.cn/s/blog_8882b46a0101atg3.html

IKVM的使用 IKVM IK VM

yangsongjing 评论(0) 有773人浏览 2014-03-10 19:38

Lucene4.3开发之第四步之脱胎换骨(四)

为防止，一些小网站私自盗用原文，请支持原创原文永久链接:http://qindongliang1922.iteye.com/blog/1922742 前面几章笔者把Lucene基本入门的任督二脉给打通了，从此篇开始，就开始进行Lucene的进阶开发了，那么首先摆在我们面前的第一个必须要解决的问题，就是关于中文分词的问题，因为Lucene毕竟是国外的大牛们开发的，显然会比较侧重英文文章 ...

lucene solr java 中文分词 IK

qindongliang1922 评论(12) 有10006人浏览 2013-08-09 18:40

上一篇讲了使用solr4.3自带的smartcn进行中文分词，这一篇说一下，怎么使用IK进行分词，在这之前先对中文分词的种类介绍一下，目前的中文分词主要有两种 1，基于中科院ICTCLAS的隐式马尔科夫hhmm算法的中文分词器，例如smartcn等。（不支持自定义扩展词库） 2，基于正向迭代最细粒度切分算法（正向最大匹配并且最细分词）例如IK，庖丁等（支持自定义扩展词库）安装分词前，可以去 ...

solr IK 中文分词器

qindongliang1922 评论(2) 有6904人浏览 2013-06-25 15:41

tomcat + solr + IK 全过程

solr初触，在用jetty跑通以后，开始在tomcat下进行配置。首先，下载最新版的solr ,http://apache.dataguru.cn/lucene/solr/4.2.1/ 1：将dist目录下的solr-4.2.0.war 复制到tomcat 下的webapps根目录,重命名为solr.war，运行tomcat，solr.war被解压。 2：在tomcat根目录（可以是任何目录 ...

solr tomcat IK 多核全文索引

Dmingming 评论(0) 有1182人浏览 2013-04-19 15:45

为全文检索方案更新词库

在全文检索应用中，为了提高检索的准确性，我们时常需要定期去更新分词库，以保证各种网络用语、火文（如“屌丝”、“高帅富”，“美富白”），能正确的被识别。目前对中文分词比较好的插件主要有ik-analyzer、mmseg、庖丁等。ik是目前使用比较广泛，而且作者刚对其进行了更新，目前已经能支持简单的分词歧义排除算法，详细情况请参见ik的开发网站。本文将以ik来测试新添加的分词。下面我们开始更新词 ...

ik 全文检索 lucene elasticsearch

eagler006 评论(0) 有1977人浏览 2013-01-11 15:16

发布 IK Analyzer 2012 FF 版本

首先感谢大家对IK分词器的关注。最近一段时间正式公司事务最忙碌的时候，Lucene4.0和Solr4.0发布后，便收到了广大网友的大量邮件要求更新版本，这让我既开心又感到鸭梨大啊~~ 花了3天时间，了解了Lucene4.0和solr 4.0与分词相关部分的源码。果然，又是一次不兼容的修订啊~~ 时间紧迫的推出了IK Analyzer 2012 FF版本（你问啥是FF，其实就是For 4.0 ...

中文分词 IK Java 开源

linliangyi2007 评论(49) 有25235人浏览 2012-10-23 17:50

Tomcat启动时加载IKAnalyzer词典

因为IK实在第一次分词时才加载词典，可能会导致第一次分词较慢，所以打算在Tomcat启动时就加载到内容，提高速度。步骤如下： 1. 实现ServletContextListner接口在contextInitialized(ServletContextEvent arg0)方法中，初始化加载： System.out.println("tomcat启动：初始化词典"); o ...

tomcat ik

BlackWing 评论(0) 有1932人浏览 2012-03-23 11:49

dcbjavaeye 评论(0) 有1558人浏览 2011-10-04 10:05

最近博客热门TAG

Java(141741) C(73643) C++(68602) SQL(64557) C#(59604) XML(59131) HTML(59042) JavaScript(54916) .net(54782) Web(54511) 工作(54116) Linux(50906) Oracle(49861) 应用服务器(43285) Spring(40811) 编程(39452) Windows(39380) JSP(37540) MySQL(37266) 数据结构(36420)

博客人气排行榜

博客电子书下载排行

>>浏览更多下载

博客专栏推荐

本月博客排行

年度博客排行

最新文章列表

IK如何实现同义词搜索

IK分词器原理与原码分析

IkAnalyzer分词、词频、内链优化

IKVM 的使用

Lucene4.3开发之第四步之脱胎换骨(四)

solr4.3之配置中文分词IK

tomcat + solr + IK 全过程

为全文检索方案更新词库

发布 IK Analyzer 2012 FF 版本

Tomcat启动时加载IKAnalyzer词典

Key data varaiables in Universe(not finished)

timeout during allocate / CPIC-CALL: 'ThSAPCMRCV'. (IES 10901) (WIS 10901)

全文检索服务SOLR3.3支持IK中文分词

最近博客热门TAG

博客人气排行榜

博客电子书下载排行

相关资讯

相关讨论