paodinganalyzer热门博客列表 - ITeye博客频道

博客专栏推荐

本月博客排行

年度博客排行

运用lucene+庖丁解牛分词器，集成ssh，对数据库全文搜索

用lucene+庖丁解牛主要是要完成对数据库比如某张表单的某些字段的搜索，由于lucene本身对中文支持非常不好，像StandardAnalyzer基本都是一个字一个字匹配的，而用了庖丁解牛分词之后主要是它有一个dic字典，进行分词，效率很高。首先我封装了一个lucene类，为了简单一点，对数据库操作直接用jdbc进行数据库操作 package lucene; import java.io.F ...

lucene PaodingAnalyzer java jdbc

NealCai 评论(0) 有4401人浏览 2012-05-16 17:10

paoding Lucene中文分词Paoding Analysis

Paoding Analysis摘要 Paoding's Knives 中文分词具有极高效率和高扩展性。引入隐喻，采用完全的面向对象设计，构思先进。高效率：在PIII 1G内存个人机器上，1秒可准确分词 100万汉字。采用基于不限制个数的词典文件对文章进行有效切分，使能够将对词汇分类定义。能够对未知的词汇进行合理解析 ...

analyzer paodinganalyzer 庖丁解牛 lucene

qpshenggui 评论(0) 有2955人浏览 2011-08-26 09:21

lucene Analyzer 庖丁解牛中文分词

/* *param 分词 */ public List getname(String param) throws IOException{ //分词(庖丁解牛分词法) Analyzer ika = new PaodingAnalyzer(); List<String> keys = ne ...

analyzer paodinganalyzer 庖丁解牛分词法 lucene

qpshenggui 评论(0) 有1651人浏览 2011-08-25 16:13

最近博客热门TAG

Java(141741) C(73643) C++(68602) SQL(64557) C#(59604) XML(59131) HTML(59042) JavaScript(54916) .net(54782) Web(54511) 工作(54116) Linux(50906) Oracle(49861) 应用服务器(43285) Spring(40811) 编程(39452) Windows(39380) JSP(37540) MySQL(37266) 数据结构(36420)

博客人气排行榜

博客电子书下载排行

>>浏览更多下载

博客专栏推荐

本月博客排行

年度博客排行

最新文章列表

运用lucene+庖丁解牛分词器，集成ssh，对数据库全文搜索

paoding Lucene中文分词Paoding Analysis

lucene Analyzer 庖丁解牛中文分词

最近博客热门TAG

博客人气排行榜

博客电子书下载排行

相关资讯

相关讨论

博客专栏推荐

本月博客排行

年度博客排行

最新文章列表

运用lucene+庖丁解牛分词器，集成ssh，对数据库全文搜索

paoding Lucene中文分词Paoding Analysis

lucene Analyzer 庖丁解牛 中文分词

最近博客热门TAG

博客人气排行榜

博客电子书下载排行

相关资讯

相关讨论

lucene Analyzer 庖丁解牛中文分词