最新文章列表

运用lucene+庖丁解牛分词器,集成ssh,对数据库全文搜索

用lucene+庖丁解牛主要是要完成对数据库比如某张表单的某些字段的搜索,由于lucene本身对中文支持非常不好,像StandardAnalyzer基本都是一个字一个字匹配的,而用了庖丁解牛分词之后主要是它有一个dic字典,进行分词,效率很高。 首先我封装了一个lucene类,为了简单一点,对数据库操作直接用jdbc进行数据库操作 package lucene; import java.io.F ...
NealCai 评论(0) 有4372人浏览 2012-05-16 17:10

paoding Lucene中文分词Paoding Analysis

  Paoding Analysis摘要 Paoding's Knives 中文分词具有极 高效率 和 高扩展性 。引入隐喻,采用完全的面向对象设计,构思先进。 高效率:在PIII 1G内存个人机器上,1秒 可准确分词 100万 汉字。 采用基于 不限制个数 的词典文件对文章进行有效切分,使能够将对词汇分类定义。 能够对未知的词汇进行合理解析 ...
qpshenggui 评论(0) 有2904人浏览 2011-08-26 09:21

lucene Analyzer 庖丁解牛 中文分词

    /*      *param   分词      */     public List getname(String param) throws IOException{         //分词(庖丁解牛分词法)         Analyzer ika = new PaodingAnalyzer();         List<String> keys = ne ...
qpshenggui 评论(0) 有1615人浏览 2011-08-25 16:13

最近博客热门TAG

Java(141747) C(73651) C++(68608) SQL(64571) C#(59609) XML(59133) HTML(59043) JavaScript(54918) .net(54785) Web(54513) 工作(54116) Linux(50906) Oracle(49876) 应用服务器(43288) Spring(40812) 编程(39454) Windows(39381) JSP(37542) MySQL(37268) 数据结构(36423)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics