最新文章列表

跟益达学Solr5之拼音分词[改进版]

      之前一篇介绍过如何自定义实现拼音分词器,不过当初只考虑了全拼这种情况,且有些BUG,趁着抗日胜利70周年阅兵3天假期有时间,又把当初的代码拿起来进行了改进,改进点包括支持全拼,简拼以及全拼+简拼,支持汉字数字是否NGram处理的可配置,支持NGram长度范围的可配置等,特此更新此篇进行分享!如有不妥之处,还望不吝指正!       废话不多说,直接上代码: import java ...
lxwt909 评论(8) 有7087人浏览 2015-09-04 23:15

汉字 转 汉语拼音

   通讯录排序       import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType; import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat; import ...
knight_black_bob 评论(0) 有764人浏览 2015-07-20 16:21

跟益达学Solr5之拼音分词

         应群友强烈要求,特此更新此篇博客。其实在我的Lucene5系列博客里我已经介绍了拼音分词,遗憾的是,大家不能举一反三,好吧,还是我亲 ...
lxwt909 评论(3) 有5799人浏览 2015-06-27 13:15

Lucene5学习之拼音搜索

         今天来说说拼音检索,这个功能其实还是用来提升用户体验的,别的不说,最起码避免了用户切换输入法,如果能支持中文汉语拼音简拼, ...
lxwt909 评论(2) 有9113人浏览 2015-04-29 12:50

kissy gallery系列之pinyin

     本文收录kissy gallery之pinyin:      主要分解一下其中比较核心的设计思想~        为数不多不依赖底层库的,http://gallery.kissyui.com/pinyin/1.0/guide/index.html?spm=0.0.0.0.i7apRd        不过还是有一些bad case,比如fu系列,以反馈到官方git上   ...
zhangyaochun 评论(0) 有2411人浏览 2013-07-26 21:44

python 中文转拼音

1,源码 #!/usr/bin/python # -*- coding:utf-8 -*- # filename:demo.py table = 'a,-20319;ai,-20317;an,-20304;ang,-20295;ao,-20292;ba,-20283;bai,-20265;ban,-20257;bang,-20242;bao,-20230;bei,-20051;ben, ...
i-david 评论(0) 有2636人浏览 2012-09-16 17:38

汉字和拼音转换工具

两个Java版中文转汉语拼音工具   1. CnToSpell  参考:http://wooyon.iteye.com/blog/182326   2. pinyin4j  参考:http://hi.baidu.com/flashmylife/blog/item/b9519bd136389e1d3af3cfa5.html
duguyiren3476 评论(0) 有1368人浏览 2012-07-18 10:36

创建Grails的中文拼音转换服务

实现代码: package utility import net.sourceforge.pinyin4j.PinyinHelper import net.sourceforge.pinyin4j.format.* class PinyinService { static transactional = false static hanYuPinOutputFormat= ...
热带翎羽 评论(0) 有1260人浏览 2011-11-23 22:31

常用类型转换

package com.core.util;       import java.text.SimpleDateFormat; import java.util.Date; import java.util.Random; import java.util.regex.Matcher; import java.util.regex.Pattern; import java.t ...
bean-woo 评论(0) 有836人浏览 2011-10-28 16:39

Oracle按笔画,部首,拼音排序

在oracle9i中新增了按照拼音、部首、笔画排序功能。设置NLS_SORT值 SCHINESE_RADICAL_M 按照部首(第一顺序)、笔划(第二顺序)排序 SCHINESE_STROKE_M 按照笔划(第一顺序)、部首(第二顺序)排序 SCHINESE_PINYIN_M 按照拼音排序,系统的默认排序方式为拼音排序 举例如下: 表名为 dept ,其中name字段是中文,下面分别实现按照单位名 ...
dongisland 评论(0) 有1065人浏览 2011-09-16 09:33

最近博客热门TAG

Java(141747) C(73651) C++(68608) SQL(64571) C#(59609) XML(59133) HTML(59043) JavaScript(54918) .net(54785) Web(54513) 工作(54116) Linux(50906) Oracle(49876) 应用服务器(43288) Spring(40812) 编程(39454) Windows(39381) JSP(37542) MySQL(37268) 数据结构(36423)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics