- 浏览: 3462195 次
- 性别:
- 来自: China
文章分类
- 全部博客 (536)
- ajax (1)
- Algorithm (14)
- Android (40)
- CSS/HTML... (2)
- defy (3)
- DesignPattern (2)
- dorado (0)
- Drools (6)
- English/日本語 (7)
- Flex (2)
- Framework (0)
- Google (3)
- hibernate (13)
- homework (3)
- HTML5 (0)
- IDE (29)
- java (45)
- javaee (7)
- Javascript (14)
- java组件 (5)
- jQuery (4)
- jsp (8)
- jsf (2)
- Linux (2)
- lucene (0)
- mysql (6)
- news (3)
- Oracle (8)
- other (4)
- PHP (5)
- Python (0)
- Software Engineering (3)
- spring (7)
- struts1.x (14)
- struts2.x (14)
- strolling in cloud (1)
- subject:javaEnhance (20)
- Tomcat (7)
- validator (3)
- 学习·方法·心得 (8)
- .NET (2)
- vba (6)
- groovy (5)
- grails (2)
- SWT (0)
- big data (1)
- perl (1)
- objective-c (50)
- product (1)
- mac (7)
- ios (188)
- ios-phone (2)
- ios-system (15)
- ios-network (5)
- ios-file (4)
- ios-db (1)
- ios-media (3)
- ios-ui (27)
- ios-openSource (6)
- ios-animation (5)
- ios-drawing (7)
- c (2)
- ios-app (2)
- ios-course (15)
- ios-runtime (14)
- ios-code (8)
- ios-thread (8)
- ios-LBS (2)
- ios-issue (1)
- ios-design (2)
- Jailbreak (2)
- cocos2d (0)
- swift (16)
- ios-framework (4)
- apple watch (4)
- ios-web (1)
- react native (3)
- TVOS (1)
- OpenGL (1)
最新评论
-
xiaobinggg:
...
Session机制详解 -
菜鸟学生会:
Drools规则工作流引擎开发教程网盘地址:http://pa ...
Drools入门-----------环境搭建,分析Helloworld -
wangyudong:
不是很好用,不支持自动化测试RESTful API,也不支持自 ...
Simple REST Client POST使用方法 -
Paul0523:
很棒的一篇文章,感谢楼主分享
Session机制详解 -
啸笑天:
获取原型对象的三种方法<script>functi ...
复习JavaScript面向对象技术
pinyin4j是一个功能强悍的汉语拼音工具包,主要是从汉语获取各种格式和需求的拼音,功能强悍,下面看看如何使用pinyin4j。下载地址:http://pinyin4j.sourceforge.net/
import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType; import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat; import net.sourceforge.pinyin4j.format.HanyuPinyinToneType; import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination; import java.io.UnsupportedEncodingException; /** * 拼音工具 * * @author leizhimin 2009-7-15 15:26:21 */ public class PinyinToolkit { /** * 获取汉字串拼音首字母,英文字符不变 * * @param chinese 汉字串 * @return 汉语拼音首字母 */ public static String cn2FirstSpell(String chinese) { StringBuffer pybf = new StringBuffer(); char[] arr = chinese.toCharArray(); HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat(); defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE); defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE); for (int i = 0; i < arr.length; i++) { if (arr[i] > 128) { try { String[] _t = PinyinHelper.toHanyuPinyinStringArray(arr[i], defaultFormat); if (_t != null) { pybf.append(_t[0].charAt(0)); } } catch (BadHanyuPinyinOutputFormatCombination e) { e.printStackTrace(); } } else { pybf.append(arr[i]); } } return pybf.toString().replaceAll("\\W", "").trim(); } /** * 获取汉字串拼音,英文字符不变 * * @param chinese 汉字串 * @return 汉语拼音 */ public static String cn2Spell(String chinese) { StringBuffer pybf = new StringBuffer(); char[] arr = chinese.toCharArray(); HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat(); defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE); defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE); for (int i = 0; i < arr.length; i++) { if (arr[i] > 128) { try { pybf.append(PinyinHelper.toHanyuPinyinStringArray(arr[i], defaultFormat)[0]); } catch (BadHanyuPinyinOutputFormatCombination e) { e.printStackTrace(); } } else { pybf.append(arr[i]); } } return pybf.toString(); } public static void main(String[] args) throws UnsupportedEncodingException { String x = "嘅囧誰說壞學生來勼髮視頻裆児"; System.out.println(cn2FirstSpell(x)); System.out.println(cn2Spell(x)); } }
运行结果:
kjsshxsljfspde kaijiongshuishuohuaixueshenglaijiufashipindanger Process finished with exit code 0
在某些系统上可能有字符集的问题,需要做预处理。
感谢:http://lavasoft.blog.51cto.com/62575/178320
- pinyin4j-2.5.0.zip (360.2 KB)
- 下载次数: 60
发表评论
-
java正则表达式修改html标签中属性
2013-04-21 11:45 4869package com.ez; import ... -
String.intern()解析
2012-07-16 22:53 1620String.intern()解析 Str ... -
Java中的访问控制public,private,protected,package
2012-05-08 02:41 28611. Java中的访问控制表1-1 可见/ ... -
Beginning SWT
2012-04-12 15:41 0SWT(Standard Widget Toolkit, ... -
Java IO读写大文件的几种方式及测试
2012-03-13 17:24 3435读取文件大小:1.45G 第一种,OldIO: (注意文件和系 ... -
Java编程中“为了性能”尽量要做到的一些地方
2012-03-13 17:25 1363最近的机器内存又爆满了,除了新增机器内存外,还应该好好r ... -
复习nio
2012-03-13 17:24 1776简介: JDK 1.4 中引入的新输入输出 (NIO) 库在 ... -
The Closeable, Flushable, Readable, and Appendable interfaces
2012-03-13 17:23 1902Java SE 5.0引入了4个附加的接口:C ... -
Java IO复习
2012-03-13 17:22 1431什么是流: 流是一个抽象的概念。当Java程序需要 ... -
java模拟spring ioc
2011-12-08 17:21 2250<?xml version="1.0&q ... -
javaweb读取任意目录的下的properties配置文件(解决普通java类读web-inf下任意目录)
2011-10-28 15:59 11935看到很多用getResourcesAsStream()来读取. ... -
java程序员常用英语
2011-11-14 08:16 5624干程序员这行实在是 ... -
Oracle在2011年取得的Java主要成就
2011-10-20 08:29 2053甲骨文公司继续推动Java前进的战略。自2010年1月收购 ... -
Java规则引擎与其API(JSR-94)
2011-10-19 10:02 4244转自:http://www.ibm.com/developer ... -
Core Java , Volume 1 笔记
2011-07-17 11:36 051 StringBuffer:效率略低于String ... -
树形显示
2011-07-17 11:26 1676/** 树形结构应用十分广泛。 下面这段代码根据 ... -
求能除尽1至n的最小整数
2011-07-16 02:43 4012为什么1小时有60分钟,而不是100分钟呢?这是历史上的 ... -
java 四则运算 栈的实现
2011-07-15 13:42 13892import java.util.Stack; /* ... -
【code】java的中文转拼音工具类
2011-07-01 09:26 3773package my; public class ... -
Java随机数详解
2011-05-14 19:57 0Java随机数详解新手晋级 方法1(数据 ...
相关推荐
这里我们将详细介绍如何使用`pinyin4j`这个Java库来实现中文字符串的拼音排序。 `pinyin4j`是一个强大的Java库,它提供了将汉字转换为拼音的功能,这使得我们可以基于每个汉字的拼音首字母来进行排序。以下是如何...
为了实现从汉字到拼音的转换,这里假设使用了第三方库`Pinyin4j`。实际应用中可能需要根据项目需求选择合适的库或方法。 ```java // 导入必要的库 import net.sourceforge.pinyin4j.PinyinHelper; import ...
《Java源码解析:pinyin4j中文转拼音库》 在Java开发中,处理中文字符,特别是将中文转换为拼音的需求广泛存在。pinyin4j是一个经典的Java库,专门用于实现这一功能。这个库简单易用,适用于各种场景,如搜索引擎...
Pinyin4j是一个Java库,主要用于将汉字转换为拼音,这对于进行基于拼音的搜索和排序非常有用。pinyinAnalyzer是Lucene的一个分析器,它利用了Pinyin4j的功能,能够将输入的中文文本分词并转化为拼音形式,以便于...
`pinyin4j` 是一个开源项目,主要用于Java程序中的汉字转拼音功能。它的版本号为2.5.0,提供了全面的拼音转换支持,包括全拼、简拼、声调等。在Android开发中,由于Android系统主要基于Java,因此可以很方便地引入`...
pinyin4j是一个Java库,专门用于将汉字转换为拼音,它在处理中文字符转拼音的工作中扮演着重要角色。这个库简单易用,功能强大,适用于各种需要汉字转拼音的应用场景,例如搜索引擎优化、文本分析、自然语言处理等。...
总之,Java中的汉字转拼音工具类是处理中文数据的关键组件,它使得Java开发者能够更方便地在国际化环境中工作,特别是在与英文系统集成的场景下。通过了解和熟练使用这类工具,可以提升项目的可扩展性和用户体验。
pinyin4j是一个流行的Java库,专门用于处理汉字转拼音的任务。它为开发者提供了一种简单且高效的方式来获取汉字的拼音表示,广泛应用于搜索引擎优化、文本分析、自然语言处理等领域。本文将通过解析pinyin4j的源码,...
2. **第三方库**:对于更复杂的拼音转换需求,如简拼、多音字处理等,开发者可能会选择使用第三方库,如`HanLP`、`Pinyin4j`(Java)或`OpenCC`等。虽然这些库不是直接在Delphi环境下使用,但可以通过创建接口或者...
Pinyin4j库的核心功能在于其对中文字符集(Unicode)的支持,它可以将汉字转化为对应的拼音形式。这在各种应用场景中都极其有用,例如搜索关键词的标准化、中文输入法的实现、甚至是数据分析和文本处理等。通过...
Pinyin4j.Net是从Codeplex备份的资源,是一个专门为.NET平台设计的汉字转拼音库,它基于Java版的Pinyin4j进行了移植。 Pinyin4j.Net库包含了多个关键组件,例如: 1. Net.Sourceforge.Pinyin4j:这是核心的拼音...
2. **ICU4J库**:国际组件库(ICU,International Components for Unicode)是一个强大的跨平台库,包含了许多与国际化相关的功能,包括汉字转拼音。在Java中,你可以通过引入ICU4J的依赖,然后使用`...
总之,"pinyinAnalyzer4.3.1" 和 "pinyin4j-2.5.0" 是Java开发者处理中文拼音问题的重要工具。通过深入理解和灵活运用这两个库,可以大大提高中文文本处理的效率和质量,为各种涉及中文字符的应用提供坚实的技术支撑...
pinyin4j是一个开源项目,它的主要功能是将汉字转换为对应的汉语拼音,同时支持获取汉字的首字母,这在处理中文数据时非常有用。在2.5.0版本中,这个库提供了一种高效且易于使用的API,使得开发者能够快速集成到自己...
这个应用程序可能使用了诸如Pinyin4j或Microsoft的Unidecode等库,这些库能够准确地将每个汉字映射到其标准拼音。 接着,五笔码转换是另一个关键功能。五笔码是一种汉字输入法,通过将汉字拆分成基本的笔画和部首,...
在Delphi中,实现这个功能通常需要调用特定的库或者API,比如Microsoft的Uniscribe或Google的Pinyin4j(虽然Pinyin4j是Java库,但可以通过接口调用)。 在处理生僻字时,问题会变得更加复杂。生僻字指的是那些不...
此外,实现汉字转拼音还可以考虑使用开源项目,如Pinyin4j(Java)、PyPinyin(Python)等,它们提供了丰富的功能和良好的社区支持。但如果你选择使用提供的库文件,那么你需要对C++或C#等支持DLL导入的语言有一定...
pinyin4j是一个Java库,用于处理汉字和生成拼音,支持多种拼音格式,如全拼、简拼等。而pinyinAnalyzer是Solr中的一个分词器,它利用了pinyin4j库来对输入的中文文本进行拼音分析,从而实现基于拼音的搜索。 在Solr...
pinyin4j-2.5.0.jar是用于处理中文到拼音转换的第三方库,它是分析插件的核心组件。同时,还需要编辑Elasticsearch的配置文件(如elasticsearch.yml),添加或修改分析器的相关设置,以启用并配置pinyin分析器。 ...
本压缩包"中文汉字转拼音服务包"提供了一个基于Java实现的解决方案,它包含了一个核心的服务组件以及相关的示例说明。 首先,让我们详细了解"中文汉字转拼音"这一概念。中文汉字转拼音是将汉字转换为其对应的汉语...