- 浏览: 424961 次
- 性别:
- 来自: 北京
文章分类
- 全部博客 (184)
- IDE (4)
- dotCMS (3)
- Liferay Portal (1)
- J2EE (7)
- My SQL (16)
- IBM DB2 (3)
- Oracle (2)
- JDBC (4)
- Hibernate (3)
- JSP (0)
- Framework (4)
- Java编程 (30)
- C++编程 (0)
- Struts 1.X (2)
- Struts 2.X (6)
- Linux (11)
- Spring (7)
- JavaScript (6)
- Ajax (2)
- XML (3)
- IBM Websphere Portal (1)
- IBM Lotus Quickr (1)
- CMS (2)
- ERP (0)
- CRM (0)
- 大型网站架构开发 (1)
- 面试武器 (2)
- HTML 5 (2)
- dTree && webFxloadTree (2)
- JVM (7)
- SQL Server (3)
- Tomcat && Apache && Jboss && Weblogic-中间件 (4)
- FreeMarker (2)
- MongoDB (7)
- OpenSource开源 (24)
- Cloud (0)
- FFmpeg (3)
- Thrift (1)
- SpringSide (1)
- Design Pattern (1)
- solr&&ES (2)
- git&svn (1)
- 大数据 (8)
- 人工智能 (0)
- Hadoop (3)
- Spark (0)
- Sqoop (1)
- Flume (1)
- Hive (3)
- HDFS (4)
- ES (0)
- Redis (1)
- Kafka (3)
- MR (0)
- 机器学习 (0)
- 深度学习 (0)
- Impala (2)
- HBase (2)
- Spring Boot (1)
- Spring Cloud (0)
- 大数据架构 (6)
- 架构思想理论 (6)
- 技术管理 (4)
- 数据结构与算法 (4)
最新评论
-
huijz:
...
Spring Data JPA研究-使用Spring Data JPA 简化JPA 开发(ZZ) -
用户名不存在:
[img][/img][*]引用[u][/u][i][/i][ ...
MongoDB 模糊查询的三种实现方式-morphia实现 -
junsheng100:
请给个完整的例子吧!包括jar文件等
java调用ffmpeg获取视频文件信息参数代码 -
mj:
谢谢!!
SQL Server里面如何导出包含(insert into)数据的SQL脚本 (转载ZZ)
Pinyin4j是一个流行的Java库,支持中文字符和拼音之间的转换。拼音输出格式可以定制。
代码实现如下:
1.带声调的方法
/**
* 汉字转换位汉语拼音,英文字符不变 带声调的方法
* @param chines 汉字
* @return 拼音
*/
public static String converterToSpellWithTONE(String chines) {
String pinyinName = "";
char[] nameChar = chines.toCharArray();
HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
defaultFormat.setToneType(HanyuPinyinToneType.WITH_TONE_NUMBER);
defaultFormat.setVCharType(HanyuPinyinVCharType.WITH_V);
for (int i = 0; i < nameChar.length; i++) {
if (nameChar[i] > 128) {
try {
if (PinyinHelper.toHanyuPinyinStringArray(nameChar[i], defaultFormat) != null
&& PinyinHelper.toHanyuPinyinStringArray(nameChar[i], defaultFormat).length > 0) {
pinyinName += PinyinHelper.toHanyuPinyinStringArray(nameChar[i], defaultFormat)[0];
}
} catch (BadHanyuPinyinOutputFormatCombination e) {
e.printStackTrace();
}
} else {
pinyinName += nameChar[i];
}
}
return pinyinName;
}
2.不带声调的方法
/**
* 汉字转换位汉语拼音,英文字符不变
* @param chines 汉字
* @return 拼音
*/
public static String converterToSpell(String chines) {
String pinyinName = "";
char[] nameChar = chines.toCharArray();
HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
defaultFormat.setVCharType(HanyuPinyinVCharType.WITH_V);
for (int i = 0; i < nameChar.length; i++) {
if (nameChar[i] > 128) {
try {
if (PinyinHelper.toHanyuPinyinStringArray(nameChar[i], defaultFormat) != null
&& PinyinHelper.toHanyuPinyinStringArray(nameChar[i], defaultFormat).length > 0) {
pinyinName += PinyinHelper.toHanyuPinyinStringArray(nameChar[i], defaultFormat)[0];
}
} catch (BadHanyuPinyinOutputFormatCombination e) {
e.printStackTrace();
}
} else {
pinyinName += nameChar[i];
}
}
return pinyinName;
}
3.
/**
* 汉字转换位汉语拼音首字母,英文字符不变
* @param chines 汉字
* @return 拼音
*/
public static String converterToFirstSpell(String chines) {
String pinyinName = "";
char[] nameChar = chines.toCharArray();
HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
defaultFormat.setVCharType(HanyuPinyinVCharType.WITH_V);
for (int i = 0; i < nameChar.length; i++) {
if (nameChar[i] > 128) {
try {
if (PinyinHelper.toHanyuPinyinStringArray(nameChar[i], defaultFormat) != null
&& PinyinHelper.toHanyuPinyinStringArray(nameChar[i], defaultFormat).length > 0) {
pinyinName += PinyinHelper.toHanyuPinyinStringArray(nameChar[i], defaultFormat)[0].charAt(0);
}
} catch (BadHanyuPinyinOutputFormatCombination e) {
e.printStackTrace();
}
} else {
pinyinName += nameChar[i];
}
}
return pinyinName;
}
Part Two:详细实现类如下:
package test;
import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;
/**
*
* pinyin4j使用
*
* @author
*
*/
public class PinYinTest {
public static HanyuPinyinToneType[] toneTypes = new HanyuPinyinToneType[] {
HanyuPinyinToneType.WITH_TONE_NUMBER,
HanyuPinyinToneType.WITHOUT_TONE,
HanyuPinyinToneType.WITH_TONE_MARK };
public static HanyuPinyinVCharType[] vCharTypes = new HanyuPinyinVCharType[] {
HanyuPinyinVCharType.WITH_U_AND_COLON, HanyuPinyinVCharType.WITH_V,
HanyuPinyinVCharType.WITH_U_UNICODE };
public static HanyuPinyinCaseType[] caseTypes = new HanyuPinyinCaseType[] {
HanyuPinyinCaseType.LOWERCASE, HanyuPinyinCaseType.UPPERCASE };
/**
* 将中文字符转换为相应的数组
*
* @param chineseCharacter
* @param toneSelection
* @param vcharSelection
* @param caseSelection
*/
private static void updateFormattedText(String chineseCharacter,
HanyuPinyinToneType toneSelection,
HanyuPinyinVCharType vcharSelection,
HanyuPinyinCaseType caseSelection) {
// 拼音格式化对象
HanyuPinyinOutputFormat outputFormat = new HanyuPinyinOutputFormat();
// 设置中文声调
if (toneSelection != null) {
if (toneTypes[0] == toneSelection) {
outputFormat.setToneType(HanyuPinyinToneType.WITH_TONE_NUMBER);
} else if (toneTypes[1] == toneSelection) {
outputFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
} else if (toneTypes[2] == toneSelection) {
outputFormat.setToneType(HanyuPinyinToneType.WITH_TONE_MARK);
}
}
// 设置特殊拼音的转换
if (vcharSelection != null) {
if (vCharTypes[0] == vcharSelection) {
outputFormat
.setVCharType(HanyuPinyinVCharType.WITH_U_AND_COLON);
} else if (vCharTypes[1] == vcharSelection) {
outputFormat.setVCharType(HanyuPinyinVCharType.WITH_V);
} else if (vCharTypes[2] == vcharSelection) {
outputFormat.setVCharType(HanyuPinyinVCharType.WITH_U_UNICODE);
}
}
// 设置转换的拼音的大小写
if (caseSelection != null) {
if (caseTypes[0] == caseSelection) {
outputFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
} else if (caseTypes[1] == caseSelection) {
outputFormat.setCaseType(HanyuPinyinCaseType.UPPERCASE);
}
}
// 获取字符串
char[] cnStr = chineseCharacter.toCharArray();
String msg = "";
for (char chineseChar : cnStr) {
// 将字符转换为拼音数组
String[] pinyinArray = null;
String myenglish = "";
try {
myenglish = PinyinHelper.toHanyuPinyinStringArray(
chineseChar, outputFormat)[0];
} catch (BadHanyuPinyinOutputFormatCombination e1) {
e1.printStackTrace();
}
// String outputString = concatPinyinStringArray(pinyinArray);
System.out.println(myenglish);
msg += myenglish;
}
System.out.println("msg is====" + msg);
}
private static void updateFormattedText2(String chineseCharacter,
HanyuPinyinToneType toneSelection,
HanyuPinyinVCharType vcharSelection,
HanyuPinyinCaseType caseSelection) {
// 拼音格式化对象
HanyuPinyinOutputFormat outputFormat = new HanyuPinyinOutputFormat();
// 设置中文声调
if (toneSelection != null) {
if (toneTypes[0] == toneSelection) {
outputFormat.setToneType(HanyuPinyinToneType.WITH_TONE_NUMBER);
} else if (toneTypes[1] == toneSelection) {
outputFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
} else if (toneTypes[2] == toneSelection) {
outputFormat.setToneType(HanyuPinyinToneType.WITH_TONE_MARK);
}
}
// 设置特殊拼音的转换
if (vcharSelection != null) {
if (vCharTypes[0] == vcharSelection) {
outputFormat
.setVCharType(HanyuPinyinVCharType.WITH_U_AND_COLON);
} else if (vCharTypes[1] == vcharSelection) {
outputFormat.setVCharType(HanyuPinyinVCharType.WITH_V);
} else if (vCharTypes[2] == vcharSelection) {
outputFormat.setVCharType(HanyuPinyinVCharType.WITH_U_UNICODE);
}
}
// 设置转换的拼音的大小写
if (caseSelection != null) {
if (caseTypes[0] == caseSelection) {
outputFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
} else if (caseTypes[1] == caseSelection) {
outputFormat.setCaseType(HanyuPinyinCaseType.UPPERCASE);
}
}
// 获取字符串
char[] cnStr = chineseCharacter.toCharArray();
for (char chineseChar : cnStr) {
// 将字符转换为拼音数组
String[] pinyinArray = null;
// String test = "";
try {
pinyinArray = PinyinHelper.toHanyuPinyinStringArray(
chineseChar, outputFormat);
} catch (BadHanyuPinyinOutputFormatCombination e1) {
e1.printStackTrace();
}
String outputString = concatPinyinStringArray(pinyinArray);
System.out.println(outputString);
}
}
/**
* 测试中文转换拼音方法
*
* @param args
*/
public static void main(String[] args) {
updateFormattedText("我是中国人", HanyuPinyinToneType.WITH_TONE_NUMBER,
HanyuPinyinVCharType.WITH_V,
HanyuPinyinCaseType.LOWERCASE);
System.out.println("===================");
updateFormattedText("握事种果任", HanyuPinyinToneType.WITH_TONE_NUMBER,
HanyuPinyinVCharType.WITH_U_AND_COLON,
HanyuPinyinCaseType.LOWERCASE);
System.out.println("========================");
updateFormattedText("握事种果任", HanyuPinyinToneType.WITHOUT_TONE,
HanyuPinyinVCharType.WITH_V,
HanyuPinyinCaseType.LOWERCASE);
}
/**
* 将转换的拼音数组转换为字符串
*
* @param pinyinArray
* @return
*/
private static String concatPinyinStringArray(String[] pinyinArray) {
StringBuffer pinyinStrBuf = new StringBuffer();
if ((null != pinyinArray) && (pinyinArray.length > 0)) {
for (int i = 0; i < pinyinArray.length; i++) {
pinyinStrBuf.append(pinyinArray[i]);
pinyinStrBuf.append(System.getProperty("line.separator"));
}
}
String outputString = pinyinStrBuf.toString();
return outputString;
}
}
发表评论
-
Hive引擎对比-MR、Tez、Spark
2023-06-13 18:45 977Hive引擎简介 Hive引 ... -
大数据调度平台对比-Azkaban、DolphinScheduler
2023-05-30 22:42 0大数据调度平台目前多样化,如何选择适合自己公司的调度平台, ... -
Kafka常用命令汇总
2021-11-09 16:14 443在 0.9.0.0 之后的 Kafka,出现了几个新变动,一 ... -
2PC+3PC+BASE理论+CAP原则+ACID
2021-10-26 15:46 3312PC 3PC Two-phase commit ... -
Nginx、HAProxy、LVS三者的对比
2019-08-09 10:27 416LVS的优点: 1、抗负载能力强、工作在第4层仅作分发 ... -
git 常用命令
2016-03-04 00:10 796git: git pull git branch g ... -
solr&&ES API
2016-02-29 11:50 856solr api: private org.apache ... -
Guava(石榴)使用研究-Google开源Collection类库
2013-01-29 18:33 13481)Guava 简介 Guava 中文是石榴的意思,该项 ... -
Joda-Time&Date4j使用研究-开源JAVA日期时间处理类库
2013-01-29 18:27 22381)Joda-Time简介 Joda-Time提供了一组 ... -
Maven常用配置及Tomcat插件配置
2013-01-25 12:54 17281Maven用了一段时间了,基本上被我摆平了。结合Eclip ... -
ftp4j的使用研究-开源FTP客户端Java类库
2013-01-16 18:04 2446ftp4j是一个FTP客户端Java类库,实现了FTP客户 ... -
Spring Data JPA研究-使用Spring Data JPA 简化JPA 开发(ZZ)
2013-01-14 17:38 1512从一个简单的 JPA 示例 ... -
开源Java Web开发框架-Firefly研究
2013-01-09 23:12 2197一、Firefly简介 Firefly是一个高性能的一站式J ... -
G4Studio开源快速开发平台研究
2012-09-04 14:34 1491G4Studio是一套基于JavaEE ... -
MessagePack使用研究
2012-09-03 18:20 3106MessagePack是一个基于二进制高效的对象序列化类库,可 ... -
JAVA实现二维码、条形码生成与破译-开源Zxing使用研究
2012-08-02 17:39 6870二维码编码代码实现类: package zxing; ... -
JAVA实现PDF文件读取、处理研究-开源PDFBox实现
2012-07-26 16:53 6546实现代码如下: import java.io.*; ... -
JAVA实现图片处理缩略图-三种开源实现方式
2012-07-24 16:04 4001代码实现如下: 第一个开源: Thumbnailator ... -
edtFTPj的使用研究-开源JAVA FTP客户端类库
2012-07-06 15:12 2301edtFTPj是一个FTP客户端库,可让任何Java应用程序能 ... -
JAVA对象转成JSON的三种开源实现方式
2012-06-04 00:12 13229第一种方式:Google的Gson Gson 是 Goo ...
相关推荐
总的来说,pinyin4j-2.5.0.jar是一个强大且易用的Java库,它极大地简化了汉字与拼音之间的转换过程,是处理中文字符问题时不可或缺的工具。通过合理利用这个库,开发者可以更高效地实现各种基于拼音的业务逻辑,提升...
pinyin4j是一个专门用于Java平台的开源库,它提供了方便的API,能够帮助开发者快速实现中文到拼音的转换。在处理地址和人名等特定场景下,pinyin4j-2.5.0.jar表现出了极高的实用价值。 pinyin4j-2.5.0.jar是pinyin4...
pinyin4j是一个开源的Java库,专为处理中文汉字到拼音的转换而设计。它支持多种拼音输出格式,包括全拼、简拼以及首字母,这使得它在各种应用场景中都能灵活运用。例如,在进行文本分析时,我们可以利用pinyin4j快速...
总的来说,`pinyin4j-2.5.0`是Java开发者处理中文字符串拼音转换的理想选择。无论是简单的拼音获取,还是复杂的多音字处理,它都能提供强大而便捷的支持。通过理解和掌握这个库,可以极大地提升我们的开发效率,让...
pinyin4j是一款开源的Java库,由Barry De Zwart开发,其主要功能是将汉字转换为汉语拼音。这个库不仅能够提供基本的拼音转换,还能处理多音字、声调等问题,极大地简化了开发者的编码工作。版本2.5.0是该库的一个...
pinyin4j是一个开源的Java库,由Barry de Graaff 创建,主要用于处理汉字的拼音转换。它能够将汉字转换为汉语拼音,支持多音字,并且可以提供不同的拼音输出格式,如全拼、简拼以及声调标注。这个库广泛应用于Java和...
《使用pinyin4j库进行中文到拼音转换的详解》 在处理中文字符时,有时我们需要将汉字转换为对应的拼音,以便进行各种文本处理任务,如搜索引擎优化、文本分析或语音合成。在这种情况下,Java开发者可以利用开源库...
Pinyin4j便是一个专门解决这一问题的强大工具,它是一个开源的Java库,能够方便、高效地将汉字转换为汉语拼音,为开发者提供了极大的便利。 Pinyin4j的核心功能在于其对汉字拼音的处理能力。它能够处理单个汉字、...
在压缩包中,附带的`PinyinUtils.java`是一个使用示例,它展示了如何在实际项目中集成和使用pinyin4j。这个示例文件通常包含了初始化、转换和处理结果的基本步骤,对于初学者来说,是一个很好的学习起点。通过阅读和...
总结起来,pinyin4j是一个强大且实用的Java拼音处理工具,它涵盖了从基本的汉字转拼音到复杂的声调处理等多种功能,适用于各种需要汉字与拼音转换的场景。对于Java开发者来说,掌握并利用好pinyin4j,无疑能提升项目...
pinyin4j是一个专门用于Java平台的中文字符转拼音的开源库,它的版本为2.5.1,是开发者处理中文字符转换为拼音的重要工具。该库由net.sourceforge.pinyin4j包提供,包含了丰富的类和方法,能够帮助开发者方便地获取...
需要注意的是,pinyin4j库不支持繁体字和非标准汉字的拼音转换,因此在处理这类字符时需要额外考虑。 在实际应用中,pinyin4j不仅可以用于拼音转换,还可以用于构建关键词索引、拼音排序、拼音模糊搜索等功能。例如...
通过以上介绍,我们可以看到`pinyin4j`库为Java开发者提供了一个非常方便的方式来处理中文字符与拼音之间的转换,尤其是在需要控制转换后拼音大小写的情况下。无论是用于搜索引擎优化、中文输入法还是语音识别系统,...
pinyin4j是一个Java语言编写的开源库,专用于处理中文汉字的拼音转换,它为开发者提供了便捷的API接口,使得在Java应用中进行汉字与拼音的相互转化变得轻而易举。标题中的“pinyin4j-2.5.0.jar”即为此库的特定版本...
pinyin4j是一个开源的Java库,它提供了汉字和拼音之间的转换功能,包括将汉字字符串转换为全拼、提取每个汉字的首字母,以及将字符串转换成ASCII码等。这个库是基于java平台实现的,用户可以通过导入相关的jar包来...
值得注意的是,pinyin4j不仅支持普通汉字的拼音转换,还能够处理一些特殊字符,如多音字和罕用字。此外,它还可以输出拼音的声母、韵母、声调等部分,为更复杂的应用场景提供了便利。 总的来说,pinyin4j是一个强大...
pinyin4j是一个Java库,专门用于处理汉字与拼音之间的转换,尤其适用于那些需要将中文数据转换为拼音进行进一步处理的场景,如搜索引擎优化、数据分析或者用户输入的合法性检查等。其最新版本为2.5.0,该版本的主jar...
pinyin4j是一个专门用于Java平台的开源库,它能够高效地将汉字转换为对应的汉语拼音,从而极大地简化了这一过程。本文将深入探讨pinyin4j-2.5.0版本的功能、使用方法以及其在实际项目中的应用。 一、pinyin4j概述 ...