`
tianyalinfeng
  • 浏览: 442202 次
  • 性别: Icon_minigender_1
  • 来自: 苏州
社区版块
存档分类
最新评论

中文转拼音

    博客分类:
  • Java
 
阅读更多

import net.sourceforge.pinyin4j.PinyinHelper;

import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;

import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;

import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;

import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;

import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;

 

/**

 * 

 * @author yong.chen 2013-04-07

 * 

 */

public class Pinyin4jUtil {

/**

* 将汉字转换为全拼

* @param src

* @return String

*/

public static String getPinYin(String src) {

char[] t1 = null;

t1 = src.toCharArray();

// System.out.println(t1.length);

String[] t2 = new String[t1.length];

// System.out.println(t2.length);

// 设置汉字拼音输出的格式

HanyuPinyinOutputFormat t3 = new HanyuPinyinOutputFormat();

t3.setCaseType(HanyuPinyinCaseType.LOWERCASE);

t3.setToneType(HanyuPinyinToneType.WITHOUT_TONE);

t3.setVCharType(HanyuPinyinVCharType.WITH_V);

String t4 = "";

int t0 = t1.length;

try {

for (int i = 0; i < t0; i++) {

// 判断能否为汉字字符

// System.out.println(t1[i]);

if (Character.toString(t1[i]).matches("[\\u4E00-\\u9FA5]+")) {

t2 = PinyinHelper.toHanyuPinyinStringArray(t1[i], t3);// 将汉字的几种全拼都存到t2数组中

t4 += t2[0];// 取出该汉字全拼的第一种读音并连接到字符串t4后

} else {

// 如果不是汉字字符,间接取出字符并连接到字符串t4后

t4 += Character.toString(t1[i]);

}

}

} catch (BadHanyuPinyinOutputFormatCombination e) {

e.printStackTrace();

}

return t4;

}

 

/**

* 提取每个汉字的首字母

* @param str

* @return String

*/

public static String getPinYinHeadChar(String str) {

String convert = "";

for (int j = 0; j < str.length(); j++) {

char word = str.charAt(j);

// 提取汉字的首字母

String[] pinyinArray = PinyinHelper.toHanyuPinyinStringArray(word);

if (pinyinArray != null) {

convert += pinyinArray[0].charAt(0);

} else {

convert += word;

}

}

return convert;

}

 

/**

* 将字符串转换成ASCII码

* @param cnStr

* @return String

*/

public static String getCnASCII(String cnStr) {

StringBuffer strBuf = new StringBuffer();

// 将字符串转换成字节序列

byte[] bGBK = cnStr.getBytes();

for (int i = 0; i < bGBK.length; i++) {

// System.out.println(Integer.toHexString(bGBK[i] & 0xff));

// 将每个字符转换成ASCII码

strBuf.append(Integer.toHexString(bGBK[i] & 0xff));

}

return strBuf.toString();

}

 

public static void main(String[] args) {

String cnStr = "苏州";

System.out.println(getPinYin(cnStr));

System.out.println(getPinYinHeadChar(cnStr));

System.out.println(getCnASCII(cnStr));

}

}

 

分享到:
评论

相关推荐

    C++中文汉字转拼音

    本项目名为"C++中文汉字转拼音",旨在利用C++编程实现一个高效、灵活的汉字转拼音功能。 项目的核心在于使用"拼音-中文"的数据字典。这种设计思路是预先建立一个包含所有汉字及其对应拼音的映射关系,通常以文本...

    汉字转拼音_汉字转拼音Excel_

    标题“汉字转拼音_汉字转拼音Excel_”暗示我们将讨论如何使用Excel中的VBA宏来实现这个功能。VBA是一种内置于Microsoft Office套件中的编程语言,允许用户自定义工作簿的行为,包括自动化任务、创建复杂的公式以及...

    中文汉字转拼音 大写(默认) 小写 首字母大写

    在IT领域,中文汉字转拼音是一项常见的处理任务,特别是在自然语言处理、文本分析以及编程中。这个任务的主要目的是将汉字转换成对应的汉语拼音,以便计算机能够更好地理解和处理中文信息。以下将详细介绍汉字转拼音...

    postgreSQL 拼音字库 汉字转拼音 8.4

    网上传的postgreSQL汉字转拼音的方法,是针对9.3的版本(相信你要是8.4的也搜到了但不能直接用,才来看我的),尝试了8.4的版本来做拼音处理。发现网上的《postgreSQL汉字转拼音》里面坑比较多,尝试纠正了一下,发...

    C#汉字转拼音(npinyin)将中文转换成拼音全文或首字母

    例如,如果一个程序需要对中文字符进行排序,或者在没有输入法的情况下通过英文键盘输入中文,汉字转拼音就显得尤为重要。 "C#汉字转拼音(npinyin)"是一个C#库,它提供了一个方便的方式来将汉字转换为对应的汉语...

    Mysql中文汉字转拼音的实现(每个汉字转换全拼)

    在MySQL中实现中文汉字转拼音的功能,主要是为了方便在数据库查询和数据分析时处理中文文本,尤其是在没有全文索引或者需要进行复杂模糊匹配时。以下是一个简单的实现方法,它利用自定义函数来完成这一任务。 首先...

    JavaScript中文转拼音,JS中文转拼音插件,中文转拼音(JavaScript)

    标题提到的“JavaScript中文转拼音”就是一种这样的技术,它允许开发者将中文字符串转化为拼音形式,以便于程序处理。 描述中提到,这个压缩包内包含了一个已经开发和测试完成的JS中文转拼音插件,文件包括"pyClass...

    表格汉字转拼音_汉字转拼音_

    汉字转拼音是将中文字符转化为其对应的普通话读音的过程。在计算机系统中,汉字通常以Unicode编码存储,而拼音则是一种基于拉丁字母的表示方式,便于计算机处理和搜索。这项技术主要依赖于汉字拼音库,这些库包含了...

    delphi12 汉字转拼音全拼及简拼 XE

    汉字转拼音是计算机处理中文文本的重要一环。全拼是指将汉字转换为完整的汉语拼音,而简拼则是用简化的形式表示汉字,通常只包含声母和韵母,不包括声调。在Delphi 12 XE中,我们可以利用内置的TCharServices组件...

    汉字转拼音C++源代码

    汉字转拼音是将中文汉字转化为对应的汉语拼音的过程。在计算机处理中文时,由于计算机内部主要处理ASCII编码,而汉字属于Unicode或GBK等多字节编码,因此需要将汉字转换为拼音以便进行进一步的处理。这个转换过程...

    oracle汉字转拼音package包-支持UTF8

    它们通过调用特定的API或者内置功能来完成汉字转拼音的任务。例如,可能会使用Oracle的UTL_I18N库中的函数,如UTL_I18N.RAW_TO_CHAR,将字节流转换为字符,并利用其对多语言字符集的支持,包括UTF8。 UTF8是一种...

    Java汉字转拼音(支持多音字)

    这个"Java汉字转拼音(支持多音字)"的主题涉及了如何在Java环境中实现这一功能,特别是考虑到中文的多音字特性。 多音字是指一个汉字有多个读音,其读音取决于它在特定语境中的含义。例如,“打”字可以读作“dǎ...

    Qt 汉字转拼音与首字母

    首先,要进行汉字转拼音,我们需要一个拼音库。Qt本身并不直接提供这样的功能,但我们可以引入第三方库,如`pinyin4cpp`,这是一个用C++编写的,用于获取汉字拼音的库。首先,你需要将`pinyin4cpp`库添加到你的项目...

    SQL 汉字转拼音首字母

    ### SQL汉字转拼音首字母知识点解析 #### 一、背景介绍 在数据库处理过程中,有时候我们需要将汉字转换为对应的拼音,特别是在中文环境下的数据检索、排序等操作中,这种需求尤为常见。本篇文章将深入探讨如何利用...

    java汉字转拼音,android汉字转拼音,汉字转拼音首字母,汉字转ASCII

    以上就是关于“java汉字转拼音,android汉字转拼音,汉字转拼音首字母,汉字转ASCII”的技术要点。在实际应用中,根据需求选择合适的转换方式,并注意处理可能出现的异常情况,如多音字、非ASCII字符等。在处理大量...

    关于汉字转拼音的实现方法.rar(简单方便实用)

    汉字转拼音是计算机处理中文文本时常见的需求,尤其在语音合成、搜索引擎索引、自动文本标注等领域有着广泛应用。本资源提供了实现这一功能的必要组件和详细步骤,旨在帮助开发者快速理解并实施汉字转拼音功能。 ...

    汉字转拼音声母首字母 dll

    在标签中,“汉字转拼音”是关键功能,它是许多中文处理应用的基础,比如搜索引擎、输入法、语音识别等。而“dll”标签强调了这是一个动态链接库,可以被其他程序调用执行特定任务。“delphi”则表明了开发环境。 ...

    PHP高效汉字转拼音类

    // 简单的高效的汉字转拼音、拼音转汉字类 // 包含20441个汉字26821拼音转换库文件,字库基本是网上最全的了,当然万一发现少了可以自己加入到字库中,一行一条记录加入到文本文件中即可,非常简单 // 算法方面没有...

    postgresql汉字转拼音函数

    支持2万+汉字转拼音

    java汉字转拼音(全拼和首字母)

    在Java编程语言中,汉字转拼音是一项常见的需求,特别是在处理中文数据、搜索引擎优化或文本处理等领域。本篇文章将深入探讨如何使用Java实现汉字转拼音的功能,包括获取汉字的全拼和首字母。 首先,我们需要理解...

Global site tag (gtag.js) - Google Analytics