`
zxl_ong
  • 浏览: 128724 次
  • 性别: Icon_minigender_1
  • 来自: 南京
社区版块
存档分类
最新评论

汉字转化为拼音pinyin4j

阅读更多
      汉字转成拼音如果自己实现起来有点麻烦,主要是怕有些汉字转不了,所以就准备使用一个开源的工具Pinyin4j.
      pinyin4j是一个支持将中文转换到拼音的Java开源类库,pinyin4j能够根据中文字符获取其对应的拼音,而且拼音的格式可以定制。pinyin4j的主页:http://pinyin4j.sourceforge.net/
      1. 支持简体中文和繁体中文字符;
      2. 支持转换到汉语拼音,通用拼音, 威妥玛拼音(威玛拼法), 注音符号第二式, 耶鲁拼法和国语罗马字;
      3. 支持多音字,即可以获取一个中文字符的多种发音;
      4. 支持多种字符串输出格式,比如支持Unicode格式的字符ü和声调符号(阴平 "ˉ",阳平"ˊ",上声"ˇ",去声"ˋ")的输出。
package com.javaeye.my;

import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;  
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;  
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;  
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;  
  
/** 
 * @className:PinyingUtil.java 
 * @classDescription:拼音操作工具类 
 * @author:xiayingjie 
 * @createTime:2010-10-21 
 */  
  
public class PinyinUtil {  
  
    /** 
     * 将字符串转换成拼音数组 
     *  
     * @param src 
     * @return 
     */  
    public static String[] stringToPinyin(String src) {  
        return stringToPinyin(src, false, null);  
    }  
    /** 
     * 将字符串转换成拼音数组 
     *  
     * @param src 
     * @return 
     */  
    public static String[] stringToPinyin(String src,String separator) {  
        return stringToPinyin(src, true, separator);  
    }  
  
    /** 
     * 将字符串转换成拼音数组 
     *  
     * @param src 
     * @param isPolyphone 
     *            是否查出多音字的所有拼音 
     * @param separator 
     *            多音字拼音之间的分隔符 
     * @return 
     */  
    public static String[] stringToPinyin(String src, boolean isPolyphone,  
            String separator) {  
        // 判断字符串是否为空  
        if ("".equals(src) || null == src) {  
            return null;  
        }  
        char[] srcChar = src.toCharArray();  
        int srcCount = srcChar.length;  
        String[] srcStr = new String[srcCount];  
  
        for (int i = 0; i < srcCount; i++) {  
            srcStr[i] = charToPinyin(srcChar[i], isPolyphone, separator);  
        }  
        return srcStr;  
    }  
  
    /** 
     * 将单个字符转换成拼音 
     *  
     * @param src 
     * @return 
     */  
    public static String charToPinyin(char src, boolean isPolyphone,  
            String separator) {  
        // 创建汉语拼音处理类  
        HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();  
        // 输出设置,大小写,音标方式  
        defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);  
        defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);  
  
        StringBuffer tempPinying = new StringBuffer();  
          
  
        // 如果是中文  
        if (src > 128) {  
            try {  
                // 转换得出结果  
                String[] strs = PinyinHelper.toHanyuPinyinStringArray(src,  
                        defaultFormat);  
                  
                          
                // 是否查出多音字,默认是查出多音字的第一个字符  
                if (isPolyphone && null != separator) {  
                    for (int i = 0; i < strs.length; i++) {  
                        tempPinying.append(strs[i]);  
                        if (strs.length != (i + 1)) {  
                            // 多音字之间用特殊符号间隔起来  
                            tempPinying.append(separator);  
                        }  
                    }  
                } else {  
                    tempPinying.append(strs[0]);  
                }  
  
            } catch (BadHanyuPinyinOutputFormatCombination e) {  
                e.printStackTrace();  
            }  
        } else {  
            tempPinying.append(src);  
        }  
  
        return tempPinying.toString();  
  
    }  
  
      
    public static String hanziToPinyin(String hanzi){  
        return hanziToPinyin(hanzi," ");  
    }  
    /** 
     * 将汉字转换成拼音 
     * @param hanzi 
     * @param separator 
     * @return 
     */  
    public static String hanziToPinyin(String hanzi,String separator){  
            // 创建汉语拼音处理类  
            HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();  
            // 输出设置,大小写,音标方式  
            defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);  
            defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);  
              
            String pinyingStr="";  
            try {  
                pinyingStr=PinyinHelper.toHanyuPinyinString(hanzi, defaultFormat, separator);  
            } catch (BadHanyuPinyinOutputFormatCombination e) {  
                // TODO Auto-generated catch block  
                e.printStackTrace();  
            }     
            return pinyingStr;  
    }  
    
    /** 
     * 将字符串数组转换成字符串 
     * @param str  
     * @param separator 各个字符串之间的分隔符 
     * @return 
     */  
    public static String stringArrayToString(String[] str, String separator) {  
        StringBuffer sb = new StringBuffer();  
        for (int i = 0; i < str.length; i++) {  
            sb.append(str[i]);  
            if (str.length != (i + 1)) {  
                sb.append(separator);  
            }  
        }  
        return sb.toString();  
    }  
    /** 
     * 简单的将各个字符数组之间连接起来 
     * @param str 
     * @return 
     */  
    public  static String stringArrayToString(String[] str){  
        return stringArrayToString(str,"");  
    }  
    /** 
     * 将字符数组转换成字符串 
     * @param str  
     * @param separator 各个字符串之间的分隔符 
     * @return 
     */  
    public static String charArrayToString(char[] ch, String separator) {  
        StringBuffer sb = new StringBuffer();  
        for (int i = 0; i < ch.length; i++) {  
            sb.append(ch[i]);  
            if (ch.length != (i + 1)) {  
                sb.append(separator);  
            }  
        }  
        return sb.toString();  
    }  
      
    /** 
     * 将字符数组转换成字符串 
     * @param str  
     * @return 
     */  
    public static String charArrayToString(char[] ch) {  
        return charArrayToString(ch," ");  
    }  
  
    /** 
     * 取汉字的首字母 
     * @param src 
     * @param isCapital 是否是大写 
     * @return 
     */  
    public static char[]  getHeadByChar(char src,boolean isCapital){  
        //如果不是汉字直接返回  
        if (src <= 128) {  
            return new char[]{src};  
        }  
        //获取所有的拼音  
        String []pinyingStr=PinyinHelper.toHanyuPinyinStringArray(src);  
        //创建返回对象  
        int polyphoneSize=pinyingStr.length;  
        char [] headChars=new char[polyphoneSize];  
        int i=0;  
        //截取首字符  
        for(String s:pinyingStr){  
            char headChar=s.charAt(0);  
            //首字母是否大写,默认是小写  
            if(isCapital){  
                headChars[i]=Character.toUpperCase(headChar);  
             }else{  
                headChars[i]=headChar;  
             }  
            i++;  
        }  
          
        return headChars;  
    }  
    /** 
     * 取汉字的首字母(默认是大写) 
     * @param src 
     * @return 
     */  
    public static char[]  getHeadByChar(char src){  
        return getHeadByChar(src,true);  
    }  
    /** 
     * 查找字符串首字母 
     * @param src  
     * @return 
     */  
    public  static String[] getHeadByString(String src){  
        return getHeadByString( src, true);  
    }  
    /** 
     * 查找字符串首字母 
     * @param src  
     * @param isCapital 是否大写 
     * @return 
     */  
    public  static String[] getHeadByString(String src,boolean isCapital){  
        return getHeadByString( src, isCapital,null);  
    }  
    /** 
     * 查找字符串首字母 
     * @param src  
     * @param isCapital 是否大写 
     * @param separator 分隔符 
     * @return 
     */  
    public  static String[] getHeadByString(String src,boolean isCapital,String separator){  
        char[]chars=src.toCharArray();  
        String[] headString=new String[chars.length];  
        int i=0;  
        for(char ch:chars){  
              
            char[]chs=getHeadByChar(ch,isCapital);  
            StringBuffer sb=new StringBuffer();  
            if(null!=separator){  
                int j=1;  
                  
                for(char ch1:chs){  
                    sb.append(ch1);  
                    if(j!=chs.length){  
                        sb.append(separator);  
                    }  
                    j++;  
                }  
            }else{  
                sb.append(chs[0]);  
            }  
            headString[i]=sb.toString();  
            i++;  
        }  
        return headString;  
    }  
      
    public static void main(String[] args) {  
        System.out.println(stringArrayToString(getHeadByString("我se 心")));  
    }  
  
} 


中文排序资料http://www.blogjava.net/jeff-lau/archive/2007/12/21/169257.html

本文转自http://www.iteye.com/topic/790889
分享到:
评论

相关推荐

    汉字转化为拼音

    提供将汉字转化为拼音的方法,将保留汉字之外的字符,提供全拼和首字母的两种方法。

    汉字句子转化为拼音句子或转化为拼音缩写

    汉字句子转化为拼音句子或转化为拼音缩写, /// /// 汉字句子转化为拼音句子。 /// /// 汉字句子。 /// 拼音句子。 /// /// 汉字句子转化为拼音缩写。 /// /// 汉字句子。 /// 拼音缩写。...

    汉字转化为拼音的jar包

    汉字转化为拼音的jar包,包含源码及Demo样例,轻松实现汉字转化为汉语拼音。

    java将汉字转化为拼音大小写

    java将汉字转化为拼音大小写(提取首字母,将汉字转化为拼音首字母大小写的相关算法)

    将中文的汉字转化为拼音取大写首字母

    标题和描述中的知识点主要涉及了将中文汉字转化为其对应的拼音,并从中提取出大写首字母的过程。这个过程在中文信息处理、数据标准化以及各种需要进行文本转换的应用场景中非常常见。下面,我们将深入探讨这一技术...

    C# 拼音转化汉字 汉字转化拼音

    首先,汉字转化为拼音是基于汉语拼音系统,它将每个汉字映射到对应的拼音。在C#中,可以使用.NET框架提供的`System.Speech`命名空间中的`SpeechSynthesizer`类来实现。这个类虽然主要设计用于语音合成,但它有一个`...

    中文转化为拼音程序

    在IT领域,中文转化为拼音是常见的自然语言处理任务之一,特别是在文本处理、语音合成和搜索引擎优化等场景。本文将深入探讨使用C# 2005实现这一功能的知识点。 首先,C#是一种由微软开发的面向对象的编程语言,它...

    汉字转化成拼音首字母代码delphi xe

    在Delphi编程环境中,开发汉字转化为拼音首字母的程序是一项常见的需求,这主要涉及到文本处理和中文字符编码的理解。在给定的标题“汉字转化成拼音首字母代码Delphi XE”中,我们可以推断这是一个关于如何在Delphi ...

    pinyin4j-2.5.0.jar 中文转化拼音,获取首字母

    本文将深入探讨pinyin4j-2.5.0.jar这个Java库,了解其功能和使用方法,以及如何通过它来实现中文转化为拼音并获取首字母。 pinyin4j是一个开源的Java库,专为处理中文汉字到拼音的转换而设计。它支持多种拼音输出...

    actionscript汉字转化为拼音

    在标题“actionscript汉字转化为拼音”和描述“ActionScript 3 汉字转化为拼音”中,我们关注的是如何在AS3中实现将汉字转换为对应的拼音。 在处理汉字转拼音的过程中,主要涉及以下知识点: 1. **Unicode编码**:...

    汉字转化为拼音程序代码实现

    非常好的程序实现 可以将任意的汉字转化为汉语拼音可以将任意的汉字转化为汉语拼音可以将任意的汉字转化为汉语拼音可以将任意的汉字转化为汉语拼音可以将任意的汉字转化为汉语拼音可以将任意的汉字转化为汉语拼音...

    中文转化为拼音的实现.html

    JS实现中文转化为拼音,输入汉字点击转化就可以获取到对应的拼音!欢迎下载下载直接运行就可以了!JS实现中文转化为拼音,输入汉字点击转化就可以获取到对应的拼音!欢迎下载下载直接运行就可以了!JS实现中文转化为拼音,...

    C#汉字转拼音(npinyin)将中文转换成拼音全文或首字母

    例如,如果一个程序需要对中文字符进行排序,或者在没有输入法的情况下通过英文键盘输入中文,汉字转拼音就显得尤为重要。 "C#汉字转拼音(npinyin)"是一个C#库,它提供了一个方便的方式来将汉字转换为对应的汉语...

    sql server汉字转化为拼音首字母函数

    输入汉字字符参数,返回汉字拼音的首字母!

    中文转化为拼音

    中文转化为拼音,通常涉及到汉字与汉语拼音的对应,这可以帮助计算机理解和处理中文文本,尤其是在语音识别、搜索引擎优化(SEO)、以及为没有汉字输入法的设备提供输入支持时。 汉语拼音是中华人民共和国官方推行...

    汉字转化成拼音的程序

    汉字转化为拼音是计算机处理中文文本时的一个重要环节,特别是在语音合成、搜索引擎优化、自然语言处理等领域有着广泛应用。本文将深入探讨这一技术,并基于提供的压缩包文件"DXHanZiToPinYin"来讲解实现汉字转拼音...

Global site tag (gtag.js) - Google Analytics