`
sunlifei
  • 浏览: 3118 次
  • 性别: Icon_minigender_2
  • 来自: 天津
社区版块
存档分类
最新评论

将中文汉字转化成相应拼音

阅读更多
/**
* CnToSpell.java
* @author sunlifei
* 时间:2011-8-16 15:42:53
*/
package com.bhne.web.util;

import java.util.Iterator;
import java.util.LinkedHashMap;
import java.util.Set;

/**
* 功能:将汉字转化为拼音
* @author sunlifei
* 时间: 2011-8-16 15:42:53
*/

public class CnToSpell {
private static LinkedHashMap spellMap = null;
static{
  if(spellMap == null){
  spellMap = new LinkedHashMap(400);
  }
  initialize();
  }

@SuppressWarnings("unchecked")
private static void spellPut(String spell,int ascii){
spellMap.put(spell,new Integer(ascii));
}
private static void initialize(){
    spellPut("a", -20317);
    spellPut("ai", -20304);
    spellPut("an", -20295);
spellPut("ang", -20292);
spellPut("ao", -20283);

spellPut("ba", -20265);
spellPut("bai", -20257);
spellPut("ban", -20242);
    spellPut("bang", -20230);
    spellPut("bao", -20051);
    spellPut("bei", -20036);
spellPut("ben", -20032);
spellPut("beng", -20026);
spellPut("bi", -20002);
    spellPut("bian", -19990);
spellPut("biao", -19986);
spellPut("bie", -19982);
spellPut("bin", -19976);
    spellPut("bing", -19805);
    spellPut("bo", -19784);
    spellPut("bu", -19775);
   
    spellPut("ca", -19774);
    spellPut("cai", -19763);
    spellPut("can", -19756);
spellPut("cang", -19751);
spellPut("cao", -19746);
spellPut("ce", -19741);
spellPut("ceng", -19739);
spellPut("cha", -19728);
spellPut("chai", -19725);
    spellPut("chan", -19715);
    spellPut("chang", -19540);
    spellPut("chao", -19531);
    spellPut("che", -19525);
    spellPut("chen", -19515);
    spellPut("cheng", -19500);
spellPut("chi", -19484);
spellPut("chong", -19479);
spellPut("chou", -19467);
    spellPut("chu", -19289);
spellPut("chuai", -19288);
spellPut("chuan", -19281);
spellPut("chuang", -19275);
spellPut("chui", -19270);
spellPut("chun", -19263);
spellPut("chuo", -19261);
spellPut("ci", -19249);
spellPut("cong", -19243);
spellPut("cou", -19242);
spellPut("cu", -19238);
spellPut("cuan", -19235);
spellPut("cui", -19227);
spellPut("cun", -19224);
spellPut("cuo", -19218);

spellPut("da", -19212);
spellPut("dai", -19038);
spellPut("dan", -19023);
spellPut("dang", -19018);
spellPut("dao", -19006);
spellPut("de", -19003);
spellPut("deng", -18996);
spellPut("di", -18977);
spellPut("dian", -18961);
spellPut("diao", -18952);
spellPut("die", -18783);
spellPut("ding", -18774);
spellPut("diu", -18773);
spellPut("dong", -18763);
spellPut("dou", -18756);
spellPut("du", -18741);
spellPut("duan", -18735);
spellPut("dui", -18731);
    spellPut("dun", -18722);
    spellPut("duo", -18710);
   
    spellPut("e", -18697);
    spellPut("en", -18696);
    spellPut("er", -18526);
    spellPut("fa", -18518);
    spellPut("fan", -18501);
    spellPut("fang", -18490);
    spellPut("fei", -18478);
    spellPut("fen", -18463);
    spellPut("feng", -18448);    
    spellPut("fo", -18447);
    spellPut("fou", -18446);    
    spellPut("fu", -18239);
   
spellPut("ga", -18237);
spellPut("gai", -18231);
    spellPut("gan", -18220);
    spellPut("gang", -18211);
spellPut("gao", -18201);
spellPut("ge", -18184);
spellPut("gei", -18183);
    spellPut("gen", -18181);
    spellPut("geng", -18012);
    spellPut("gong", -17997);
    spellPut("gou", -17988);
spellPut("gu", -17970);
spellPut("gua", -17964);
spellPut("guai", -17961);
spellPut("guan", -17950);
spellPut("guang", -17947);
spellPut("gui", -17931);
spellPut("gun", -17928);
spellPut("guo", -17922);

spellPut("ha", -17759);
spellPut("hai", -17752);
spellPut("han", -17733);
spellPut("hang", -17730);
    spellPut("hao", -17721);
    spellPut("he", -17703);
    spellPut("hei", -17701);
    spellPut("hen", -17697);
    spellPut("heng", -17692);
    spellPut("hong", -17683);
    spellPut("hou", -17676);
    spellPut("hu", -17496);
    spellPut("hua", -17487);
    spellPut("huai", -17482);
    spellPut("huan", -17468);
    spellPut("huang", -17454);
    spellPut("hui", -17433);
    spellPut("hun", -17427);
    spellPut("huo", -17417);
   
    spellPut("ji", -17202);
    spellPut("jia", -17185);
    spellPut("jian", -16983);
spellPut("jiang", -16970);
spellPut("jiao", -16942);
    spellPut("jie", -16915);
    spellPut("jin", -16733);
    spellPut("jing", -16708);
    spellPut("jiong", -16706);
spellPut("jiu", -16689);
    spellPut("ju", -16664);
    spellPut("juan", -16657);
    spellPut("jue", -16647);
    spellPut("jun", -16474);
   
    spellPut("ka", -16470);
    spellPut("kai", -16465);
spellPut("kan", -16459);
spellPut("kang", -16452);
    spellPut("kao", -16448);
    spellPut("ke", -16433);
    spellPut("ken", -16429);
    spellPut("keng", -16427);
    spellPut("kong", -16423);
    spellPut("kou", -16419);
    spellPut("ku", -16412);
    spellPut("kua", -16407);
    spellPut("kuai", -16403);
    spellPut("kuan", -16401);
    spellPut("kuang", -16393);
    spellPut("kui", -16220);
    spellPut("kun", -16216);
    spellPut("kuo", -16212);
   
    spellPut("la", -16205);
    spellPut("lai", -16202);
spellPut("lan", -16187);
spellPut("lang", -16180);
spellPut("lao", -16171);
spellPut("le", -16169);
spellPut("lei", -16158);
spellPut("leng", -16155);
spellPut("li", -15959);
spellPut("lia", -15958);
spellPut("lian", -15944);
spellPut("liang", -15933);
spellPut("liao", -15920);
spellPut("lie", -15915);
spellPut("lin", -15903);
spellPut("ling", -15889);
spellPut("liu", -15878);
spellPut("long", -15707);
spellPut("lou", -15701);
spellPut("lu", -15681);
spellPut("lv", -15667);
spellPut("luan", -15661);
spellPut("lue", -15659);
    spellPut("lun", -15652);
    spellPut("luo", -15640);
   
    spellPut("ma", -15631);
    spellPut("mai", -15625);
    spellPut("man", -15454);
    spellPut("mang", -15448);
    spellPut("mao", -15436);
    spellPut("me", -15435);
    spellPut("mei", -15419);
    spellPut("men", -15416);
    spellPut("meng", -15408);
    spellPut("mi", -15394);
    spellPut("mian", -15385);
    spellPut("miao", -15377);
spellPut("mie", -15375);
spellPut("min", -15369);
spellPut("ming", -15363);
spellPut("miu", -15362);
spellPut("mo", -15183);
spellPut("mou", -15180);
spellPut("mu", -15165);

spellPut("na", -15158);
spellPut("nai", -15153);
spellPut("nan", -15150);
spellPut("nang", -15149);
spellPut("nao", -15144);
spellPut("ne", -15143);
spellPut("nei", -15141);
spellPut("nen", -15140);
spellPut("neng", -15139);
spellPut("ni", -15128);
spellPut("nian", -15121);
    spellPut("niang", -15119);
    spellPut("niao", -15117);
    spellPut("nie", -15110);
    spellPut("nin", -15109);
    spellPut("ning", -14941);
    spellPut("niu", -14937);
    spellPut("nong", -14933);
    spellPut("nu", -14930);
    spellPut("nv", -14929);
    spellPut("nuan", -14928);
    spellPut("nue", -14926);
    spellPut("nuo", -14922);
   
    spellPut("o", -14921);
    spellPut("ou", -14914);
   
    spellPut("pa", -14908);
    spellPut("pai", -14902);
    spellPut("pan", -14894);
    spellPut("pang", -14889);
spellPut("pao", -14882);
    spellPut("pei", -14873);
    spellPut("pen", -14871);
    spellPut("peng", -14857);
    spellPut("pi", -14678);
    spellPut("pian", -14674);
    spellPut("piao", -14670);
    spellPut("pie", -14668);
    spellPut("pin", -14663);
    spellPut("ping", -14654);
    spellPut("po", -14645);
spellPut("pu", -14630);

    spellPut("qi", -14594);
    spellPut("qia", -14429);
    spellPut("qian", -14407);
    spellPut("qiang", -14399);
    spellPut("qiao", -14384);
    spellPut("qie", -14379);
    spellPut("qin", -14368);
    spellPut("qing", -14355);
    spellPut("qiong", -14353);
    spellPut("qiu", -14345);
    spellPut("qu", -14170);
    spellPut("quan", -14159);
    spellPut("que", -14151);
    spellPut("qun", -14149);
   
    spellPut("ran", -14145);
    spellPut("rang", -14140);
    spellPut("rao", -14137);
    spellPut("re", -14135);
spellPut("ren", -14125);
spellPut("reng", -14123);
spellPut("ri", -14122);
spellPut("rong", -14112);
spellPut("rou", -14109);
spellPut("ru", -14099);
spellPut("ruan", -14097);
    spellPut("rui", -14094);
spellPut("run", -14092);
spellPut("ruo", -14090);

spellPut("sa", -14087);
spellPut("sai", -14083);
spellPut("san", -13917);
spellPut("sang", -13914);
spellPut("sao", -13910);
spellPut("se", -13907);
spellPut("sen", -13906);
spellPut("seng", -13905);
spellPut("sha", -13896);
spellPut("shai", -13894);
spellPut("shan", -13878);
spellPut("shang", -13870);
spellPut("shao", -13859);
spellPut("she", -13847);
spellPut("shen", -13831);
spellPut("sheng", -13658);
spellPut("shi", -13611);
spellPut("shou", -13601);
spellPut("shu", -13406);
    spellPut("shua", -13404);
    spellPut("shuai", -13400);
    spellPut("shuan", -13398);
    spellPut("shuang", -13395);
    spellPut("shui", -13391);
    spellPut("shun", -13387);
    spellPut("shuo", -13383);
    spellPut("si", -13367);
    spellPut("song", -13359);
    spellPut("sou", -13356);
    spellPut("su", -13343);
    spellPut("suan", -13340);
    spellPut("sui", -13329);
    spellPut("sun", -13326);
    spellPut("suo", -13318);
   
    spellPut("ta", -13147);
    spellPut("tai", -13138);
    spellPut("tan", -13120);
    spellPut("tang", -13107);
spellPut("tao", -13096);
spellPut("te", -13095);
spellPut("teng", -13091);
spellPut("ti", -13076);
spellPut("tian", -13068);
spellPut("tiao", -13063);
spellPut("tie", -13060);
spellPut("ting", -12888);
spellPut("tong", -12875);
spellPut("tou", -12871);
spellPut("tu", -12860);
spellPut("tuan", -128590);
spellPut("tui", -12852);
spellPut("tun", -12849);
spellPut("tuo", -12838);

spellPut("wa", -12831);
spellPut("wai", -12829);
spellPut("wan", -12812);
spellPut("wang", -12802);
spellPut("wei", -12607);
spellPut("wen", -12597);
spellPut("weng", -12594);
spellPut("wo", -12585);
spellPut("wu", -12556);

spellPut("xi", -12359);
spellPut("xia", -12346);
spellPut("xian", -12320);
spellPut("xiang", -12300);
spellPut("xiao", -12120);
spellPut("xie", -12099);
spellPut("xin", -12089);
spellPut("xing", -12074);
spellPut("xiong", -12067);
spellPut("xiu", -12058);
spellPut("xu", -12039);
spellPut("xuan", -11867);
spellPut("xue", -11861);
spellPut("xun", -11847);

spellPut("ya", -11831);
spellPut("yan", -11798);
spellPut("yang", -11781);
spellPut("yao", -11604);
spellPut("ye", -11589);
spellPut("yi", -11536);
spellPut("yin", -11358);
spellPut("ying", -11340);
spellPut("yo", -11339);
spellPut("yong", -11324);
spellPut("you", -11303);
spellPut("yu", -11097);
spellPut("yuan", -11077);
spellPut("yue", -11067);
spellPut("yun", -11055);

spellPut("za", -11052);
spellPut("zai", -11045);
spellPut("zan", -11041);
spellPut("zang", -11038);
spellPut("zao", -11024);
spellPut("ze", -11020);
spellPut("zei", -11019);
spellPut("zen", -11018);
spellPut("zeng", -11014);
spellPut("zha", -110838);
spellPut("zhai", -10832);
spellPut("zhan", -10815);
spellPut("zhang", -10800);
spellPut("zhao", -10790);
spellPut("zhe", -10780);
spellPut("zhen", -10764);
spellPut("zheng", -10587);
spellPut("zhi", -10544);
spellPut("zhong", -10533);
spellPut("zhou", -10519);
    spellPut("zhu", -10331);
    spellPut("zhua", -10329);
    spellPut("zhuai", -10328);
    spellPut("zhuan", -10322);
spellPut("zhuang", -10315);
spellPut("zhui", -10309);
spellPut("zhun", -10307);
spellPut("zhuo", -10296);
spellPut("zi", -10281);
spellPut("zong", -10274);
spellPut("zou", -10270);
spellPut("zu", -10262);
spellPut("zuan", -10260);
spellPut("zui", -10256);
spellPut("zun", -10254);
spellPut("zuo", -10248);
  }


public static int getCnAscii(char cn){
byte[] bytes = (String.valueOf(cn)).getBytes();
if(bytes == null || bytes.length > 2 || bytes.length <= 0){ //错误
return 0;
}
    if(bytes.length == 1){ //英文字符 s(g`&@`4mu0h
      return bytes[0];
    }
   
    if(bytes.length == 2){ //中文字符
    int hightByte = 256 + bytes[0];
    int lowByte = 256 + bytes[1];

    int ascii = (256 * hightByte + lowByte) - 256 * 256;
    return ascii;
    }
    return 0; //错误
}


public static String getSpellByAscii(int ascii){
if(ascii > 0 && ascii < 160){ //单字符
return String.valueOf((char)ascii);
}
    if(ascii < -20319 || ascii > -10247){ //不知道的字符,lY!{ m c3xK/R0o%F
    return null;
    }
    Set keySet = spellMap.keySet();
    Iterator it = keySet.iterator();
    String spell0 = null;
    String spell = null;
    int asciiRang0 = -20319;
    int asciiRang = 0;
    while(it.hasNext()){
    spell = (String)it.next();
    Object valObj = spellMap.get(spell);
    if(valObj instanceof Integer){
    asciiRang = ((Integer)valObj).intValue();
    if(ascii >= asciiRang0 && ascii < asciiRang){ //区间找到'r ES c!l"M0PN%X-q)G!z
    return(spell0 == null) ? spell : spell0;
    }
    }else{
          spell0 = spell;
          asciiRang0 = asciiRang;
       }
    }
    return null;
}

public static String getFullSpell(String cnStr){
if(null == cnStr || "".equals(cnStr.trim())){
return cnStr;
}
char[] chars = cnStr.toCharArray();
StringBuffer retuBuf = new StringBuffer();
    for(int i = 0,Len = chars.length;i < Len;i++){
    int ascii = getCnAscii(chars[i]);
    if(ascii == 0){ //取ascii时出错
    retuBuf.append(chars[i]);
    }else{
    String spell = getSpellByAscii(ascii);
    if(spell == null){
    retuBuf.append(chars[i]);
    }else{
    retuBuf.append(spell);
    } // end of if spell == null
    } // end of if ascii <= -20400
    } // end of forzzWlw8J
    return retuBuf.toString();
}
       public static void main(String[] args) {
String str = "做 个 好 孩 子";
System.out.println(CnToSpell.getFullSpell(str));
}

}

分享到:
评论

相关推荐

    将中文的汉字转化为拼音取大写首字母

    标题和描述中的知识点主要涉及了将中文汉字转化为其对应的拼音,并从中提取出大写首字母的过程。这个过程在中文信息处理、数据标准化以及各种需要进行文本转换的应用场景中非常常见。下面,我们将深入探讨这一技术...

    Mysql中文汉字转拼音的实现(每个汉字转换全拼)

    总之,通过创建拼音对照表和自定义函数,可以在MySQL中实现中文汉字到拼音的转换,但这种方法简单且适用于小规模的场景。对于大规模或复杂的汉字转拼音需求,可能需要结合其他工具和技术来实现。

    C语言实现把汉字转换为拼音

    当需要将汉字转换为拼音时,可以通过查询字典来获取相应的拼音。 实现这个功能的关键步骤包括: 1. **数据准备**:创建一个包含所有汉字及其对应拼音的数据结构。这可能涉及到大量的前期工作,如从公开的汉字拼音...

    sql方法用于汉字转换拼音

    该函数`[dbo].[fun_getPY]`定义在数据库`BabyGreenCircle`中,其主要功能是将输入的中文字符串转换成相应的拼音。函数接受一个nvarchar类型的参数`@str`,并返回一个nvarchar类型的值表示转换后的拼音结果。 #### ...

    中文转换成拼音简称和全称

    在IT领域,中文转换成拼音简称和全称是一项常见的任务,尤其在文本处理、搜索引擎优化(SEO)以及自然语言处理(NLP)等场景中。这个压缩包文件"ChinaToPY"显然包含了一个用于实现这一功能的代码库,可能是用Python...

    中文汉字转化成拼音js代码.zip

    本资源"中文汉字转化成拼音js代码.zip"提供了一种用JavaScript实现的功能,即把中文汉字转换为拼音,这对于一些需要处理汉字与拼音交互的应用非常有用,比如搜索引擎优化(SEO)、语音合成或者输入辅助工具等。...

    pinyin支持汉字转换拼音,汉字转换拼音缩写

    标题"pinyin支持汉字转换拼音,汉字转换拼音缩写"表明这是一个关于汉字到拼音转换的工具或库,同时它还具备将汉字转换为拼音缩写的功能。 汉字转换拼音的原理通常基于汉语拼音方案,这是中国国家标准,规定了每个...

    将汉字转换成拼音C#实现

    ### 将汉字转换成拼音的C#实现方法 在计算机编程领域中,有时我们需要将汉字转换为对应的拼音,这样的功能可以广泛应用于语音识别、输入法软件、文本处理等多个场景。本篇文章将详细介绍如何使用C#语言来实现这一...

    oracle批量修改汉字转拼音首字母的函数

    汉字转拼音是将汉字转换为对应的汉语拼音的过程,而获取首字母则是提取每个汉字拼音的第一个字母,通常是大写。在Oracle中,我们可以使用内置的UTL_I18N包或者自定义PL/SQL函数来实现这一转换。 UTL_I18N包中的`UTL...

    汉字转拼音及获取首字母

    因此,将汉字转换为对应的拼音是处理中文数据的关键步骤。在iOS开发中,可以使用`CFStringTransform`函数结合`kCFStringTransformToUnicodeName`常量来实现这个功能。这个函数可以将汉字转换为它的Unicode名称,其中...

    java汉字转拼音(全拼和首字母)

    在Java编程语言中,汉字转拼音是一项常见的需求,特别是在处理中文数据、搜索引擎优化或文本处理等领域。本篇文章将深入探讨如何使用Java实现汉字转拼音的功能,包括获取汉字的全拼和首字母。 首先,我们需要理解...

    java 汉字转换拼音

    - 用户可以在文本框中输入汉字,点击按钮后,汉字将被转换成拼音并显示在另一个文本框中。 3. **事件监听器**: - `Cn2PinyinActionListener` 类实现了 `ActionListener` 接口,当用户点击按钮时,触发拼音转换...

    汉字转化成拼音的软件源码

    为了支持多个汉字同时转换,可以考虑将输入字符串分解成单个字符,并逐一进行转换。 2. **音调处理**:现实中的拼音通常还包含声调标记,但这段代码并未涉及声调。可以通过添加额外的逻辑来支持声调。 3. **错误处理...

    汉字拼音转换程序

    汉字拼音转换程序是一种工具,主要用于将汉字转换为其对应的汉语拼音,这对于学习中文的初学者尤其有用。这个程序可能包含了各种功能,比如单个汉字的拼音显示、词语的拼音组合、多音字处理以及声调标注等。下面我们...

    汉字转换成拼音jar包

    在IT领域,有时候我们需要将汉字转换为拼音,以便进行各种处理,比如搜索引擎的关键词匹配、文本分析或自动化脚本中的字符串处理。这个“汉字转换成拼音jar包”提供了一个便捷的解决方案,它允许开发者在Java应用...

    .net汉字转换拼音

    根据提供的文件信息,我们可以分析出该段代码是用于实现将汉字转换为汉语拼音的功能。下面将详细介绍相关的知识点。 ### .NET 汉字转换拼音 #### 标题和描述中的知识点解析 标题与描述均为“**.net汉字转换拼音**...

    ry实现汉字转换成拼音代码.rar_fortyhhy_molecularc1b_ry实现汉字转换成拼音代码

    "ry实现汉字转换成拼音代码"是针对这一需求开发的一个插件,它能够将汉字转换为对应的拼音表示,方便计算机进一步处理。下面我们将深入探讨这个主题。 首先,汉字转换成拼音的基础是汉字与拼音的映射关系。每个汉字...

    汉字转换成拼音

    标题中的“汉字转换成拼音”指的是在计算机编程中将汉字转化为其对应的汉语拼音的过程。这一技术在许多领域都有应用,比如自然语言处理、搜索引擎优化、语音识别等。它涉及到中文字符编码、Unicode以及汉字与拼音...

    汉字转拼音C++版

    该程序利用C++编程语言实现了将汉字转化为拼音的功能,这对于自然语言处理、搜索引擎优化以及中文输入法的开发等场景都具有重要意义。 首先,我们要理解C++本身是不内置汉字转拼音功能的,因此开发者通常会借助外部...

Global site tag (gtag.js) - Google Analytics