`

java 汉字转换成拼音

阅读更多
Java代码

   1. /**
   2.  *
   3.  * @author MoXie SysTem128(at)GMail.Com
   4.  */ 
   5. public class SpellCnHelper { 
   6.  
   7.     private static int size = 7550; // (20319 - 10254) * 0.75 可以适当调小增加效率……调多小~自己算去~ 
   8.     private static String[] spellList = new String[size]; 
   9.     private static boolean isInited = false; 
  10.  
  11.  
  12.     static { 
  13.         if (!isInited) { 
  14.             initList(); 
  15.             isInited = true; 
  16.         } 
  17.  
  18.     } 
  19.  
  20.     /**
  21.      * 新增元
  22.      * @param key 
  23.      * @param value
  24.      */ 
  25.     private static void put(String key, String value) { 
  26.         if (key == null) { 
  27.             return; 
  28.         } 
  29.         int index = getIndex(key); 
  30.         spellList[index] = value; 
  31.     } 
  32.  
  33.     /**
  34.      * 获取元
  35.      * @param key
  36.      * @return
  37.      */ 
  38.     private static String get(int key) { 
  39.         return get(String.valueOf(key)); 
  40.     } 
  41.  
  42.     private static String get(String key) { 
  43.         String value = new String(); 
  44.         if (key == null) { 
  45.             return value; 
  46.         } 
  47.         int index = getIndex(key); 
  48.         /**
  49.          * 注释部分原用于寄存已未初始但已获取部分,由于效率不明显且占用内存所以删掉了。
  50.          */ 
  51. //        if (spellList[index] != null) { 
  52. //            value = spellList[index]; 
  53. //        } else { 
  54.         for (int i = index; i > 0; i--) { 
  55.             if (spellList[i] != null) { 
  56.                 value = spellList[i]; 
  57. //                    spellList[index] = value; 
  58.                 break; 
  59.             } 
  60.         } 
  61. //        } 
  62.         return value; 
  63.     } 
  64.  
  65.     /**
  66.      * 获取索引
  67.      * @param key
  68.      * @return
  69.      */ 
  70.     private static int getIndex(String key) { 
  71.         return (Integer.valueOf(key).intValue() % size) + size - 1; 
  72.     } 
  73.  
  74.     private static void initList() { 
  75.  
  76.         String[] keyList = new String[]{"-20319", "-20317", "-20304", "-20295", 
  77.             "-20292", "-20283", "-20265", "-20257", "-20242", "-20230", "-20051", 
  78.             "-20036", "-20032", "-20026", "-20002", "-19990", "-19986", "-19982", 
  79.             "-19976", "-19805", "-19784", "-19775", "-19774", "-19763", "-19756", 
  80.             "-19751", "-19746", "-19741", "-19739", "-19728", "-19725", "-19715", 
  81.             "-19540", "-19531", "-19525", "-19515", "-19500", "-19484", "-19479", 
  82.             "-19467", "-19289", "-19288", "-19281", "-19275", "-19270", "-19263", 
  83.             "-19261", "-19249", "-19243", "-19242", "-19238", "-19235", "-19227", 
  84.             "-19224", "-19218", "-19212", "-19038", "-19023", "-19018", "-19006", 
  85.             "-19003", "-18996", "-18977", "-18961", "-18952", "-18783", "-18774", 
  86.             "-18773", "-18763", "-18756", "-18741", "-18735", "-18731", "-18722", 
  87.             "-18710", "-18697", "-18696", "-18526", "-18518", "-18501", "-18490", 
  88.             "-18478", "-18463", "-18448", "-18447", "-18446", "-18239", "-18237", 
  89.             "-18231", "-18220", "-18211", "-18201", "-18184", "-18183", "-18181", 
  90.             "-18012", "-17997", "-17988", "-17970", "-17964", "-17961", "-17950", 
  91.             "-17947", "-17931", "-17928", "-17922", "-17759", "-17752", "-17733", 
  92.             "-17730", "-17721", "-17703", "-17701", "-17697", "-17692", "-17683", 
  93.             "-17676", "-17496", "-17487", "-17482", "-17468", "-17454", "-17433", 
  94.             "-17427", "-17417", "-17202", "-17185", "-16983", "-16970", "-16942", 
  95.             "-16915", "-16733", "-16708", "-16706", "-16689", "-16664", "-16657", 
  96.             "-16647", "-16474", "-16470", "-16465", "-16459", "-16452", "-16448", 
  97.             "-16433", "-16429", "-16427", "-16423", "-16419", "-16412", "-16407", 
  98.             "-16403", "-16401", "-16393", "-16220", "-16216", "-16212", "-16205", 
  99.             "-16202", "-16187", "-16180", "-16171", "-16169", "-16158", "-16155", 
100.             "-15959", "-15958", "-15944", "-15933", "-15920", "-15915", "-15903", 
101.             "-15889", "-15878", "-15707", "-15701", "-15681", "-15667", "-15661", 
102.             "-15659", "-15652", "-15640", "-15631", "-15625", "-15454", "-15448", 
103.             "-15436", "-15435", "-15419", "-15416", "-15408", "-15394", "-15385", 
104.             "-15377", "-15375", "-15369", "-15363", "-15362", "-15183", "-15180", 
105.             "-15165", "-15158", "-15153", "-15150", "-15149", "-15144", "-15143", 
106.             "-15141", "-15140", "-15139", "-15128", "-15121", "-15119", "-15117", 
107.             "-15110", "-15109", "-14941", "-14937", "-14933", "-14930", "-14929", 
108.             "-14928", "-14926", "-14922", "-14921", "-14914", "-14908", "-14902", 
109.             "-14894", "-14889", "-14882", "-14873", "-14871", "-14857", "-14678", 
110.             "-14674", "-14670", "-14668", "-14663", "-14654", "-14645", "-14630", 
111.             "-14594", "-14429", "-14407", "-14399", "-14384", "-14379", "-14368", 
112.             "-14355", "-14353", "-14345", "-14170", "-14159", "-14151", "-14149", 
113.             "-14145", "-14140", "-14137", "-14135", "-14125", "-14123", "-14122", 
114.             "-14112", "-14109", "-14099", "-14097", "-14094", "-14092", "-14090", 
115.             "-14087", "-14083", "-13917", "-13914", "-13910", "-13907", "-13906", 
116.             "-13905", "-13896", "-13894", "-13878", "-13870", "-13859", "-13847", 
117.             "-13831", "-13658", "-13611", "-13601", "-13406", "-13404", "-13400", 
118.             "-13398", "-13395", "-13391", "-13387", "-13383", "-13367", "-13359", 
119.             "-13356", "-13343", "-13340", "-13329", "-13326", "-13318", "-13147", 
120.             "-13138", "-13120", "-13107", "-13096", "-13095", "-13091", "-13076", 
121.             "-13068", "-13063", "-13060", "-12888", "-12875", "-12871", "-12860", 
122.             "-12858", "-12852", "-12849", "-12838", "-12831", "-12829", "-12812", 
123.             "-12802", "-12607", "-12597", "-12594", "-12585", "-12556", "-12359", 
124.             "-12346", "-12320", "-12300", "-12120", "-12099", "-12089", "-12074", 
125.             "-12067", "-12058", "-12039", "-11867", "-11861", "-11847", "-11831", 
126.             "-11798", "-11781", "-11604", "-11589", "-11536", "-11358", "-11340", 
127.             "-11339", "-11324", "-11303", "-11097", "-11077", "-11067", "-11055", 
128.             "-11052", "-11045", "-11041", "-11038", "-11024", "-11020", "-11019", 
129.             "-11018", "-11014", "-10838", "-10832", "-10815", "-10800", "-10790", 
130.             "-10780", "-10764", "-10587", "-10544", "-10533", "-10519", "-10331", 
131.             "-10329", "-10328", "-10322", "-10315", "-10309", "-10307", "-10296", 
132.             "-10281", "-10274", "-10270", "-10262", "-10260", "-10256", "-10254"}; 
133.         String[] valList = new String[]{"a", "ai", "an", "ang", "ao", "ba", "bai", 
134.             "ban", "bang", "bao", "bei", "ben", "beng", "bi", "bian", "biao", "bie", 
135.             "bin", "bing", "bo", "bu", "ca", "cai", "can", "cang", "cao", "ce", 
136.             "ceng", "cha", "chai", "chan", "chang", "chao", "che", "chen", "cheng", 
137.             "chi", "chong", "chou", "chu", "chuai", "chuan", "chuang", "chui", "chun", 
138.             "chuo", "ci", "cong", "cou", "cu", "cuan", "cui", "cun", "cuo", "da", 
139.             "dai", "dan", "dang", "dao", "de", "deng", "di", "dian", "diao", "die", 
140.             "ding", "diu", "dong", "dou", "du", "duan", "dui", "dun", "duo", "e", 
141.             "en", "er", "fa", "fan", "fang", "fei", "fen", "feng", "fo", "fou", 
142.             "fu", "ga", "gai", "gan", "gang", "gao", "ge", "gei", "gen", "geng", 
143.             "gong", "gou", "gu", "gua", "guai", "guan", "guang", "gui", "gun", 
144.             "guo", "ha", "hai", "han", "hang", "hao", "he", "hei", "hen", "heng", 
145.             "hong", "hou", "hu", "hua", "huai", "huan", "huang", "hui", "hun", 
146.             "huo", "ji", "jia", "jian", "jiang", "jiao", "jie", "jin", "jing", 
147.             "jiong", "jiu", "ju", "juan", "jue", "jun", "ka", "kai", "kan", 
148.             "kang", "kao", "ke", "ken", "keng", "kong", "kou", "ku", "kua", 
149.             "kuai", "kuan", "kuang", "kui", "kun", "kuo", "la", "lai", "lan", 
150.             "lang", "lao", "le", "lei", "leng", "li", "lia", "lian", "liang", 
151.             "liao", "lie", "lin", "ling", "liu", "long", "lou", "lu", "lv", 
152.             "luan", "lue", "lun", "luo", "ma", "mai", "man", "mang", "mao", 
153.             "me", "mei", "men", "meng", "mi", "mian", "miao", "mie", "min", 
154.             "ming", "miu", "mo", "mou", "mu", "na", "nai", "nan", "nang", 
155.             "nao", "ne", "nei", "nen", "neng", "ni", "nian", "niang", "niao", 
156.             "nie", "nin", "ning", "niu", "nong", "nu", "nv", "nuan", "nue", 
157.             "nuo", "o", "ou", "pa", "pai", "pan", "pang", "pao", "pei", "pen", 
158.             "peng", "pi", "pian", "piao", "pie", "pin", "ping", "po", "pu", "qi", 
159.             "qia", "qian", "qiang", "qiao", "qie", "qin", "qing", "qiong", "qiu", 
160.             "qu", "quan", "que", "qun", "ran", "rang", "rao", "re", "ren", "reng", 
161.             "ri", "rong", "rou", "ru", "ruan", "rui", "run", "ruo", "sa", "sai", 
162.             "san", "sang", "sao", "se", "sen", "seng", "sha", "shai", "shan", 
163.             "shang", "shao", "she", "shen", "sheng", "shi", "shou", "shu", "shua", 
164.             "shuai", "shuan", "shuang", "shui", "shun", "shuo", "si", "song", "sou", 
165.             "su", "suan", "sui", "sun", "suo", "ta", "tai", "tan", "tang", "tao", 
166.             "te", "teng", "ti", "tian", "tiao", "tie", "ting", "tong", "tou", "tu", 
167.             "tuan", "tui", "tun", "tuo", "wa", "wai", "wan", "wang", "wei", "wen", 
168.             "weng", "wo", "wu", "xi", "xia", "xian", "xiang", "xiao", "xie", "xin", 
169.             "xing", "xiong", "xiu", "xu", "xuan", "xue", "xun", "ya", "yan", "yang", 
170.             "yao", "ye", "yi", "yin", "ying", "yo", "yong", "you", "yu", "yuan", 
171.             "yue", "yun", "za", "zai", "zan", "zang", "zao", "ze", "zei", "zen", 
172.             "zeng", "zha", "zhai", "zhan", "zhang", "zhao", "zhe", "zhen", "zheng", 
173.             "zhi", "zhong", "zhou", "zhu", "zhua", "zhuai", "zhuan", "zhuang", 
174.             "zhui", "zhun", "zhuo", "zi", "zong", "zou", "zu", "zuan", "zui", 
175.             "zun", "zuo"}; 
176.         for (int i = 0; i < valList.length; i++) { 
177.             put(keyList[i], valList[i]); 
178.         } 
179.     } 
180.  
181.     /**
182.      * 和网上流传的其他版本一样
183.      * 
184.      * @param cn
185.      * @return
186.      */ 
187.     private static int getAscii(char cn) { 
188.         byte[] bytes = (String.valueOf(cn)).getBytes(); 
189.         if (bytes == null || bytes.length > 2 || bytes.length <= 0) { //错误 
190.             return 0; 
191.         } 
192.         if (bytes.length == 1) { 
193.             return bytes[0]; 
194.         } 
195.  
196.         if (bytes.length == 2) { 
197.             int hightByte = 256 + bytes[0]; 
198.             int lowByte = 256 + bytes[1]; 
199.             int ascii = (256 * hightByte + lowByte) - 256 * 256; 
200.             return ascii; 
201.         } 
202.  
203.         return 0; 
204.     } 
205.  
206.     /**
207.      * 和网上流传的其他版本一样
208.      *
209.      * @param ascii
210.      * @return
211.      */ 
212.     private static String getSpellByAscii(int ascii) { 
213.         if (ascii > 0 && ascii < 160) { //单字符 
214.             return String.valueOf((char) ascii); 
215.         } 
216.  
217.         if (ascii < -20319 || ascii > -10247) { //不知道的字符 
218.             return null; 
219.         } 
220.  
221.         return get(ascii); 
222.     } 
223.  
224.     /**
225.      * 和网上流传的其他版本一样
226.      *
227.      * @param ascii
228.      * @return
229.      */ 
230.     public static String getSpell( 
231.             String cnStr) { 
232.         if (null == cnStr || "".equals(cnStr.trim())) { 
233.             return cnStr; 
234.         } 
235.         char[] chars = cnStr.toCharArray(); 
236.         StringBuffer resultBf = new StringBuffer(); 
237.         for (int i = 0, Len = chars.length; i < 
238.                 Len; i++) { 
239.             int ascii = getAscii(chars[i]); 
240.             if (ascii == 0) { //取ascii时出错 
241.                 resultBf.append(chars[i]); 
242.             } else { 
243.                 String spell = getSpellByAscii(ascii); 
244.                 if (spell == null) { 
245.                     resultBf.append(chars[i]); 
246.                 } else { 
247.                     resultBf.append(spell); 
248.                 } // end of if spell == null 
249.  
250.             } // end of if ascii <= -20400 
251.         } // end of for 
252.  
253.         return resultBf.toString(); 
254.     } 
255. } 


Java代码

   1. import junit.framework.TestCase; 
   2.  
   3. /**
   4.  *
   5.  * @author MoXie SysTem128(at)GMail.Com
   6.  */ 
   7. public class SpellCnHelperTest extends TestCase { 
   8.  
   9.     public SpellCnHelperTest(String testName) { 
  10.         super(testName); 
  11.     } 
  12.  
  13.     /**
  14.      * Test of main method, of class SpellCnHelper.
  15.      * 正式使用时注意替换未转译字符
  16.      * 例如生成url时可以替换非 字母数字下划线减号 为 减号或下划线
  17.      */ 
  18.     public void testMain() { 
  19.         String str = null; 
  20.         str = 
  21.                 "赵钱孙李周吴郑王冯陈褚卫蒋沈韩杨朱秦尤许何吕施张孔曹严华金魏陶姜戚谢邹喻柏水"; 
  22. //                "窦章云苏潘葛奚范彭郎鲁韦昌马苗凤花方俞任袁柳酆鲍史唐费廉岑薛雷贺倪汤滕殷罗" + 
  23. //                "毕郝邬安常乐于时傅皮卞齐康伍余元卜顾孟平黄和穆萧尹姚邵湛汪祁毛禹狄米贝明臧" + 
  24. //                "计伏成戴谈宋茅庞熊纪舒屈项祝董梁杜阮蓝闵席季麻强贾路娄危江童颜郭梅盛林刁钟" + 
  25. //                "徐邱骆高夏蔡田樊胡凌霍虞万支柯昝管卢莫柯房裘缪干解应宗丁宣贲邓郁单杭洪包诸" + 
  26. //                "左石崔吉钮龚程嵇邢滑裴陆荣翁荀羊于惠甄曲家封芮羿储靳汲邴糜松井段富巫乌焦巴" + 
  27. //                "弓牧隗山谷车侯宓蓬全郗班仰秋仲伊宫宁仇栾暴甘钭历戎祖武符刘景詹束龙叶幸司韶" + 
  28. //                "郜黎蓟溥印宿白怀蒲邰从鄂索咸籍赖卓蔺屠蒙池乔阳郁胥能苍双闻莘党翟谭贡劳逄姬" + 
  29. //                "申扶堵冉宰郦雍却璩桑桂濮牛寿通边扈燕冀浦尚农温别庄晏柴瞿阎充慕连茹习宦艾鱼" + 
  30. //                "容向古易慎戈廖庾终暨居衡步都耿满弘匡国文寇广禄阙东欧殳沃利蔚越夔隆师巩厍聂" + 
  31. //                "晁勾敖融冷訾辛阚那简饶空曾毋沙乜养鞠须丰巢关蒯相查后荆红游竺权逮盍益桓公万" + 
  32. //                "俟司马上官欧阳夏侯诸葛闻人东方赫连皇甫尉迟公羊澹台公冶宗政濮阳淳于单于太叔" + 
  33. //                "申屠公孙仲孙轩辕令狐徐离宇文长孙慕容司徒司空"; 
  34. //        StringBuffer sb = new StringBuffer(); 
  35. //        for (int j = 0; j < 20; j++) { 
  36. //            sb.append(str); 
  37. //        } 
  38. //        str = sb.toString(); 
  39.         System.out.println(str.length()); 
  40.         long start = System.currentTimeMillis(); 
  41.         long i = 0L; 
  42.         do { 
  43.             i++; 
  44.             SpellCnHelper.getSpell(str); 
  45.         } while (i < 10000L); 
  46.         System.out.println("Spell=" + SpellCnHelper.getSpell(str)); 
  47.         System.out.println(System.currentTimeMillis() - start); 
  48.     /**
  49.      * 1 672ms
  50.      * 2 750ms
  51.      * 3 750ms
  52.      * 4 703ms
  53.      * 5 734ms
  54.      */ 
  55.     } 
  56. } 
分享到:
评论

相关推荐

    将汉字转换成拼音 java 源码

    - **Pinyin4j** 是一个强大的Java库,主要用于将中文汉字转换为拼音,同时支持多种配置选项来调整输出格式。 - 这个库提供了一系列工具类和枚举类型来帮助开发者定制拼音的输出方式,例如是否带有声调、拼音首字母大...

    汉字转换拼音 java

    对于`JAVA汉字转换拼音`,你可以查看源代码,学习作者是如何实现汉字转换拼音的,并根据实际需求进行修改或扩展。 总之,Java中实现汉字转换拼音的功能并不复杂,关键在于选择合适的库和正确地调用其API。Pinyin4j...

    java将汉字转化为拼音大小写

    java将汉字转化为拼音大小写(提取首字母,将汉字转化为拼音首字母大小写的相关算法)

    Java汉字转换为拼音工具类

    Java汉字转换为拼音工具类 汉字转换为拼音包括全拼、首字母缩写;全拼可计算出多音字。

    java 汉字转成拼音

    "j2ee精英团队10年编程精华大放送"表明这个压缩包可能包含了该团队在Java汉字转拼音领域积累的宝贵经验和实用工具。 首先,我们要了解Java中的汉字转拼音的基本原理。通常,这涉及到读取汉字字符并使用预定义的映射...

    Java 将汉字转化成拼音 DEMO

    这个"Java 将汉字转化成拼音 DEMO"项目提供了完整的解决方案,特别强调了对生僻字的支持,这在实际应用中非常关键,因为很多标准库可能无法正确处理不常用的汉字。 首先,我们要理解汉字转拼音的基本原理。通常,...

    java汉字转拼音(全拼和首字母)

    在Java编程语言中,汉字转拼音是一项常见的需求,特别是在处理中文数据、搜索引擎优化或文本处理等领域。本篇文章将深入探讨如何使用Java实现汉字转拼音的功能,包括获取汉字的全拼和首字母。 首先,我们需要理解...

    java 汉字转换拼音

    根据提供的文件信息,本文将详细解析“Java汉字转换拼音”的实现方法及原理,并结合实际代码进行分析。 ### 一、项目概述 #### 标题:Java汉字转换拼音 该标题明确指出项目的主要功能是利用Java语言实现汉字到拼音...

    Java利用ascii码表把汉字转换成拼音

    在Java编程语言中,将汉字转换为拼音是一项常见的任务,特别是在处理中文文本或者需要进行语音合成等场景下。本文将详细介绍如何利用ASCII码表来实现这个功能,以及相关的技术要点。 首先,我们要明白汉字和拼音...

    汉字转换成拼音 java 源程序

    将任意个汉字转换成汉语拼音全拼或第一个字母的JAVA程序

    Java汉字转换拼音

    总的来说,Java汉字转换拼音主要依赖于第三方库,如`pinyin4j`,通过这些库提供的接口和方法,我们可以方便地实现汉字到拼音的转换,并根据实际需求进行相应的处理。在开发过程中,注意选择适合项目需求的库,并充分...

    JAVA 汉字转换拼音

    在Java编程语言中,汉字转换拼音是一个常见的需求,特别是在处理中文数据、搜索引擎优化或文本处理等领域。本主题将深入探讨如何使用pinyin4j库来实现这一功能。 首先,pinyin4j是一个开源的Java库,它允许开发者...

    Java汉字转拼音(支持多音字)

    这个"Java汉字转拼音(支持多音字)"的主题涉及了如何在Java环境中实现这一功能,特别是考虑到中文的多音字特性。 多音字是指一个汉字有多个读音,其读音取决于它在特定语境中的含义。例如,“打”字可以读作“dǎ...

    java将汉字转为拼音

    在Java编程语言中,将汉字转换为对应的汉语拼音是一项常见的需求,特别是在文本处理、搜索功能或者国际化应用中。为了实现这个功能,Java提供了一些库和API可以利用。本篇文章将详细探讨如何在Java中实现汉字转拼音...

    java中文转拼音

    ### Java程序实现中文转拼音及首字母转换 #### 概述 在中文处理领域,将汉字转换为拼音是一项常见的需求,特别是在搜索引擎、自然语言处理、数据标准化等应用场景中。本文介绍了一个简单的Java类`ChineseToEnglish...

    java 中文转换拼音

    这个给定的压缩包文件“languageConvert”可能包含了一个实现此功能的Java程序,使得开发者能够方便地将中文字符串转换成对应的拼音表示。 中文到拼音的转换通常基于汉字与拼音的映射表或者第三方库来完成。Java中...

    java程序把汉字转换成拼音

    在Java编程语言中,将汉字转换为拼音是一项常见的任务,特别是在处理中文文本、搜索引擎优化(SEO)或国际化应用中。为了实现这个功能,Java提供了一些库和API,这些工具可以帮助我们方便地完成汉字到拼音的转换。在...

    java汉字转化为拼音的工具类

    在处理中文字符时,有时我们可能需要将汉字转化为拼音,这就是Java汉字转拼音工具类的作用。这类工具通常提供了方便的方法,允许开发者快速、高效地完成汉字到拼音的转换,从而满足各种需求,如搜索引擎优化、文本...

    java版汉字生成拼音小工具带源码

    Java版的汉字生成拼音小工具是一款实用的软件,主要用于将汉字转换为其对应的拼音表示,这对于中文编程、文本处理、搜索引擎优化以及多语言支持等方面都具有重要作用。这款工具由Java语言编写,具有良好的跨平台特性...

    汉字转换成拼音的java类库

    "汉字转换成拼音的java类库"就是为此目的设计的一个工具,它提供了一种方便的方式来实现这一功能。这个类库通常包含了预处理、拼音映射和后处理等步骤,以确保准确地将汉字转换为对应的汉语拼音。 这个类库的核心...

Global site tag (gtag.js) - Google Analytics