在网上参考了一些汉字转换到拼音的资料。思路应该只有以下两种。
1,查表法。这样做需要一个庞大的映射表,在j2me环境下不大合适。不过效果好,有些还支持多音字。
2,使用GB字库的映射关系。因为GB2312及其扩展GBK的汉字编码都根据区位于拼音存在映射关系。
实际上网络上的大部分文章都是根据第二种方法来实现的。
我也是采用这种方法,因为它基本上可以利用GB2312字库,直接映射成拼音。
如果遇到不支持GB2312的手机,请参考上一篇文章。
http://blog.csdn.net/hunhun1981/archive/2007/10/26/1845576.aspx
首先来介绍下原始的代码,由于这个代码在网上存在多个版本,并不知道原始作者是谁。
再次鄙视哪些剽窃人家东西不留名的人。
http://hibernate.blogdriver.com/hibernate/1036902.html
或者各位可以在百度中搜索“java 中文 拼音”,即可找到很多帖子,基本全是这份代码。
以下是一个重要片段。
<!----> /**
* 获得单个汉字的Ascii.
* @param cn char
* 汉字字符
* @return int
* 错误返回 0,否则返回ascii
*/
public static int getCnAscii(char cn) {
byte[] bytes = (String.valueOf(cn)).getBytes();
if (bytes == null || bytes.length > 2 || bytes.length <= 0) { //错误
return 0;
}
if (bytes.length == 1) { //英文字符
return bytes[0];
}
if (bytes.length == 2) { //中文字符
int hightByte = 256 + bytes[0];
int lowByte = 256 + bytes[1];
int ascii = (256 * hightByte + lowByte) - 256 * 256;
//System.out.println("ASCII=" + ascii);
return ascii;
}
return 0; //错误
}
这个方法中有一个片段大家需要注意,“(String.valueOf(cn)).getBytes();”这一句。
这里获得的应该是GBK编码,可不是unicode。
unicode是无法使用现在的方法来获取拼音的,只能用查表法,弄一张对于j2me来说很庞大的映射表。
下面详细介绍一下我改进后的方法。并且对原始代码的作者表示感谢,虽然不知道他是谁。
<!---->public class HGB2PINYIN {
private String[] name = { "zuo", "zun", "zui", "zuan", "zu", "zou",
"zong", "zi", "zhuo", "zhun", "zhui", "zhuang", "zhuan",
"zhuai", "zhua", "zhu", "zhou", "zhong", "zhi", "zheng",
"zhen", "zhe", "zhao", "zhang", "zhan", "zhai", "zha", "zeng",
"zen", "zei", "ze", "zao", "zang", "zan", "zai", "za", "yun",
"yue", "yuan", "yu", "you", "yong", "yo", "ying", "yin", "yi",
"ye", "yao", "yang", "yan", "ya", "xun", "xue", "xuan", "xu",
"xiu", "xiong", "xing", "xin", "xie", "xiao", "xiang", "xian",
"xia", "xi", "wu", "wo", "weng", "wen", "wei", "wang", "wan",
"wai", "wa", "tuo", "tun", "tui", "tuan", "tu", "tou", "tong",
"ting", "tie", "tiao", "tian", "ti", "teng", "te", "tao",
"tang", "tan", "tai", "ta", "suo", "sun", "sui", "suan", "su",
"sou", "song", "si", "shuo", "shun", "shui", "shuang", "shuan",
"shuai", "shua", "shu", "shou", "shi", "sheng", "shen", "she",
"shao", "shang", "shan", "shai", "sha", "seng", "sen", "se",
"sao", "sang", "san", "sai", "sa", "ruo", "run", "rui", "ruan",
"ru", "rou", "rong", "ri", "reng", "ren", "re", "rao", "rang",
"ran", "qun", "que", "quan", "qu", "qiu", "qiong", "qing",
"qin", "qie", "qiao", "qiang", "qian", "qia", "qi", "pu", "po",
"ping", "pin", "pie", "piao", "pian", "pi", "peng", "pen",
"pei", "pao", "pang", "pan", "pai", "pa", "ou", "o", "nuo",
"nue", "nuan", "nv", "nu", "nong", "niu", "ning", "nin", "nie",
"niao", "niang", "nian", "ni", "neng", "nen", "nei", "ne",
"nao", "nang", "nan", "nai", "na", "mu", "mou", "mo", "miu",
"ming", "min", "mie", "miao", "mian", "mi", "meng", "men",
"mei", "me", "mao", "mang", "man", "mai", "ma", "luo", "lun",
"lue", "luan", "lv", "lu", "lou", "long", "liu", "ling", "lin",
"lie", "liao", "liang", "lian", "lia", "li", "leng", "lei",
"le", "lao", "lang", "lan", "lai", "la", "kuo", "kun", "kui",
"kuang", "kuan", "kuai", "kua", "ku", "kou", "kong", "keng",
"ken", "ke", "kao", "kang", "kan", "kai", "ka", "jun", "jue",
"juan", "ju", "jiu", "jiong", "jing", "jin", "jie", "jiao",
"jiang", "jian", "jia", "ji", "huo", "hun", "hui", "huang",
"huan", "huai", "hua", "hu", "hou", "hong", "heng", "hen",
"hei", "he", "hao", "hang", "han", "hai", "ha", "guo", "gun",
"gui", "guang", "guan", "guai", "gua", "gu", "gou", "gong",
"geng", "gen", "gei", "ge", "gao", "gang", "gan", "gai", "ga",
"fu", "fou", "fo", "feng", "fen", "fei", "fang", "fan", "fa",
"er", "en", "e", "duo", "dun", "dui", "duan", "du"
分享到:
相关推荐
本项目名为"C++中文汉字转拼音",旨在利用C++编程实现一个高效、灵活的汉字转拼音功能。 项目的核心在于使用"拼音-中文"的数据字典。这种设计思路是预先建立一个包含所有汉字及其对应拼音的映射关系,通常以文本...
标题“汉字转拼音_汉字转拼音Excel_”暗示我们将讨论如何使用Excel中的VBA宏来实现这个功能。VBA是一种内置于Microsoft Office套件中的编程语言,允许用户自定义工作簿的行为,包括自动化任务、创建复杂的公式以及...
在IT领域,中文汉字转拼音是一项常见的处理任务,特别是在自然语言处理、文本分析以及编程中。这个任务的主要目的是将汉字转换成对应的汉语拼音,以便计算机能够更好地理解和处理中文信息。以下将详细介绍汉字转拼音...
例如,如果一个程序需要对中文字符进行排序,或者在没有输入法的情况下通过英文键盘输入中文,汉字转拼音就显得尤为重要。 "C#汉字转拼音(npinyin)"是一个C#库,它提供了一个方便的方式来将汉字转换为对应的汉语...
网上传的postgreSQL汉字转拼音的方法,是针对9.3的版本(相信你要是8.4的也搜到了但不能直接用,才来看我的),尝试了8.4的版本来做拼音处理。发现网上的《postgreSQL汉字转拼音》里面坑比较多,尝试纠正了一下,发...
在MySQL中实现中文汉字转拼音的功能,主要是为了方便在数据库查询和数据分析时处理中文文本,尤其是在没有全文索引或者需要进行复杂模糊匹配时。以下是一个简单的实现方法,它利用自定义函数来完成这一任务。 首先...
标签中的"URL拼音化"强调了这个插件在生成拼音URL上的应用场景,而"JS中文转拼音插件"和"中文转拼音"则表明该插件专注于这个功能,并且是用JavaScript编写的。 总之,这个压缩包提供的JavaScript插件是一个实用的...
在处理中文字符时,尤其是在需要进行汉字与拼音转换的场景下,Delphi 汉字转拼音组件显得尤为重要。本文将深入探讨这款组件的功能、应用及其在Delphi7环境下的使用方法。 首先,我们要明确这款组件的核心功能——将...
汉字转拼音是将中文字符转化为其对应的普通话读音的过程。在计算机系统中,汉字通常以Unicode编码存储,而拼音则是一种基于拉丁字母的表示方式,便于计算机处理和搜索。这项技术主要依赖于汉字拼音库,这些库包含了...
汉字转拼音是计算机处理中文文本的重要一环。全拼是指将汉字转换为完整的汉语拼音,而简拼则是用简化的形式表示汉字,通常只包含声母和韵母,不包括声调。在Delphi 12 XE中,我们可以利用内置的TCharServices组件...
本主题聚焦于在Delphi环境下实现汉字转拼音的功能,这是一个常见的需求,尤其是在处理中文字符、语音合成或者搜索引擎优化时。对于Delphi 7 和 Delphi 2010 这两个不同版本,由于它们之间的编码差异,代码可能需要...
标题中的"Delphi中文转拼音,全拼和首字母"是指使用Delphi编程语言开发的一个功能,该功能能够将输入的中文文本转化为对应的拼音表示,包括全拼(每个汉字转化为完整的拼音)和首字母(每个汉字转化为声母,即汉语...
汉字转拼音是将中文汉字转化为对应的汉语拼音的过程。在计算机处理中文时,由于计算机内部主要处理ASCII编码,而汉字属于Unicode或GBK等多字节编码,因此需要将汉字转换为拼音以便进行进一步的处理。这个转换过程...
总的来说,这个"oracle汉字转拼音package包-支持UTF8"是一个非常实用的工具,可以帮助我们在Oracle数据库环境中有效地处理汉字到拼音的转换问题,尤其适用于处理UTF8编码的多语言数据。正确理解和使用这个Package,...
这个"Java汉字转拼音(支持多音字)"的主题涉及了如何在Java环境中实现这一功能,特别是考虑到中文的多音字特性。 多音字是指一个汉字有多个读音,其读音取决于它在特定语境中的含义。例如,“打”字可以读作“dǎ...
当我们处理中文字符时,有时需要将汉字转换为拼音或提取其首字母,这在比如搜索、排序或生成缩略词时非常有用。本教程将深入讲解如何在Qt环境中利用C++实现汉字到拼音和首字母的转换。 首先,要进行汉字转拼音,...
### SQL汉字转拼音首字母知识点解析 #### 一、背景介绍 在数据库处理过程中,有时候我们需要将汉字转换为对应的拼音,特别是在中文环境下的数据检索、排序等操作中,这种需求尤为常见。本篇文章将深入探讨如何利用...
汉字转拼音是计算机处理中文文本时常见的需求,尤其在语音合成、搜索引擎索引、自动文本标注等领域有着广泛应用。本资源提供了实现这一功能的必要组件和详细步骤,旨在帮助开发者快速理解并实施汉字转拼音功能。 ...
以上就是关于“java汉字转拼音,android汉字转拼音,汉字转拼音首字母,汉字转ASCII”的技术要点。在实际应用中,根据需求选择合适的转换方式,并注意处理可能出现的异常情况,如多音字、非ASCII字符等。在处理大量...
在标签中,“汉字转拼音”是关键功能,它是许多中文处理应用的基础,比如搜索引擎、输入法、语音识别等。而“dll”标签强调了这是一个动态链接库,可以被其他程序调用执行特定任务。“delphi”则表明了开发环境。 ...