- 浏览: 78950 次
文章分类
最新评论
/** * @date 2010-1-22 * @bugs 不支持多音字处理 */ public class PinyinConv { // 简体中文的编码范围从B0A1(45217)一直到F7FE(63486) private static int BEGIN = 45217; private static int END = 63486; // 按照声母表示,这个表是在GB2312中的出现的第一个汉字,也就是说“啊”是代表首字母a的第一个汉字。 // i, u, v都不做声母, 自定规则跟随前面的字母 private static char[] chartable = { '啊', '芭', '擦', '搭', '蛾', '发', '噶', '哈', '哈', '击', '喀', '垃', '妈', '拿', '哦', '啪', '期', '然', '撒', '塌', '塌', '塌', '挖', '昔', '压', '匝', }; // 二十六个字母区间对应二十七个端点 // GB2312码汉字区间十进制表示 private static int[] table = new int[27]; // 对应首字母区间表 private static char[] initialtable = { 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'h', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 't', 't', 'w', 'x', 'y', 'z'}; // 初始化 static { for (int i = 0; i < 26; i++) { table[i] = gbValue(chartable[i]);// 得到GB2312码的首字母区间端点表,十进制。 } table[26] = END;// 区间表结尾 } // ------------------------public方法区------------------------ /** * 根据一个包含汉字的字符串返回一个汉字拼音首字母的字符串 最重要的一个方法,思路如下:一个个字符读入、判断、输出 */ public static String cn2py(String SourceStr) { String Result = ""; int StrLength = SourceStr.length(); int i; try { for (i = 0; i < StrLength; i++) { Result += Char2Initial(SourceStr.charAt(i)); } } catch (Exception e) { Result = ""; } return Result; } // ------------------------private方法区------------------------ /** * 输入字符,得到他的声母,英文字母返回对应的大写字母,其他非简体汉字返回 '0' * */ private static char Char2Initial(char ch) { // 对英文字母的处理:小写字母转换为大写,大写的直接返回 if (ch >= 'a' && ch <= 'z') return (char) (ch - 'a' + 'A'); if (ch >= 'A' && ch <= 'Z') return ch; // 对非英文字母的处理:转化为首字母,然后判断是否在码表范围内, // 若不是,则直接返回。 // 若是,则在码表内的进行判断。 int gb = gbValue(ch);// 汉字转换首字母 if ((gb < BEGIN) || (gb > END))// 在码表区间之前,直接返回 return ch; int i; for (i = 0; i < 26; i++) {// 判断匹配码表区间,匹配到就break,判断区间形如“[,)” if ((gb >= table[i]) && (gb < table[i+1])) break; } if (gb==END) {//补上GB2312区间最右端 i=25; } return initialtable[i]; // 在码表区间中,返回首字母 } /** * 取出汉字的编码 cn 汉字 */ private static int gbValue(char ch) {// 将一个汉字(GB2312)转换为十进制表示。 String str = String.valueOf(ch); try { byte[] bytes = str.getBytes("GB2312"); if (bytes.length < 2) return 0; return (bytes[0] << 8 & 0xff00) + (bytes[1] & 0xff); } catch (Exception e) { return 0; } } public static void main(String[] args) throws Exception { System.out.println(cn2py("重庆重视发展IT行业,大多数外企,如,IBM等进驻山城")); } }
本段代码载至网上,原理是通过汉字的GB2312的编码是通过拼音首字母的顺序排列,通过区间比较获取首字母的,但从这里也可以看出多音字是无法区分的,只会反映出字符的默认音节的首字母。
发表评论
-
使用javamail组件-----邮件发送
2013-08-09 16:35 485public static void sendMessag ... -
利用快速排序算法快速的取出前一千条数据
2013-08-06 15:49 534实现代码如下:原理是利用了快速排序‘分治’思想,判断左边区域 ... -
java的JNI本地调用代码
2013-06-21 11:56 474Jni中C++和Java的参数传递 如何使用JNI的一些基 ... -
如何解决在window下高并发TCP请求端口被占用问题
2013-05-02 09:43 3088当客户端启动到服务器的 TCP/IP 套接字连接时,客户端通 ... -
Maven的简单使用
2013-04-26 11:44 713----------------准备工作---------- ... -
js 压缩工具使用
2013-04-19 11:40 731//测试代码 compiler("F:\\com ... -
解决加载相同的类
2013-04-19 09:38 625URLClassLoader classLoader1 = ... -
将长url转化为短url
2013-02-21 18:05 710public class ShortAddressUtil ... -
如何判断上传的图片是否是正真的图片 防止上传恶意的非图片文件
2013-02-19 17:03 1016final String JPG = "ffd ... -
ChartDirect使用<制作统计图的组件>
2012-11-30 11:39 1541//创建一个由X,Y轴 ... -
jetty嵌入式采用xml配置
2012-09-24 09:40 1027Server server = new Server(); ... -
生成验证码图片
2012-08-29 17:29 924Java生成验证码 为了防止用户恶意,或者使用软 ... -
WebService分布式应用实现
2012-08-28 17:30 1164WebService 是一种跨语言的系统间交互标准,对外提供功 ... -
利用MulticastSocket发送广播信息
2012-08-24 11:35 808多播组通过 D 类 IP 地址和标准 UDP 端口号指定。D ... -
插件类的一种加载形式URLClassLoader
2012-08-22 10:11 789URL url = new URL("file ... -
部署RMI应用(服务器与RMI注册表分离方式)
2012-08-20 17:56 2150一般情况下,我们的部署RMI应用的时候是把服务器和RMI注册表 ... -
RMI远程调用
2012-08-03 17:42 769第一步:远程对象接口 WareHose.java pack ... -
使用JNDI获取DataSource对象
2012-08-03 14:24 833Tomcat的conf/context.xml在<Con ... -
获取摘要、加密、解密
2012-08-02 16:57 1226生成SHA或MD5摘要 MessageDigest sha ... -
SecurityManager安全管理器
2012-08-02 11:18 1220权限设定文件F:/my.policy ...
相关推荐
总的来说,Oracle中获取汉字拼音和拼音首字母涉及了字符编码、Java编程、自定义函数、第三方工具等多个方面。开发者可以根据具体的需求和环境,选择合适的方法来实现这一功能。在处理过程中,要注意字符集的兼容性、...
"PHP获取字符串拼音首字母"这个话题涉及到的关键技术是汉字到拼音的转换,以及如何处理多音字的情况。本文将深入探讨这个主题,帮助你理解和实现相关功能。 首先,我们要明白,PHP本身并不直接支持汉字到拼音的转换...
"安卓获取汉字拼音首字母工具类封装"就是一个这样的解决方案,它提供了一种便捷的方式来处理汉字与拼音之间的转换,以适配与IndexBar-master这种通讯录开源控件的配合使用。 首先,我们要理解工具类在编程中的作用...
VBA自定义函数__获取字符串首字母拼音.xlsm
java中根据汉字字符串获取拼音首字母工具类
在JavaScript(JS)编程中,有时我们需要处理中文字符并获取其对应的拼音首字母,以便进行各种操作,如快速查找、排序等。这个场景通常出现在构建具有搜索功能的Web应用,尤其是中文内容丰富的网站。本文将深入探讨...
在IT领域,特别是编程语言与...总之,C#中获取汉字拼音首字母涉及到对Unicode编码的理解、拼音映射数据的管理和字符串处理技巧。通过合理的设计和编程,可以有效地实现这一功能,为各种中文处理应用提供有力的支持。
### Java 实现提取汉语字符串各汉字拼音首字母并大写 在Java中实现提取汉语字符串各汉字拼音首字母并将其转换为大写是一项常见的需求,尤其是在处理中文文本数据时。本篇文章将详细介绍如何通过Java代码来实现这一...
标题中的“PB获取汉字拼音首字母”指的是使用PowerBuilder(PB)编程语言编写的一个功能,该功能能够提取汉字的拼音首字母,特别是汉字拼音的声母部分。在中文信息处理中,有时候我们需要将汉字转化为拼音表示,特别...
标题"获取汉子拼音首字母"和描述"获取汉字汉语拼音首字母,UITableView中文也可以加index了"指的就是这个需求。下面我们将详细讨论如何在iOS应用中实现这一功能。 首先,我们需要了解汉字与拼音转换的基本概念。...
"delphi获取汉字拼音首字母可含字母数字"这个话题聚焦于如何在Delphi中实现一个功能,能够提取汉字的拼音首字母,即使这些汉字中间可能包含字母或数字。以下将详细介绍这一技术及其相关的知识点。 首先,我们需要...
- 数据排序:在列表展示中文内容时,可以按照拼音首字母进行排序,如通讯录中的姓名排序。 - 拼音输入法:输入法软件中,需要将用户输入的汉字转化为拼音,以便找到对应的键位。 总的来说,汉字转拼音及获取首...
3. 遍历字符串,对每个汉字调用转换函数,获取其拼音首字母。 4. 将所有首字母组合成一个新的字符串,作为结果返回。 在编写这样的函数时,需要考虑的因素包括处理多音字、特殊字符,以及可能存在的编码问题。同时...
本文将详细探讨如何获取汉字的拼音首字母和全拼,并涉及字符集的相关知识。 首先,我们要理解汉字拼音转换的基本原理。在中文处理中,我们需要将汉字转化为拼音,以便计算机可以进行进一步的分析和操作。这通常通过...
在实际应用中,这种功能还可以扩展到批量处理文本,比如将一段中文文本转换为拼音首字母的字符串,方便进行关键词提取或搜索引擎优化。通过掌握这个技术,开发者可以更好地处理和分析中文数据,提升程序的适用性和...
在本项目"Qt提取汉字拼音首字母"中,我们将探讨如何利用Qt来处理汉字与拼音之间的转换,特别是在获取汉字的拼音首字母方面。 首先,我们需要理解汉字与拼音的关系。汉字是中文的主要书写系统,而拼音是用拉丁字母来...
用法var pinyin = __pinyin.get(Str); pinyin.p;pinyin.l
这段Swift代码利用了`String`类的`transform`方法,它接受一个`StringTransform`,在这个例子中是`.pinyinInitials`,这是Swift标准库中定义的一个枚举值,用于获取字符串的拼音首字母。然后,我们通过`...
在IT领域,特别是编程与文本处理中,获取汉字字符串的拼音首字母是一个常见的需求,尤其在中文信息处理、搜索引擎优化、排序以及数据分类等场景下。本文将详细解析如何通过编码转换和映射表的方式,从汉字字符串中...
在Oracle数据库中实现获取汉字拼音首字母的需求,通常涉及到对中文字符的处理以及拼音转换的技术。这样的功能可以应用于多种场景,例如数据排序、索引建立或是快速检索等。本文将详细介绍如何在Oracle环境中实现这一...