public class GetFirstLetter {
// 国标码和区位码转换常量
private static final int GB_SP_DIFF = 160;
// 存放国标一级汉字不同读音的起始区位码
private static final int[] secPosvalueList = { 1601, 1637, 1833, 2078,
2274, 2302, 2433, 2594, 2787, 3106, 3212, 3472, 3635, 3722, 3730,
3858, 4027, 4086, 4390, 4558, 4684, 4925, 5249, 5600 };
// 存放国标一级汉字不同读音的起始区位码对应读音
private static final char[] firstLetter = { 'a', 'b', 'c', 'd', 'e', 'f',
'g', 'h', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't',
'w', 'x', 'y', 'z' };
// 获取一个字符串的拼音码
public static String getFirstLetter(String oriStr) throws Exception {
String str = oriStr.toLowerCase();
StringBuffer buffer = new StringBuffer();
char ch;
char[] temp;
for (int i = 0; i < str.length(); i++) { // 依次处理str中每个字符
ch = str.charAt(i);
temp = new char[] { ch };
byte[] uniCode = new String(temp).getBytes("GBK");
if (uniCode[0] < 128 && uniCode[0] > 0) { // 非汉字
buffer.append(temp);
} else {
buffer.append(convert(uniCode));
}
}
return buffer.toString();
}
/**
* 获取一个汉字的拼音首字母。 GB码两个字节分别减去160,转换成10进制码组合就可以得到区位码
* 例如汉字"你"的GB码是0xC4/0xE3,分别减去0xA0(160)就是0x24/0x43
* 0x24转成10进制就是36,0x43是67,那么它的区位码就是3667,在对照表中读音为‘n'
*/
private static char convert(byte[] bytes) {
char result = '-';
int secPosvalue = 0;
int i;
for (i = 0; i < bytes.length; i++) {
bytes[i] -= GB_SP_DIFF;
}
secPosvalue = bytes[0] * 100 + bytes[1];
for (i = 0; i < 23; i++) {
if (secPosvalue >= secPosvalueList[i]
&& secPosvalue < secPosvalueList[i + 1]) {
result = firstLetter[i];
break;
}
}
return result;
}
}
分享到:
相关推荐
SQL取得汉字拼音首字母SQL取得汉字拼音首字母SQL取得汉字拼音首字母SQL取得汉字拼音首字母SQL取得汉字拼音首字母
PB 提取汉字拼音首字母的功能是开发者在处理中文字符时可能会遇到的需求,尤其是在数据处理、搜索优化或者构建中文索引等方面。这个功能允许将汉字转换为其对应的拼音首字母,从而实现基于拼音的快速查找或排序。 ...
取得汉字拼音首字母的DLL,C#直接引用。取得汉字拼音首字母的DLL,C#直接引用。
"安卓获取汉字拼音首字母工具类封装"就是一个这样的解决方案,它提供了一种便捷的方式来处理汉字与拼音之间的转换,以适配与IndexBar-master这种通讯录开源控件的配合使用。 首先,我们要理解工具类在编程中的作用...
因为VB.NET不支持指针,所以VB.NET这个汉字转拼音功能只能做成PY.dll这个文件来调用。自己使用就项目>添加引用>添加PY.dll即可,汉字转拼音的转换函数调用方法如DEMO中的示例。。WIN10+VS2015亲测可用。
整个过程的核心在于GBK编码与汉字拼音首字母之间的映射。GBK编码是中国广泛使用的双字节编码标准,它可以表示20000多个汉字。而通过判断GBK编码的值,我们可以获取到对应汉字的拼音首字母,这是基于预先定义的拼音...
一般对于中文数据的索引,采用词组的首汉字拼音的首字母,在DB2中并没有提供相应的函数可以取得汉字拼音的首字母,我们可以利用数据库针对中文字符集的排序功能创建一个这样的函数。本文分析了这种函数的工作原理,...
2. **利用编码表或库函数**:可以通过建立一个汉字与拼音首字母的对照表,或者使用支持汉字到拼音转换的库函数,来获取每个汉字的拼音首字母。 3. **循环处理字符串**:对于给定的字符串,需遍历每一个字符,使用...
1. **首码合并**:对连续的相同拼音首字母进行合并,如“中国”变为“ZG”而非“ZHZG”。 2. **声母韵母组合**:对于多音字,可以根据声母和韵母的组合来进一步区分,如“还”可以记作“H1”和“H2”。 3. **字典...
本示例聚焦于如何使用VBA(Visual Basic for Applications)来取得汉字拼音的第一个字母,这对于处理大量汉字数据、建立索引或者进行文本处理等任务非常有用。下面将详细解释这一过程。 首先,我们需要理解VBA是...
C#获取汉字首字母,获取单个汉字的首拼音,把提取的字母变成大写。
取得目标汉字的拼音首字母.rar,计算机操作系统的字符集中,汉字字符都是按拼音排序的,因此汉字字符的比较就是拼音顺序的比较,根据这个原理,可以通过查找函数使用升序查找的方法来取得目标汉字的拼音首字母。...
在计算机处理汉字时,有时我们需要快速检索或者分类汉字,这时可以使用“取得汉字首字母算法”。这个算法的主要目的是获取一个汉字串中每个汉字的声母,生成首字母串,通常用于拼音排序或者关键词提取。以下是对该...
#### 标题:精彩编程与编程技巧-取得汉字的拼音首字母 #### 描述:精彩编程与编程技巧-取得汉字的拼音首字母 这个标题和描述简要地介绍了函数的主要功能——获取汉字的拼音首字母。 ### 源代码解析 接下来我们将...
"取得汉语拼音首字母"这个项目,显然涉及到的是中文处理技术,特别是将汉字转化为其对应的拼音首字母,这在中文信息处理、搜索引擎优化、自动文本输入等领域有着广泛的应用。 汉语拼音是中文的一种标准化音译系统,...
通过`HEX()`函数将字符转换为16进制表示,然后用`CONV()`函数将其转换为10进制,再通过`INTERVAL`函数判断这个数字在哪个汉字范围内,从而映射到相应的拼音首字母(A到Z)。 使用`ELT()`函数,根据汉字的10进制编码...
这是个例子.用JS实现,你可以实现,一输汉字,自动获得该汉字的首字母. 是不是很酷?
综上所述,实现取得汉字拼音首码的方法多种多样,可以根据实际项目需求和开发环境选择合适的方式。在VB编程中,我们可以利用API、内置对象、第三方库或自建数据结构来实现这一功能,以满足数据处理和查询的需求。而...
在本压缩包中,我们有一个名为"305 取得汉字的第一个字母"的文件,这可能是一个程序代码或脚本,用于提取汉字的首字母,可能是为了实现拼音简写、关键词检索或其他相关功能。 首先,我们需要了解汉字的编码方式。在...