在项目中要更能根据某些查询条件(比如姓名)的首字母作为条件进行查询,比如查一个叫“张三”的人,可以输入‘zs'。写了一个工具类如下:
/**GB 2312-80 把收录的汉字分成两级。第一级汉字是常用汉字,计 3755 个,
* 置于 16~55 区,按汉语拼音字母/笔形顺序排列;第二级汉字是次常用汉字,
* 计 3008 个,置于 56~87 区,按部首/笔画顺序排列,所以本程序只能查到
* 对一级汉字的声母。同时对符合声母(zh,ch,sh)只能取首字母(z,c,s)
*/
参数是 int, 输入的byte 会自动扩展为int;
如果byte的高位为1,扩展高位的三字节全为 ff ,即 ff ff ff byte
如果byte的高位为0,扩展高位的三字节全为 00 ,即 00 00 00 byte
而 byte & 0xff 等同于
byte & 0x000000ff
试比较:
byte b = (byte)0x81;
System.out.println(Integer.toHexString(b));
System.out.println(Integer.toHexString(b & 0xff));
Java代码
1.static final int GB_SP_DIFF = 160;
2. // 存放国标一级汉字不同读音的起始区位码
3. static final int[] secPosValueList = { 1601, 1637, 1833, 2078, 2274, 2302, 2433, 2594, 2787, 3106, 3212, 3472, 3635, 3722, 3730, 3858, 4027, 4086, 4390, 4558, 4684, 4925,
4. 5249, 5600 };
5. // 存放国标一级汉字不同读音的起始区位码对应读音
6. static final char[] firstLetter = { 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'w', 'x', 'y', 'z' };
7.
8. // 获取一个字符串的拼音码
9. public static String getFirstLetter(String oriStr) {
10. String str = oriStr.toLowerCase();
11. StringBuffer buffer = new StringBuffer();
12. char ch;
13. char[] temp;
14. for (int i = 0; i < str.length(); i++) { // 依次处理str中每个字符
15. ch = str.charAt(i);
16. temp = new char[] { ch };
17. byte[] uniCode = new String(temp).getBytes();
18. if (uniCode[0] < 128 && uniCode[0] > 0) { // 非汉字
19. buffer.append(temp);
20. } else {
21. buffer.append(convert(uniCode));
22. }
23. }
24. return buffer.toString();
25. }
26. // 获取一个汉字的拼音码
27. public static Character getFirstLetter(char ch) {
28.
29. byte[] uniCode = null;
30. try {
31. uniCode = String.valueOf(ch).getBytes("GBK");
32. } catch (UnsupportedEncodingException e) {
33. e.printStackTrace();
34. return null;
35. }
36. if (uniCode[0] &0xff< 128 && uniCode[0]&0xff > 0) { // 非汉字
37. return null;
38. } else {
39. return convert(uniCode);
40. }
41. }
42. /**
43. * 获取一个汉字的拼音首字母。 GB码两个字节分别减去160,转换成10进制码组合就可以得到区位码
44. * 例如汉字“你”的GB码是0xC4/0xE3,分别减去0xA0(160)就是0x24/0x43
45. * 0x24转成10进制就是36,0x43是67,那么它的区位码就是3667,在对照表中读音为‘n’
46. */
47. static char convert(byte[] bytes) {
48. char result = '-';
49. int secPosValue = 0;
50. int i;
51. for (i = 0; i < bytes.length; i++) {
52. bytes[i] -= GB_SP_DIFF;
53. }
54. secPosValue = bytes[0] * 100 + bytes[1];
55. for (i = 0; i < 23; i++) {
56. if (secPosValue >= secPosValueList[i] && secPosValue < secPosValueList[i + 1]) {
57. result = firstLetter[i];
58. break;
59. }
60. }
61. return result;
62. }
分享到:
相关推荐
java中根据汉字字符串获取拼音首字母工具类
"PHP获取字符串拼音首字母"这个话题涉及到的关键技术是汉字到拼音的转换,以及如何处理多音字的情况。本文将深入探讨这个主题,帮助你理解和实现相关功能。 首先,我们要明白,PHP本身并不直接支持汉字到拼音的转换...
在iOS开发中,获取字符串的首字母是一项常见的需求,尤其在进行数据排序、搜索过滤或者构建索引栏(如联系人应用的A-Z索引)时。本篇将详细讲解如何在Objective-C和Swift这两种主要的iOS编程语言中实现这个功能。 ...
VBA自定义函数__获取字符串首字母拼音.xlsm
这个压缩包文件“安卓A-Z字母排序索引相关-匹配中文字符串的拼音首字母或英文字符串的首字母缩写.rar”很可能包含了一系列实现这一功能的代码示例。 匹配中文字符串的拼音首字母通常涉及到以下知识点: 1. 汉字转...
在Java中实现提取汉语字符串各汉字拼音首字母并将其转换为大写是一项常见的需求,尤其是在处理中文文本数据时。本篇文章将详细介绍如何通过Java代码来实现这一功能,并对相关的知识点进行深入探讨。 #### 一、需求...
在IT领域,特别是编程与文本处理中,获取汉字字符串的拼音首字母是一个常见的需求,尤其在中文信息处理、搜索引擎优化、排序以及数据分类等场景下。本文将详细解析如何通过编码转换和映射表的方式,从汉字字符串中...
- `getAllFirstLetter(String str)`: 用于获取整个字符串中所有汉字的拼音首字母组合。 - `getFirstLetter(String chinese)`: 获取单个汉字的拼音首字母。 - `conversionStr(String str, String charsetName, ...
这时,可以编写一个函数,遍历字符串中的每个字符,分别获取它们的拼音或首字母,然后拼接成新的字符串。 8. **性能考虑** 汉字转拼音的操作可能对性能有一定影响,尤其是在大量数据处理时。因此,优化存储过程和...
为了支持整个字符串中所有汉字的拼音首字母获取,还需要编写一个额外的方法来处理字符串中的每个汉字: ```csharp public static string GetStringSpell(string str) { char[] chars = str.ToCharArray(); string...
在Android开发中,为了实现类似通讯录的快速检索功能,我们常常需要将汉字转换为拼音,以便用户可以通过首字母进行筛选。"安卓获取汉字拼音首字母工具类封装"就是一个这样的解决方案,它提供了一种便捷的方式来处理...
标题“PB自动取字符串(汉字)的拼音首字母”指的是在PowerBuilder(PB)这个编程环境中,实现一个功能,该功能能够将输入的汉字字符串转换为对应的拼音首字母。这在处理汉字数据时非常有用,比如创建关键词索引、搜索...
这篇关于“汉字字符串输出首字母源代码”的主题,主要是探讨如何从汉字字符串中提取出每个汉字的首字母,这对于构建拼音索引或者快速查找汉字具有实用价值。在中文环境下,由于汉字的多样性,直接获取首字母并不像...
在IT领域,尤其是在编程实践中,有时我们需要将汉字字符串转换成其拼音首字母缩写,这在处理中文数据、创建搜索引擎关键词或实现特定的文本处理功能时非常有用。本项目提供了一个小程序及其源码,用于实现这个功能,...
在给定的场景中,我们需要编写C#代码来实现输入一个汉字字符串,然后返回所有对应汉字首字母的匹配序列。 在C#中,我们可以使用第三方库如`Hanyu.Pinyin`或者自己编写算法来实现这个功能。`Hanyu.Pinyin`库可以方便...
在IT行业中,尤其是在开发中文应用时,汉字转拼音和获取首字母是常见的需求。这个示例程序正是针对这一需求而设计的,适用于iOS平台。在iOS应用开发中,可能需要处理用户输入的汉字,将其转化为拼音,以便进行关键词...
在IT行业中,尤其是在数据库管理和开发领域,经常需要处理汉字字符并进行特定的处理,例如获取汉字字符串的首字母。这在实现快速搜索、拼音检索或输入首字完成模糊查询等功能时非常有用。标题中的"获得汉字字符串的...
iOS开发中经常遇到需要根据联系人、好友的昵称首字母来分区显示,但是怎么获取汉字的首字母呢,现在只需简单的4行代码,就可以轻松加愉快的获取汉字的首字母了,更有swift代码、OC代码供你选择
在这个例子中,`Pinyin::init()` 是初始化拼音库的方法,`getFirstChar($str)` 是获取字符串首字符拼音的函数。实际使用时,你需要根据所选库的具体API进行调整。 此外,如果不想引入外部库,也可以自己编写算法来...
在易语言中,可以通过字符串处理函数来实现这一过程,比如通过截取字符串的前一个字符来获取首字母。 下面是一个简单的易语言代码示例,展示如何取汉字首字母: ```易语言 .定义字符串 汉字串, "你好,世界" .定义...