`
huibin
  • 浏览: 757429 次
  • 性别: Icon_minigender_1
  • 来自: 郑州
社区版块
存档分类
最新评论

怎样获取中文字串的首字母?

阅读更多
  1. public class ChineseLetter {   
  2.     // 国标码和区位码转换常量   
  3.     private static final int GB_SP_DIFF = 160;   
  4.     // 存放国标一级汉字不同读音的起始区位码   
  5.     private static final int[] secPosValueList = { 1601163718332078,   
  6.             22742302243325942787310632123472363537223730,   
  7.             385840274086439045584684492552495600 };   
  8.   
  9.     // 存放国标一级汉字不同读音的起始区位码对应读音   
  10.     private static final char[] firstLetter = { 'a''b''c''d''e''f',   
  11.             'g''h''j''k''l''m''n''o''p''q''r''s''t',   
  12.             'w''x''y''z' };   
  13.   
  14.     // 获取一个字符串的拼音码   
  15.     public static String getFirstLetter(String oriStr) {   
  16.         String str = oriStr.toLowerCase();   
  17.         StringBuffer buffer = new StringBuffer();   
  18.         char ch;   
  19.         char[] temp;   
  20.         for (int i = 0; i < str.length(); i++) { // 依次处理str中每个字符   
  21.             ch = str.charAt(i);   
  22.             temp = new char[] { ch };   
  23.             byte[] uniCode = new String(temp).getBytes();   
  24.             if (uniCode[0] < 128 && uniCode[0] > 0) { // 非汉字   
  25.                 buffer.append(temp);   
  26.             } else {   
  27.                 buffer.append(convert(uniCode));   
  28.             }   
  29.         }   
  30.         return buffer.toString();   
  31.     }   
  32.   
  33.     // 获取一个汉字的首字母   
  34.     public static char convert(byte[] bytes) {   
  35.         char result = '-';   
  36.         int secPosValue = 0;   
  37.         int i;   
  38.         for (i = 0; i < bytes.length; i++) {   
  39.             bytes[i] -= GB_SP_DIFF;   
  40.         }   
  41.         secPosValue = bytes[0] * 100 + bytes[1];   
  42.         for (i = 0; i < 23; i++) {   
  43.             if (secPosValue >= secPosValueList[i]   
  44.                     && secPosValue < secPosValueList[i + 1]) {   
  45.                 result = firstLetter[i];   
  46.                 break;   
  47.             }   
  48.         }   
  49.         return result;   
  50.     }   
  51.   
  52.     public static void main(String[] args) {   
  53.         System.out.println(ChineseLetter.getFirstLetter("我是中国人"));   
  54.     }   
  55. }  
public class ChineseLetter {
	// 国标码和区位码转换常量
	private static final int GB_SP_DIFF = 160;
	// 存放国标一级汉字不同读音的起始区位码
	private static final int[] secPosValueList = { 1601, 1637, 1833, 2078,
			2274, 2302, 2433, 2594, 2787, 3106, 3212, 3472, 3635, 3722, 3730,
			3858, 4027, 4086, 4390, 4558, 4684, 4925, 5249, 5600 };

	// 存放国标一级汉字不同读音的起始区位码对应读音
	private static final char[] firstLetter = { 'a', 'b', 'c', 'd', 'e', 'f',
			'g', 'h', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't',
			'w', 'x', 'y', 'z' };

	// 获取一个字符串的拼音码
	public static String getFirstLetter(String oriStr) {
		String str = oriStr.toLowerCase();
		StringBuffer buffer = new StringBuffer();
		char ch;
		char[] temp;
		for (int i = 0; i < str.length(); i++) { // 依次处理str中每个字符
			ch = str.charAt(i);
			temp = new char[] { ch };
			byte[] uniCode = new String(temp).getBytes();
			if (uniCode[0] < 128 && uniCode[0] > 0) { // 非汉字
				buffer.append(temp);
			} else {
				buffer.append(convert(uniCode));
			}
		}
		return buffer.toString();
	}

	// 获取一个汉字的首字母
	public static char convert(byte[] bytes) {
		char result = '-';
		int secPosValue = 0;
		int i;
		for (i = 0; i < bytes.length; i++) {
			bytes[i] -= GB_SP_DIFF;
		}
		secPosValue = bytes[0] * 100 + bytes[1];
		for (i = 0; i < 23; i++) {
			if (secPosValue >= secPosValueList[i]
					&& secPosValue < secPosValueList[i + 1]) {
				result = firstLetter[i];
				break;
			}
		}
		return result;
	}

	public static void main(String[] args) {
		System.out.println(ChineseLetter.getFirstLetter("我是中国人"));
	}
}




输出结果:
wszgr

分享到:
评论

相关推荐

    php获取中文拼音首字母类和函数分享

    php实现获取中文拼音首字母功能,通常用于中文字符转换为对应的拼音缩写。该功能在多种应用场景中非常有用,比如制作中文检索系统、生成中文字符的标签等。根据提供的文件内容,我们可以了解到具体的实现方法和代码...

    PHP制作的中文拼音首字母工具类

    主要介绍了分享一段PHP制作的中文拼音首字母工具类的代码,非常的实用,代码很简单。 注: 英文的字串:不变返回(包括数字) eg .abc123 =&gt; abc123 中文字符串:返回拼音首字符 eg. 测试字符串 =&gt; CSZFC 中英混合...

    汉字字符串拼音排序-QT、C++

    例如,汉字"你好"会转换为"nǐ hǎo",然后我们可以获取首字母"N"和"H"。 对于字符串排序,C++标准库提供了`std::sort`函数,可以对任何可比较的元素进行排序,包括`QString`对象。如果我们已经有了每个字符串的...

    PHP制作的中文拼音首字母工具类.zip

    主要介绍了分享一段PHP制作的中文拼音首字母工具类的代码,非常的实用,代码很简单。 注: 英文的字串:不变返回(包括数字) eg .abc123 =&gt; abc123 中文字符串:返回拼音首字符 eg. 测试字符串 =&gt; ...

    下拉框变成下拉模糊搜索框

    目前的下拉框dropdownlist、select就是简单的选择,如果遇到内容过多会很难找出想找的选项,我用简单的js文件将现在的下拉框改成下拉模糊搜索框,支持汉字拼音首字母模糊匹配和字符串字串匹配,本代码的强大在于扩展...

    一份超级全面的PHP面试题

    9. **中文字串截取**:使用`mb_substr()`函数,配合`mb_internal_encoding()`设定编码,防止乱码。 10. **版本控制软件**:如Git、SVN,用于版本管理和协作开发。 11. **模板引擎**:如Smarty、Twig等,用于分离...

    aspnet公共类cs文件.rar

    中文字符串转换为拼音或者拼音首字母的辅助类(PinYinUtil.cs) 随机汉字辅助类(RandomChinese.cs) 反射操作辅助类,如获取或设置字段、属性的值等反射信息。(ReflectionUtil.cs) 注册表操作辅助类(RegistryHelper...

    WHC第三方控件

    10. 中文字符串转换为拼音或者拼音首字母的辅助类(PinYinUtil.cs) 11. 随机汉字辅助类(RandomChinese.cs) 12. 反射操作辅助类,如获取或设置字段、属性的值等反射信息。(ReflectionUtil.cs) 13. 注册表操作辅助...

    DotNet公用类(超多附文档)

    10.中文字符串转换为拼音或者拼音首字母的辅助类(PinYinUtil.cs) 11.随机汉字辅助类(RandomChinese.cs) 12.反射操作辅助类,如获取或设置字段、属性的值等反射信息。(ReflectionUtil.cs) 13.注册表操作辅助类...

    PRD2021-G10-用例数据字典1

    - **取值范围**:首位不能为0的8位数字串。 - **群公告**:由群主发布的公告,所有群成员可见。 - **数据类型**:字符串 - **数据长度**:500 - **取值范围**:文本信息,长度不超过500个字符。 - **群成员数量*...

    Advanced Bash-Scripting Guide <>

    在目录的所有文件中查找源字串 10-10. 列出目录中所有的符号连接文件 10-11. 将目录中的符号连接文件名保存到一个文件中 10-12. 一个C 风格的for 循环 10-13. 在batch mode 中使用efax 10-14. 简单的while 循环 10-...

Global site tag (gtag.js) - Google Analytics