目前网上公布的获取汉字首字母方法,一般情况下是没有问题的,但有些特殊的汉字无法获得首字母,比如说“戬”“浜”2字就很难取到首字母,不知道问题出在哪里。
我使用的类如下:
import java.io.UnsupportedEncodingException;
/** */
/**
* 取得给定汉字串的首字母串,即声母串
* <p>Title: ChineseCharToEn</p>
* <p>@author javer QQ:84831612</p>
*
* @version 1.0
* @date 2004-02-19
* 注:只支持GB2312字符集中的汉字
*/
public final class ChineseCharToEn {
private final static int[] li_SecPosValue =
{
1601, 1637, 1833, 2078, 2274, 2302, 2433, 2594, 2787, 3106, 3212, 3472,
3635, 3722, 3730, 3858, 4027, 4086, 4390, 4558, 4684, 4925, 5249, 5590
};
private final static String[] lc_FirstLetter =
{
"a", "b", "c", "d", "e", "f", "g", "h", "j", "k", "l", "m", "n", "o", "p",
"q", "r", "s", "t", "w", "x", "y", "z"
};
/** */
/**
* 取得给定汉字串的首字母串,即声母串
*
* @param str 给定汉字串
* @return 声母串
*/
public String getAllFirstLetter(String str) {
if (str == null || str.trim().length() == 0) {
return "";
}
String _str = "";
for (int i = 0; i < str.length(); i++) {
_str = _str + this.getFirstLetter(str.substring(i, i + 1));
}
return _str;
}
/** */
/**
* 取得给定汉字的首字母,即声母
*
* @param chinese 给定的汉字
* @return 给定汉字的声母
*/
public String getFirstLetter(String chinese) {
if (chinese == null || chinese.trim().length() == 0) {
return "";
}
chinese = this.conversionStr(chinese, "GBK", "ISO8859-1");
if (chinese.length() > 1) //判断是不是汉字
{
int li_SectorCode = (int) chinese.charAt(0); //汉字区码
int li_PositionCode = (int) chinese.charAt(1); //汉字位码
li_SectorCode = li_SectorCode - 160;
li_PositionCode = li_PositionCode - 160;
int li_SecPosCode = li_SectorCode * 100 + li_PositionCode; //汉字区位码
if (li_SecPosCode > 1600 && li_SecPosCode < 5590) {
for (int i = 0; i < 23; i++) {
if (li_SecPosCode >= li_SecPosValue[i] &&
li_SecPosCode < li_SecPosValue[i + 1]) {
chinese = lc_FirstLetter[i];
break;
}
}
} else //非汉字字符,如图形符号或ASCII码
{
chinese = this.conversionStr(chinese, "ISO8859-1", "GBK");
chinese = chinese.substring(0, 1);
}
}
return chinese;
}
/** */
/**
* 字符串编码转换
*
* @param str 要转换编码的字符串
* @param charsetName 原来的编码
* @param toCharsetName 转换后的编码
* @return 经过编码转换后的字符串
*/
private String conversionStr(String str, String charsetName, String toCharsetName) {
try {
str = new String(str.getBytes(charsetName), toCharsetName);
}
catch (UnsupportedEncodingException ex) {
System.out.println("字符串编码转换异常:" + ex.getMessage());
}
return str;
}
public static void main(String[] args) {
ChineseCharToEn cte = new ChineseCharToEn();
System.out.println("'夜未眠'的首个拼音字母是:" + cte.getFirstLetter("夜未眠"));
System.out.println("'Javer夜未眠'的首个拼音字母是:" + cte.getFirstLetter("Javer夜未眠"));
System.out.println("'戬浜供销社'的全部字母的拼音字母是:" + cte.getAllFirstLetter("戬浜供销社"));
}
}
分享到:
相关推荐
在中文字符集中,每个汉字都有对应的拼音表示,而首字母就是这个拼音的首字符。例如,汉字“你好”对应的拼音是“nǐ hǎo”,其首字母分别为“n”和“h”。易语言要实现取汉字首字母的功能,通常会通过以下步骤: ...
在C#编程中,处理汉字首字母,尤其是包含多音字的情况,是一项常见的任务。这主要涉及到汉字拼音处理,特别是多音字的匹配。多音字是指一个汉字有多个读音,例如“重”字就有“zhòng”和“chóng”两种发音。在给定...
对于需要进行中文文本检索、排序等操作的应用来说,能够快速提取汉字的拼音首字母是一种高效的方法。下面将对提供的VB代码进行详细解读,并深入探讨其中的关键知识点。 #### 一、函数概述 该代码段提供了两个函数...
在JavaScript编程语言中,汉字首字母的提取是一个常见的需求,特别是在中文数据处理、搜索关键词简化或者拼音排序等场景。这个话题涉及到JavaScript字符串处理、Unicode编码以及多音字识别。下面我们将详细探讨这些...
这个"用来获取汉字首字母的jar包"显然提供了一个解决方案,它能够帮助我们快速地将汉字转换为对应的拼音首字母,从而实现基于拼音首字母的查询功能。 首先,我们要理解汉字到拼音转换的基本概念。在中国,每个汉字...
在数据库表中没有录入汉字对应的拼音首字母的情况下,进行汉字拼音首字母搜索,下载文本后 直接在mysql中执行,后就可实现根据拼音搜索功能
在IT行业中,尤其是在开发中文应用时,汉字转拼音和获取首字母是常见的需求。这个示例程序正是针对这一需求而设计的,适用于iOS平台。在iOS应用开发中,可能需要处理用户输入的汉字,将其转化为拼音,以便进行关键词...
在Java编程中,提取汉字首字母是一项常见的任务,特别是在处理汉字数据、建立索引或进行拼音搜索时。这个任务涉及到字符编码、Unicode和中文字符处理。以下是对这一知识点的详细阐述: 1. **字符编码**:汉字在...
在本项目"Qt提取汉字拼音首字母"中,我们将探讨如何利用Qt来处理汉字与拼音之间的转换,特别是在获取汉字的拼音首字母方面。 首先,我们需要理解汉字与拼音的关系。汉字是中文的主要书写系统,而拼音是用拉丁字母来...
### C# 中获取汉字首字母的方法 在许多应用程序中,我们常常需要对数据进行排序或检索,特别是当涉及到中文字符时。例如,在通讯录应用中,我们可能希望根据联系人的姓名首字母进行快速查找。为了实现这样的功能,...
使用wf.makyPy("可以得倒首字母"),需要jquery
### Java中实现汉字首字母转为大写的技巧与方法 #### 概述 在Java编程中,有时我们需要处理中文字符,并将其转换成特定格式。例如,我们可能希望将一个中文姓名转换成其拼音首字母的大写形式。这种需求在很多场景...
获取汉字首字母代码是一项在处理中文信息时经常用到的技术,其核心在于正确理解汉字编码并运用适当的工具或算法进行转换。虽然示例代码提供了一种基础的实现思路,但在实际应用中应考虑采用更成熟、更准确的解决方案...
在IT领域,特别是编程与文本处理中,获取汉字字符串的拼音首字母是一个常见的需求,尤其在中文信息处理、搜索引擎优化、排序以及数据分类等场景下。本文将详细解析如何通过编码转换和映射表的方式,从汉字字符串中...
在线中英文根据首字母排序工具: http://tools.jb51.net/aideddesign/zh_paixu 您可能感兴趣的文章:mysql的中文数据按拼音排序的2个方法mysql如何按照中文排序解决方案MySQL按照汉字的拼音排序简单实例
在IT行业中,尤其是在前端开发和文本处理领域,获取汉字首字母是一项常见的需求。这主要用在拼音检索、关键词提取、数据分析等多种场景。标题中的“获取汉字首字母”指的是编写一个程序或函数,能够将汉字转化为对应...
Oracle查询取汉字拼音首字母Function
标题“数据库获取中文首字母自定义函数(字母查汉字模糊查询)”指的是在数据库系统中定义一个函数,该函数能接受用户输入的英文首字母,然后返回所有以该首字母为拼音首字母的中文字段。这种功能对于具有大量中文...
MFC中汉字首字母提取方法 在MFC中实现汉字首字母提取功能是一个常见的需求,下面我们将详细介绍如何使用MFC来实现这个功能。 首先,需要了解汉字的编码方式。在 Unicode 中,汉字的编码范围从 0x4E00 到 0x9FA5,...
标题中的“使用javascript获取汉字首字母”指的是在JavaScript编程环境下,通过特定的算法或方法来获取汉字字符的拼音首字母。这种方法通常用于实现中文字符的排序、搜索优化或其他需要基于拼音处理汉字的场景。 在...