`

java汉字转拼音或首字母,手写版非pinyin4j,可排除例外

    博客分类:
  • JAVA
阅读更多
package com.anxin.ssk.common;

import java.io.UnsupportedEncodingException;
import java.util.HashMap;
import java.util.Map;
import java.util.Map.Entry;

/**
 * 取得给定汉字串的首字母串,即声母串 Title: ChineseCharToEn
 * 
 * @author: (le.qiao)
 * @e-mail: qiaolevip@gmail.com
 * @myblog: <a href="http://qiaolevip.iteye.com">http://qiaolevip.iteye.com</a>
 * @date: 2014-1-15 注:只支持GB2312字符集中的汉字
 * 
 */
public class LetterUtil {

	private final static int[] li_SecPosValue = { 1601, 1637, 1833, 2078, 2274, 2302, 2433, 2594, 2787, 3106, 3212, 3472, 3635, 3722, 3730, 3858, 4027, 4086,
			4390, 4558, 4684, 4925, 5249, 5590 };

	private final static String[] lc_FirstLetter = { "a", "b", "c", "d", "e", "f", "g", "h", "j", "k", "l", "m", "n", "o", "p", "q", "r", "s", "t", "w", "x",
			"y", "z" };

	/**
	 * 取得给定汉字串的首字母串,即声母串
	 * 
	 * @param str 给定汉字串
	 * @return 声母串
	 */
	public static String getAllFirstLetter(String str) {
		if (str == null || str.trim().length() == 0) {
			return "";
		}

		String _str = "";
		for (int i = 0; i < str.length(); i++) {
			_str = _str + getFirstLetter(str.substring(i, i + 1));
		}

		return _str;
	}

	/**
	 * 取得给定汉字的首字母,即声母
	 * 
	 * @param chinese 给定的汉字
	 * @return 给定汉字的声母
	 */
	public static String getFirstLetter(String chinese) {
		if (chinese == null || chinese.trim().length() == 0) {
			return "";
		}
		chinese = conversionStr(chinese, "GB2312", "ISO8859-1");

		if (chinese.length() > 1) // 判断是不是汉字
		{
			int li_SectorCode = (int) chinese.charAt(0); // 汉字区码
			int li_PositionCode = (int) chinese.charAt(1); // 汉字位码
			li_SectorCode = li_SectorCode - 160;
			li_PositionCode = li_PositionCode - 160;
			int li_SecPosCode = li_SectorCode * 100 + li_PositionCode; // 汉字区位码
			if (li_SecPosCode > 1600 && li_SecPosCode < 5590) {
				for (int i = 0; i < 23; i++) {
					if (li_SecPosCode >= li_SecPosValue[i] && li_SecPosCode < li_SecPosValue[i + 1]) {
						chinese = lc_FirstLetter[i];
						break;
					}
				}
			} else // 非汉字字符,如图形符号或ASCII码
			{
				chinese = conversionStr(chinese, "ISO8859-1", "GB2312");
				chinese = chinese.substring(0, 1);
				Map<String, String> exceptWords = new HashMap<String, String>();
// 欢迎大家补充说明~欢迎大家补充说明~欢迎大家补充说明
				exceptWords.put("a", "庵");
				exceptWords.put("g", "崮");
				exceptWords.put("l", "崂");
				exceptWords.put("j", "泾");
				exceptWords.put("r", "榕");
				exceptWords.put("x", "鑫");
				exceptWords.put("y", "懿");
				exceptWords.put("z", "梓");

				for (Entry<String, String> letterSet : exceptWords.entrySet()) {
					if (letterSet.getValue().indexOf(chinese) != -1) {
						chinese = letterSet.getKey();
						break;
					}
				}
			}
		}

		return chinese;
	}

	/**
	 * 字符串编码转换
	 * 
	 * @param str 要转换编码的字符串
	 * @param charsetName 原来的编码
	 * @param toCharsetName 转换后的编码
	 * @return 经过编码转换后的字符串
	 */
	private static String conversionStr(String str, String charsetName, String toCharsetName) {
		try {
			str = new String(str.getBytes(charsetName), toCharsetName);
		} catch (UnsupportedEncodingException ex) {
			System.out.println("字符串编码转换异常:" + ex.getMessage());
		}
		return str;
	}

	public static void main(String[] args) {
		System.out.println("获取拼音首字母:" + LetterUtil.getAllFirstLetter("泾崂"));
		String address = "(金浜小区)栖山路1689弄";
		address = address.substring(address.indexOf(")") + 1);
		System.out.println("获取拼音首字母:" + LetterUtil.getFirstLetter(address));
	}
}

 

分享到:
评论

相关推荐

    汉字转拼音大小写全拼首字母pinyin4j-jar

    《汉字转拼音:pinyin4j-jar工具详解》 在信息技术领域,处理中文字符时,经常需要将汉字转换为拼音,以便进行各种文本处理任务,如搜索、语音合成等。pinyin4j是一个广泛使用的Java库,专门用于实现这个功能。本文...

    汉字转拼音、首字母、多音字java

    总的来说,Java中的汉字转拼音、首字母获取以及多音字处理主要依赖于像`pinyin4j`这样的第三方库,它们提供了丰富的功能,使得开发者能方便地进行中文字符的拼音处理。在实际项目中,正确理解和运用这些工具,可以...

    java汉字转拼音,android汉字转拼音,汉字转拼音首字母,汉字转ASCII

    以上就是关于“java汉字转拼音,android汉字转拼音,汉字转拼音首字母,汉字转ASCII”的技术要点。在实际应用中,根据需求选择合适的转换方式,并注意处理可能出现的异常情况,如多音字、非ASCII字符等。在处理大量...

    java汉字转拼音(全拼和首字母)

    在Java编程语言中,汉字转拼音是一项常见的需求,特别是在处理中文数据、搜索引擎优化或文本处理等领域。本篇文章将深入探讨如何使用Java实现汉字转拼音的功能,包括获取汉字的全拼和首字母。 首先,我们需要理解...

    pinyin4j-2.5.0.jar 下载 java汉字转拼音 jar包 附带超级简单小dome

    总的来说,pinyin4j-2.5.0.jar是一个强大且易用的Java库,它极大地简化了汉字与拼音之间的转换过程,是处理中文字符问题时不可或缺的工具。通过合理利用这个库,开发者可以更高效地实现各种基于拼音的业务逻辑,提升...

    pinyin4j-2.5.0.jar 中文转化拼音,获取首字母

    《pinyin4j-2.5.0.jar:中文转换拼音与获取首字母的利器》 在处理中文数据时,有时我们需要将汉字转化为拼音,以便进行关键词检索、数据分析或者构建搜索引擎。这时,一个强大的工具库就能派上用场,那就是pinyin4j...

    [pinyin4j]java版汉字转换拼音大小写

    ### pinyin4j:Java版汉字转换拼音大小写 #### 概述 本文档主要介绍如何使用`pinyin4j`库实现Java程序中的汉字到拼音的转换,并着重讲解如何控制转换后拼音的大小写形式。`pinyin4j`是一款功能强大的开源库,能够...

    java拼音搜索pinyin4j

    总的来说,"java拼音搜索pinyin4j"这个项目结合了Java Web开发的基础知识和汉字拼音处理的专业工具,通过Servlet三层架构实现了一个高效的中文搜索功能。开发者可以在这个基础上进一步扩展,如增加拼音排序、语音...

    中文转拼音工具类,pinyin4j-2.5.0.jar 适用于地址人名

    《中文转拼音工具类——pinyin4j-2.5.0.jar 在处理地址与人名中的应用》 在处理中文数据时,有时我们需要将汉字转换为拼音,以便进行搜索、排序或者国际化处理。这时,一个高效且准确的中文转拼音工具显得尤为重要...

    Qt 汉字转拼音与首字母

    当我们处理中文字符时,有时需要将汉字转换为拼音或提取其首字母,这在比如搜索、排序或生成缩略词时非常有用。本教程将深入讲解如何在Qt环境中利用C++实现汉字到拼音和首字母的转换。 首先,要进行汉字转拼音,...

    汉语转换成拼音的jar包pinyin4j-2.5.0版本

    例如,对于汉字"好",`pinyin4j`可以输出"haο"(无声调形式)或"hǎo"(带声调形式)。同时,对于一个多音字如"乐",它可以分别输出"lè"(快乐的乐)和"yuè"(音乐的乐)。 在实际项目中,使用`pinyin4j`通常有...

    汉字转拼音jar包_pinyin4j(java)

    `pinyin4j`是由Barry Zhang开发的一个开源项目,它提供了一套简洁的API,使得在Java或Android项目中集成汉字转拼音功能变得简单。该库不仅适用于标准Java环境,还兼容Android平台,因此在移动开发中也十分适用。 要...

    pinyin4j的简化版 汉字转成拼音

    《汉字转拼音:pinyin4j的简化版详解》 在中文信息处理领域,将汉字转化为拼音是一项基础且重要的任务,广泛应用于搜索引擎、输入法、语音识别等多个场景。pinyin4j是一个广受欢迎的Java库,它提供了高效、便捷的...

    Android 安卓 汉字转拼音, 联系人字母索引 pinyinHelper pinyin4j-2.5.0.jar

    `pinyin4j` 是一个开源项目,主要用于Java程序中的汉字转拼音功能。它的版本号为2.5.0,提供了全面的拼音转换支持,包括全拼、简拼、声调等。在Android开发中,由于Android系统主要基于Java,因此可以很方便地引入`...

    汉字转拼音java pinyin4j-2.5.0.jar

    总的来说,`pinyin4j-2.5.0.jar`是一个强大而易用的Java拼音工具,对于需要处理中文字符的应用来说,它是一个不可或缺的助手。通过理解和熟练运用这个库,开发者可以更高效地实现汉字与拼音之间的转换,提高程序的...

    汉字转换拼音 java

    Pinyin4j库同样支持获取拼音首字母,例如: ```java char ch = '汉'; String pinyinFirstLetter = PinyinHelper.toHanyuPinyinStringArray(ch)[0].substring(0, 1).toUpperCase(); System.out.println...

    Java汉字转拼音(支持多音字)

    在解压缩后的文件列表中提到的“Hanyupinyin”,很可能是包含了`Pinyin4j`库的JAR文件或其他相关的资源,这些资源可以帮助开发者在本地环境中实现汉字转拼音的功能。如果需要更深入地研究或定制功能,可以查看`...

    汉字转全拼音或拼音首字母,支持gb2312和utf8编码

    汉字转全拼音或拼音首字母,支持gb2312和utf8编码 ,附带函数说明, 汉字转换为全拼音或拼音首字母 使用方法: include(ROOT_PATH.'includes/cls_chart_pinyin.php'); echo Pinyin('中国人','utf-8',false); 函数...

    postgresql汉字转拼音首字母函数

    支持2万+汉字转拼音首字母

Global site tag (gtag.js) - Google Analytics