`
wj.geyuan
  • 浏览: 14736 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

java获取中文的全称和简称的拼音

    博客分类:
  • java
阅读更多
package info.gy.tools;

import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;

public class PingYinTools {
	/**
	 * 全拼
	 * 
	 * @param src
	 * @return
	 */
	public static String getPingYin(String src) {

		char[] t1 = null;
		t1 = src.toCharArray();
		String[] t2 = new String[t1.length];
		HanyuPinyinOutputFormat t3 = new HanyuPinyinOutputFormat();

		t3.setCaseType(HanyuPinyinCaseType.LOWERCASE);
		t3.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
		t3.setVCharType(HanyuPinyinVCharType.WITH_V);
		String t4 = "";
		int t0 = t1.length;
		try {
			for (int i = 0; i < t0; i++) {
				// 判断是否为汉字字符
				if (java.lang.Character.toString(t1[i]).matches(
						"[\\u4E00-\\u9FA5]+")) {
					t2 = PinyinHelper.toHanyuPinyinStringArray(t1[i], t3);
					t4 += t2[0];
				} else
					t4 += java.lang.Character.toString(t1[i]);
			}
			// System.out.println(t4);
			return t4;
		} catch (BadHanyuPinyinOutputFormatCombination e1) {
			e1.printStackTrace();
		}
		return t4;
	}

	// 返回中文的首字母
	/**
	 * 首字母
	 * 
	 * @param str
	 * @return
	 */
	public static String getPinYinHeadChar(String str) {

		String convert = "";
		for (int j = 0; j < str.length(); j++) {
			char word = str.charAt(j);
			String[] pinyinArray = PinyinHelper.toHanyuPinyinStringArray(word);
			if (pinyinArray != null) {
				convert += pinyinArray[0].charAt(0);
			} else {
				convert += word;
			}
		}
		return convert;
	}

	// 将字符串转移为ASCII码
	public static String getCnASCII(String cnStr) {
		StringBuffer strBuf = new StringBuffer();
		byte[] bGBK = cnStr.getBytes();
		for (int i = 0; i < bGBK.length; i++) {
			strBuf.append(Integer.toHexString(bGBK[i] & 0xff));
		}
		return strBuf.toString();
	}

	public static void main(String[] args) {
		System.out.println(getPingYin("测试"));
		System.out.println(getPinYinHeadChar("测试"));
	}

}

分享到:
评论

相关推荐

    中文转换成拼音简称和全称

    在IT领域,中文转换成拼音简称和全称是一项常见的任务,尤其在文本处理、搜索引擎优化(SEO)以及自然语言处理(NLP)等场景中。这个压缩包文件"ChinaToPY"显然包含了一个用于实现这一功能的代码库,可能是用Python...

    论文研究-基于网页信息和分词的中文机构名全称和简称提取方法.pdf

    为此,提出了一种自动获取机构全称和简称的方法。根据域名地址获取机构网站首页源代码,从中提取相应机构全称,再结合机构名上下文特征词集合从中提取候选简称,最后计算候选简称与全称的相似度确定最终简称。通过对...

    批量获取公司简称或者批量替换关键词.xlsm

    批量获取公司简称或者批量替换关键词

    全球244个国家和地区名称全称和简称以及代码信息列表

    例如:中文简称(中国)英文简称(China) 英文全称(the People's Republic of China) 两字母代码(CN) 三字母代码(CHN) 数字代码(156), 在网上搜罗了好久,真是难得,为了帮助有需要的朋友,节省大家获取资源的时间,...

    JSP(全称JavaServer Pages)

    JSP(全称JavaServer Pages)是由Sun Microsystems公司主导创建的一种动态网页技术标准。JSP部署于网络服务器上,可以响应客户端发送的请求,并根据请求内容动态地生成HTML、XML或其他格式文档的Web网页,然后返回给...

    2019上市公司名录.rar

    企业全称通常包含了公司的法定名称,而企业简称则是在日常交流和市场推广中更为常见的称呼,两者结合可以帮助我们快速定位和理解公司。例如,“中国移动通信集团有限公司”简称为“中国移动”,便于记忆和传播。 ...

    Java代码实现随机生成汉字的方法

    GB 2312-80 是中国国家标准简体中文字符集,全称《信息交换用汉字编码字符集·基本集》,由中国国家标准总局发布,1981年5月1日实施。GB2312 编码通行于中国大陆;新加坡等地也采用此编码。中国大陆几乎所有的中文...

    汉字拼音及首字母unicode码对照库(2万多条)

    在IT领域,尤其是在文本处理和自然语言处理方面,汉字拼音及首字母unicode码对照库是非常重要的资源。这个压缩包文件提供了超过2万条的汉字、拼音、首字母以及对应的Unicode码,这对于各种与汉字处理相关的应用开发...

    JAVA EE中文文档

    JAVA EE,全称为Java Platform, Enterprise Edition,是Java平台企业版的简称,是Oracle公司推出的一种用于构建企业级分布式应用程序的框架。它为开发者提供了在服务器端开发应用程序的一系列标准和API,包括Web组件...

    gbk汉字编码拼音对照表21004个字全.zip

    GBK汉字编码是中文字符编码的一种标准,全称为“汉字内码扩展规范”(Gbk,即Great Chinese Binary Code)。它是基于GB2312编码的扩展,兼容GB2312的同时增加了许多GBK独有的字符,总共包含了21004个汉字以及一些...

    基于网页信息和分词的中文机构名全称和简称提取方法 (2017年)

    为此,提出了一种自动获取机构全称和简称的方法。根据域名地址获取机构网站首页源代码,从中提取相应机构全称,再结合机构名上下文特征词集合从中提取候选简称,最后计算候选简称与全称的相似度确定最终简称。通过对...

    汉字拼音对照表

    《汉字拼音对照表》是IT领域中一个基础且重要的资源,尤其对于中文信息处理和编程工作具有很高的实用价值。这份资料包含的是GB2312编码字符集中汉字与拼音的对应关系,帮助用户快速查找汉字的正确读音,或者根据拼音...

    全国各省市全称、简称、省会城市及邮编代码

    包含中国各个省、自治区、直辖市的全称、简称、省会,以及各个县、市、地图的邮编

    Java API文档 中文网页版

    这份中文网页版的Java API文档为中国的开发者提供了便利,无需通过英文版本来学习和查找API信息,提高了开发效率。 首先,API全称为Application Programming Interface,它是软件系统中提供给开发者使用的预先定义...

    全球244个国家英文全称、英文简称、中文简称、经纬度、时差、电话代码等SQL

    全球244个国家英文全称、英文简称、中文简称、经纬度、时差、电话代码等SQL语句

    Java6中文API

    Java API,全称为Java应用程序接口,是Java编程语言的核心组成部分,包含了各种类、接口和异常,为开发者提供了丰富的功能和工具。"Java6中文API"是针对Java 6版本的官方文档,它提供了详细的中文解释,帮助中国...

    Java SCJP中文学习指南

    Java SCJP,全称为Sun Certified Programmer for the Java 2 Platform, Standard Edition,是Oracle公司针对Java初学者和专业开发者的一项认证考试。这个“Java SCJP中文学习指南”旨在帮助中文使用者深入理解Java...

    java api中文/英文

    Java API,全称为Java Application Programming Interface,是一组预先定义好的类和接口的集合,它为Java程序员提供了构建软件应用程序的基本工具。Java API包含了各种核心类库,如输入输出、网络通信、多线程、集合...

    中国省-市-县名称集合(包括全称与简称)

    通过逻辑加工处理后的,用于文本挖掘中排除、筛选地方名。详细包含全称与简称,如:浦东新区,浦东,广西壮族自治区,广西……

    asp汉字生成拼音源码

    在给定的标题"asp汉字生成拼音源码"中,核心知识点是汉字到拼音的转换,这在中文网站的搜索引擎优化(SEO)、文本处理或用户友好URL设计中非常有用。 汉字生成拼音主要是通过特定的算法将汉字转化为对应的汉语拼音...

Global site tag (gtag.js) - Google Analytics