package info.gy.tools;
import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;
public class PingYinTools {
/**
* 全拼
*
* @param src
* @return
*/
public static String getPingYin(String src) {
char[] t1 = null;
t1 = src.toCharArray();
String[] t2 = new String[t1.length];
HanyuPinyinOutputFormat t3 = new HanyuPinyinOutputFormat();
t3.setCaseType(HanyuPinyinCaseType.LOWERCASE);
t3.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
t3.setVCharType(HanyuPinyinVCharType.WITH_V);
String t4 = "";
int t0 = t1.length;
try {
for (int i = 0; i < t0; i++) {
// 判断是否为汉字字符
if (java.lang.Character.toString(t1[i]).matches(
"[\\u4E00-\\u9FA5]+")) {
t2 = PinyinHelper.toHanyuPinyinStringArray(t1[i], t3);
t4 += t2[0];
} else
t4 += java.lang.Character.toString(t1[i]);
}
// System.out.println(t4);
return t4;
} catch (BadHanyuPinyinOutputFormatCombination e1) {
e1.printStackTrace();
}
return t4;
}
// 返回中文的首字母
/**
* 首字母
*
* @param str
* @return
*/
public static String getPinYinHeadChar(String str) {
String convert = "";
for (int j = 0; j < str.length(); j++) {
char word = str.charAt(j);
String[] pinyinArray = PinyinHelper.toHanyuPinyinStringArray(word);
if (pinyinArray != null) {
convert += pinyinArray[0].charAt(0);
} else {
convert += word;
}
}
return convert;
}
// 将字符串转移为ASCII码
public static String getCnASCII(String cnStr) {
StringBuffer strBuf = new StringBuffer();
byte[] bGBK = cnStr.getBytes();
for (int i = 0; i < bGBK.length; i++) {
strBuf.append(Integer.toHexString(bGBK[i] & 0xff));
}
return strBuf.toString();
}
public static void main(String[] args) {
System.out.println(getPingYin("测试"));
System.out.println(getPinYinHeadChar("测试"));
}
}
分享到:
相关推荐
在IT领域,中文转换成拼音简称和全称是一项常见的任务,尤其在文本处理、搜索引擎优化(SEO)以及自然语言处理(NLP)等场景中。这个压缩包文件"ChinaToPY"显然包含了一个用于实现这一功能的代码库,可能是用Python...
为此,提出了一种自动获取机构全称和简称的方法。根据域名地址获取机构网站首页源代码,从中提取相应机构全称,再结合机构名上下文特征词集合从中提取候选简称,最后计算候选简称与全称的相似度确定最终简称。通过对...
批量获取公司简称或者批量替换关键词
例如:中文简称(中国)英文简称(China) 英文全称(the People's Republic of China) 两字母代码(CN) 三字母代码(CHN) 数字代码(156), 在网上搜罗了好久,真是难得,为了帮助有需要的朋友,节省大家获取资源的时间,...
JSP(全称JavaServer Pages)是由Sun Microsystems公司主导创建的一种动态网页技术标准。JSP部署于网络服务器上,可以响应客户端发送的请求,并根据请求内容动态地生成HTML、XML或其他格式文档的Web网页,然后返回给...
企业全称通常包含了公司的法定名称,而企业简称则是在日常交流和市场推广中更为常见的称呼,两者结合可以帮助我们快速定位和理解公司。例如,“中国移动通信集团有限公司”简称为“中国移动”,便于记忆和传播。 ...
GB 2312-80 是中国国家标准简体中文字符集,全称《信息交换用汉字编码字符集·基本集》,由中国国家标准总局发布,1981年5月1日实施。GB2312 编码通行于中国大陆;新加坡等地也采用此编码。中国大陆几乎所有的中文...
在IT领域,尤其是在文本处理和自然语言处理方面,汉字拼音及首字母unicode码对照库是非常重要的资源。这个压缩包文件提供了超过2万条的汉字、拼音、首字母以及对应的Unicode码,这对于各种与汉字处理相关的应用开发...
JAVA EE,全称为Java Platform, Enterprise Edition,是Java平台企业版的简称,是Oracle公司推出的一种用于构建企业级分布式应用程序的框架。它为开发者提供了在服务器端开发应用程序的一系列标准和API,包括Web组件...
GBK汉字编码是中文字符编码的一种标准,全称为“汉字内码扩展规范”(Gbk,即Great Chinese Binary Code)。它是基于GB2312编码的扩展,兼容GB2312的同时增加了许多GBK独有的字符,总共包含了21004个汉字以及一些...
为此,提出了一种自动获取机构全称和简称的方法。根据域名地址获取机构网站首页源代码,从中提取相应机构全称,再结合机构名上下文特征词集合从中提取候选简称,最后计算候选简称与全称的相似度确定最终简称。通过对...
《汉字拼音对照表》是IT领域中一个基础且重要的资源,尤其对于中文信息处理和编程工作具有很高的实用价值。这份资料包含的是GB2312编码字符集中汉字与拼音的对应关系,帮助用户快速查找汉字的正确读音,或者根据拼音...
包含中国各个省、自治区、直辖市的全称、简称、省会,以及各个县、市、地图的邮编
这份中文网页版的Java API文档为中国的开发者提供了便利,无需通过英文版本来学习和查找API信息,提高了开发效率。 首先,API全称为Application Programming Interface,它是软件系统中提供给开发者使用的预先定义...
全球244个国家英文全称、英文简称、中文简称、经纬度、时差、电话代码等SQL语句
Java API,全称为Java应用程序接口,是Java编程语言的核心组成部分,包含了各种类、接口和异常,为开发者提供了丰富的功能和工具。"Java6中文API"是针对Java 6版本的官方文档,它提供了详细的中文解释,帮助中国...
Java SCJP,全称为Sun Certified Programmer for the Java 2 Platform, Standard Edition,是Oracle公司针对Java初学者和专业开发者的一项认证考试。这个“Java SCJP中文学习指南”旨在帮助中文使用者深入理解Java...
Java API,全称为Java Application Programming Interface,是一组预先定义好的类和接口的集合,它为Java程序员提供了构建软件应用程序的基本工具。Java API包含了各种核心类库,如输入输出、网络通信、多线程、集合...
通过逻辑加工处理后的,用于文本挖掘中排除、筛选地方名。详细包含全称与简称,如:浦东新区,浦东,广西壮族自治区,广西……
在给定的标题"asp汉字生成拼音源码"中,核心知识点是汉字到拼音的转换,这在中文网站的搜索引擎优化(SEO)、文本处理或用户友好URL设计中非常有用。 汉字生成拼音主要是通过特定的算法将汉字转化为对应的汉语拼音...