`
雁栖湖
  • 浏览: 23937 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

汉字转拼音

    博客分类:
  • Java
 
阅读更多
import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;

public class PinYin {
	public static void main(String[] args) {
		System.out.println(getPinYin("王"));
	}
	/**
	 * 将汉字转换为全拼
	 * 
	 * @param src
	 * @return String
	 */
	public static String getPinYin(String src) {
		/*
		 * 解释一下代码: (1).HanyuPinyinOutputFormat,定义汉语拼音的输出形式.
		 * 
		 * (2).HanyuPinyinCaseType,定义汉语拼音的大小写,如: LOWERCASE min2 UPPERCASE MIN2
		 * 
		 * (3).HanyuPinyinToneType,定义音调的显示方式.如: WITH_TONE_MARK dǎ ,带音调
		 * WITH_TONE_NUMBER da3 ,带音调,用12345表示平上去入和轻声 WITHOUT_TONE da ,不带音调
		 * 
		 * (4).HanyuPinyinVCharType,定义'ü' 的显示方式.如: WITH_U_AND_COLON u:
		 * ,u加两点表示,如律师表示为lu:shi WITH_V v ,用字母v表示,这个用搜狗输入法的人想必有些印象.
		 * WITH_U_UNICODE ü
		 * 
		 * (5).input[i]).matches("[\\u4E00-\\u9FA5]+"),这个用来判断是否为中文的.
		 * 
		 * (6).PinyinHelper.toHanyuPinyinStringArray(input[i],
		 * format),这个返回单字的拼音字符串数组.
		 * 如果音调类型为WITH_TONE_NUMBER的话,"张",将返回"zhang1","李",会返回"li4".
		 * 
		 */
		char[] t1 = null;
		t1 = src.toCharArray();
		// System.out.println(t1.length);
		String[] t2 = new String[t1.length];
		// System.out.println(t2.length);
		// 设置汉字拼音输出的格式
		HanyuPinyinOutputFormat t3 = new HanyuPinyinOutputFormat();
		t3.setCaseType(HanyuPinyinCaseType.LOWERCASE);
		t3.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
		t3.setVCharType(HanyuPinyinVCharType.WITH_V);
		String t4 = "";
		int t0 = t1.length;
		try {
			for (int i = 0; i < t0; i++) {
				// 判断能否为汉字字符
				// System.out.println(t1[i]);
				if (Character.toString(t1[i]).matches("[\\u4E00-\\u9FA5]+")) {
					t2 = PinyinHelper.toHanyuPinyinStringArray(t1[i], t3);// 将汉字的几种全拼都存到t2数组中
					t4 += t2[0];// 取出该汉字全拼的第一种读音并连接到字符串t4后
				} else {
					// 如果不是汉字字符,间接取出字符并连接到字符串t4后
					t4 += Character.toString(t1[i]);
				}
			}
		} catch (BadHanyuPinyinOutputFormatCombination e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
		return t4;
	}

	/**
	 * 提取每个汉字的首字母
	 * 
	 * @param str
	 * @return String
	 */
	public static String getPinYinHeadChar(String str) {
		String convert = "";
		for (int j = 0; j < str.length(); j++) {
			char word = str.charAt(j);
			// 提取汉字的首字母
			String[] pinyinArray = PinyinHelper.toHanyuPinyinStringArray(word);
			if (pinyinArray != null) {
				convert += pinyinArray[0].charAt(0);
			} else {
				convert += word;
			}
		}
		return convert.toUpperCase();
	}

	/**
	 * 将字符串转换成ASCII码
	 * 
	 * @param cnStr
	 * @return String
	 */
	public static String getCnASCII(String cnStr) {
		StringBuffer strBuf = new StringBuffer();
		// 将字符串转换成字节序列
		byte[] bGBK = cnStr.getBytes();
		for (int i = 0; i < bGBK.length; i++) {
			// System.out.println(Integer.toHexString(bGBK[i] & 0xff));
			// 将每个字符转换成ASCII码
			strBuf.append(Integer.toHexString(bGBK[i] & 0xff));
		}
		return strBuf.toString();
	}
	
//
//	public static String getPingYin(String src) {
//		char[] t1 = null;
//		t1 = src.toCharArray();
//		String[] t2 = new String[t1.length];
//		HanyuPinyinOutputFormat t3 = new HanyuPinyinOutputFormat();
//		t3.setCaseType(HanyuPinyinCaseType.LOWERCASE);
//		t3.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
//		t3.setVCharType(HanyuPinyinVCharType.WITH_V);
//		String t4 = "";
//		int t0 = t1.length;
//		try {
//			for (int i = 0; i < t0; i++) {
//				// 判断是否为汉字字符
//				if (java.lang.Character.toString(t1[i]).matches(
//						"[\\u4E00-\\u9FA5]+")) {
//					t2 = PinyinHelper.toHanyuPinyinStringArray(t1[i], t3);
//					t4 += t2[0];
//				} else
//					t4 += java.lang.Character.toString(t1[i]);
//			}
//			return t4;
//		} catch (BadHanyuPinyinOutputFormatCombination e1) {
//			e1.printStackTrace();
//		}
//		return t4;
//	}

}

 

分享到:
评论

相关推荐

    C++中文汉字转拼音

    本项目名为"C++中文汉字转拼音",旨在利用C++编程实现一个高效、灵活的汉字转拼音功能。 项目的核心在于使用"拼音-中文"的数据字典。这种设计思路是预先建立一个包含所有汉字及其对应拼音的映射关系,通常以文本...

    汉字转拼音_汉字转拼音Excel_

    标题“汉字转拼音_汉字转拼音Excel_”暗示我们将讨论如何使用Excel中的VBA宏来实现这个功能。VBA是一种内置于Microsoft Office套件中的编程语言,允许用户自定义工作簿的行为,包括自动化任务、创建复杂的公式以及...

    中文汉字转拼音 大写(默认) 小写 首字母大写

    在IT领域,中文汉字转拼音是一项常见的处理任务,特别是在自然语言处理、文本分析以及编程中。这个任务的主要目的是将汉字转换成对应的汉语拼音,以便计算机能够更好地理解和处理中文信息。以下将详细介绍汉字转拼音...

    postgreSQL 拼音字库 汉字转拼音 8.4

    网上传的postgreSQL汉字转拼音的方法,是针对9.3的版本(相信你要是8.4的也搜到了但不能直接用,才来看我的),尝试了8.4的版本来做拼音处理。发现网上的《postgreSQL汉字转拼音》里面坑比较多,尝试纠正了一下,发...

    Mysql中文汉字转拼音的实现(每个汉字转换全拼)

    在MySQL中实现中文汉字转拼音的功能,主要是为了方便在数据库查询和数据分析时处理中文文本,尤其是在没有全文索引或者需要进行复杂模糊匹配时。以下是一个简单的实现方法,它利用自定义函数来完成这一任务。 首先...

    C#汉字转拼音(npinyin)将中文转换成拼音全文或首字母

    例如,如果一个程序需要对中文字符进行排序,或者在没有输入法的情况下通过英文键盘输入中文,汉字转拼音就显得尤为重要。 "C#汉字转拼音(npinyin)"是一个C#库,它提供了一个方便的方式来将汉字转换为对应的汉语...

    JavaScript中文转拼音,JS中文转拼音插件,中文转拼音(JavaScript)

    标签中的"URL拼音化"强调了这个插件在生成拼音URL上的应用场景,而"JS中文转拼音插件"和"中文转拼音"则表明该插件专注于这个功能,并且是用JavaScript编写的。 总之,这个压缩包提供的JavaScript插件是一个实用的...

    delphi 汉字转拼音组件

    在处理中文字符时,尤其是在需要进行汉字与拼音转换的场景下,Delphi 汉字转拼音组件显得尤为重要。本文将深入探讨这款组件的功能、应用及其在Delphi7环境下的使用方法。 首先,我们要明确这款组件的核心功能——将...

    表格汉字转拼音_汉字转拼音_

    汉字转拼音是将中文字符转化为其对应的普通话读音的过程。在计算机系统中,汉字通常以Unicode编码存储,而拼音则是一种基于拉丁字母的表示方式,便于计算机处理和搜索。这项技术主要依赖于汉字拼音库,这些库包含了...

    delphi12 汉字转拼音全拼及简拼 XE

    汉字转拼音是计算机处理中文文本的重要一环。全拼是指将汉字转换为完整的汉语拼音,而简拼则是用简化的形式表示汉字,通常只包含声母和韵母,不包括声调。在Delphi 12 XE中,我们可以利用内置的TCharServices组件...

    汉字转拼音Delphi代码, 在Delphi2010下也可以实现

    本主题聚焦于在Delphi环境下实现汉字转拼音的功能,这是一个常见的需求,尤其是在处理中文字符、语音合成或者搜索引擎优化时。对于Delphi 7 和 Delphi 2010 这两个不同版本,由于它们之间的编码差异,代码可能需要...

    DelPhi中文转拼音,全拼和首字母

    标题中的"Delphi中文转拼音,全拼和首字母"是指使用Delphi编程语言开发的一个功能,该功能能够将输入的中文文本转化为对应的拼音表示,包括全拼(每个汉字转化为完整的拼音)和首字母(每个汉字转化为声母,即汉语...

    汉字转拼音C++源代码

    汉字转拼音是将中文汉字转化为对应的汉语拼音的过程。在计算机处理中文时,由于计算机内部主要处理ASCII编码,而汉字属于Unicode或GBK等多字节编码,因此需要将汉字转换为拼音以便进行进一步的处理。这个转换过程...

    oracle汉字转拼音package包-支持UTF8

    总的来说,这个"oracle汉字转拼音package包-支持UTF8"是一个非常实用的工具,可以帮助我们在Oracle数据库环境中有效地处理汉字到拼音的转换问题,尤其适用于处理UTF8编码的多语言数据。正确理解和使用这个Package,...

    Java汉字转拼音(支持多音字)

    这个"Java汉字转拼音(支持多音字)"的主题涉及了如何在Java环境中实现这一功能,特别是考虑到中文的多音字特性。 多音字是指一个汉字有多个读音,其读音取决于它在特定语境中的含义。例如,“打”字可以读作“dǎ...

    SQL 汉字转拼音首字母

    ### SQL汉字转拼音首字母知识点解析 #### 一、背景介绍 在数据库处理过程中,有时候我们需要将汉字转换为对应的拼音,特别是在中文环境下的数据检索、排序等操作中,这种需求尤为常见。本篇文章将深入探讨如何利用...

    Qt 汉字转拼音与首字母

    当我们处理中文字符时,有时需要将汉字转换为拼音或提取其首字母,这在比如搜索、排序或生成缩略词时非常有用。本教程将深入讲解如何在Qt环境中利用C++实现汉字到拼音和首字母的转换。 首先,要进行汉字转拼音,...

    oracle汉字转拼音函数整理大全

    ### Oracle汉字转拼音函数知识点详解 #### 一、概述 在Oracle数据库中,有时需要将汉字转换成拼音,尤其是在处理中文数据时。本篇文档详细介绍了两种用于转换汉字到拼音的自定义函数:`fn_getpyKGJG` 和 `fn_...

    关于汉字转拼音的实现方法.rar(简单方便实用)

    汉字转拼音是计算机处理中文文本时常见的需求,尤其在语音合成、搜索引擎索引、自动文本标注等领域有着广泛应用。本资源提供了实现这一功能的必要组件和详细步骤,旨在帮助开发者快速理解并实施汉字转拼音功能。 ...

    java汉字转拼音,android汉字转拼音,汉字转拼音首字母,汉字转ASCII

    以上就是关于“java汉字转拼音,android汉字转拼音,汉字转拼音首字母,汉字转ASCII”的技术要点。在实际应用中,根据需求选择合适的转换方式,并注意处理可能出现的异常情况,如多音字、非ASCII字符等。在处理大量...

Global site tag (gtag.js) - Google Analytics