`

PingYin4J工具类

 
阅读更多
package com.hoss.core.util;

import java.util.Arrays;

import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;


public class PinYin4jUtils {
/**
* 将字符串转换成拼音数组
*
* @param src
* @return
*/
public static String[] stringToPinyin(String src) {
return stringToPinyin(src, false, null);
}

/**
* 将字符串转换成拼音数组
*
* @param src
* @return
*/
public static String[] stringToPinyin(String src, String separator) {

return stringToPinyin(src, true, separator);
}

/**
* 将字符串转换成拼音数组
*
* @param src
* @param isPolyphone
*            是否查出多音字的所有拼音
* @param separator
*            多音字拼音之间的分隔符
* @return
*/
public static String[] stringToPinyin(String src, boolean isPolyphone,
String separator) {
// 判断字符串是否为空
if ("".equals(src) || null == src) {
return null;
}
char[] srcChar = src.toCharArray();
int srcCount = srcChar.length;
String[] srcStr = new String[srcCount];

for (int i = 0; i < srcCount; i++) {
srcStr[i] = charToPinyin(srcChar[i], isPolyphone, separator);
}
return srcStr;
}

/**
* 将单个字符转换成拼音
*
* @param src
* @return
*/
public static String charToPinyin(char src, boolean isPolyphone,
String separator) {
// 创建汉语拼音处理类
HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
// 输出设置,大小写,音标方式
defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);

StringBuffer tempPinying = new StringBuffer();

// 如果是中文
if (src > 128) {
try {
// 转换得出结果
String[] strs = PinyinHelper.toHanyuPinyinStringArray(src,
defaultFormat);

// 是否查出多音字,默认是查出多音字的第一个字符
if (isPolyphone && null != separator) {
for (int i = 0; i < strs.length; i++) {
tempPinying.append(strs[i]);
if (strs.length != (i + 1)) {
// 多音字之间用特殊符号间隔起来
tempPinying.append(separator);
}
}
} else {
tempPinying.append(strs[0]);
}

} catch (BadHanyuPinyinOutputFormatCombination e) {
e.printStackTrace();
}
} else {
tempPinying.append(src);
}

return tempPinying.toString();

}

public static String hanziToPinyin(String hanzi) {
return hanziToPinyin(hanzi, " ");
}

/**
* 将汉字转换成拼音
*
* @param hanzi
* @param separator
* @return
*/
public static String hanziToPinyin(String hanzi, String separator) {

// 创建汉语拼音处理类
HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
// 输出设置,大小写,音标方式
defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);

String pinyingStr = "";
try {
pinyingStr = PinyinHelper.toHanyuPinyinString(hanzi, defaultFormat,
separator);
} catch (BadHanyuPinyinOutputFormatCombination e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
return pinyingStr;
}

/**
* 将字符串数组转换成字符串
*
* @param str
* @param separator
*            各个字符串之间的分隔符
* @return
*/
public static String stringArrayToString(String[] str, String separator) {
StringBuffer sb = new StringBuffer();
for (int i = 0; i < str.length; i++) {
sb.append(str[i]);
if (str.length != (i + 1)) {
sb.append(separator);
}
}
return sb.toString();
}

/**
* 简单的将各个字符数组之间连接起来
*
* @param str
* @return
*/
public static String stringArrayToString(String[] str) {
return stringArrayToString(str, "");
}

/**
* 将字符数组转换成字符串
*
* @param ch
* @param separator
*            各个字符串之间的分隔符
* @return
*/
public static String charArrayToString(char[] ch, String separator) {
StringBuffer sb = new StringBuffer();
for (int i = 0; i < ch.length; i++) {
sb.append(ch[i]);
if (ch.length != (i + 1)) {
sb.append(separator);
}
}
return sb.toString();
}

/**
* 将字符数组转换成字符串
*
* @param ch
* @return
*/
public static String charArrayToString(char[] ch) {
return charArrayToString(ch, " ");
}

/**
* 取汉字的首字母
*
* @param src
* @param isCapital
*            是否是大写
* @return
*/
public static char[] getHeadByChar(char src, boolean isCapital) {
// 如果不是汉字直接返回
if (src <= 128) {
return new char[] { src };
}
// 获取所有的拼音
String[] pinyingStr = PinyinHelper.toHanyuPinyinStringArray(src);

// 创建返回对象
int polyphoneSize = pinyingStr.length;
char[] headChars = new char[polyphoneSize];
int i = 0;
// 截取首字符
for (String s : pinyingStr) {
char headChar = s.charAt(0);
// 首字母是否大写,默认是小写
if (isCapital) {
headChars[i] = Character.toUpperCase(headChar);
} else {
headChars[i] = headChar;
}
i++;
}

return headChars;
}

/**
* 取汉字的首字母(默认是大写)
*
* @param src
* @return
*/
public static char[] getHeadByChar(char src) {
return getHeadByChar(src, true);
}

/**
* 查找字符串首字母
*
* @param src
* @return
*/
public static String[] getHeadByString(String src) {
return getHeadByString(src, true);
}

/**
* 查找字符串首字母
*
* @param src
* @param isCapital
*            是否大写
* @return
*/
public static String[] getHeadByString(String src, boolean isCapital) {
return getHeadByString(src, isCapital, null);
}

/**
* 查找字符串首字母
*
* @param src
* @param isCapital
*            是否大写
* @param separator
*            分隔符
* @return
*/
public static String[] getHeadByString(String src, boolean isCapital,
String separator) {
char[] chars = src.toCharArray();
String[] headString = new String[chars.length];
int i = 0;
for (char ch : chars) {

char[] chs = getHeadByChar(ch, isCapital);
StringBuffer sb = new StringBuffer();
if (null != separator) {
int j = 1;

for (char ch1 : chs) {
sb.append(ch1);
if (j != chs.length) {
sb.append(separator);
}
j++;
}
} else {
sb.append(chs[0]);
}
headString[i] = sb.toString();
i++;
}
return headString;
}

public static void main(String[] args) {
// pin4j 简码 和 城市编码
String s1 = "中华人民共和国";
String[] headArray = getHeadByString(s1); // 获得每个汉字拼音首字母
System.out.println(Arrays.toString(headArray));

String s2 ="长城" ;
System.out.println(Arrays.toString(stringToPinyin(s2,true,",")));

String s3 ="长";
System.out.println(Arrays.toString(stringToPinyin(s3,true,",")));
}
}
分享到:
评论

相关推荐

    pinYin4J工具类

    pinYin4J工具类的核心功能是将汉字转换为其拼音的首字母,这在许多场景下非常实用。例如,当我们需要对汉字进行字母排序时,可以直接转换为拼音首字母进行比较,大大简化了处理过程。此外,该工具类还支持全拼输出,...

    Pinyin4j工具类

    将字符串转换成拼音数组;将字符串转换成拼音数组;将字符串转换成拼音数组;将单个字符转换成拼音;...本工具类需要pinyin4j.jar包。jar包地址-&gt;https://download.csdn.net/download/lihaibo858/10134053

    汉字转拼音常用的工具类

    本文将详细介绍三个主要的工具类:`PinYinUtil.java`、`HanziToPinyin.java`以及`pinyin4j-2.5.0.jar`,它们都是用于实现汉字转拼音功能的实用工具。 首先,`PinYinUtil.java`是一个自定义的汉字转拼音工具类,通常...

    pinyin4j文字转拼音+简单工具类.rar

    总结起来,pinyin4j是一个强大的汉字转拼音工具,通过`PinYinUtil.java`这样的工具类,我们可以方便地将其整合进Java项目中,实现汉字的拼音化处理,无论是用于数据分析、关键词提取还是其他相关应用,都能极大地...

    拼音4j 基本用法

    1. **初始化对象**:首先创建`PinyinHelper`对象,它是拼音4j的核心类,提供了所有拼音处理的接口。 ```java import com.belerweb.pinyin4j.PinyinHelper; PinyinHelper helper = PinyinHelper.getInstance(); ```...

    中文转拼音工具类,pinyin4j-2.5.0.jar 适用于地址人名

    《中文转拼音工具类——pinyin4j-2.5.0.jar 在处理地址与人名中的应用》 在处理中文数据时,有时我们需要将汉字转换为拼音,以便进行搜索、排序或者国际化处理。这时,一个高效且准确的中文转拼音工具显得尤为重要...

    java汉字转化为拼音的工具类

    本资源提供的工具类名为“pinyin4j”,版本为2.2.0。Pinyin4j是一个用Java编写的开源库,专门用于处理汉字与拼音之间的转换。它支持标准汉语拼音,包括声母、韵母、声调等,并且能够处理多音字和一些特殊情况。通过...

    汉字转拼音(包含首字母)工具类

    在Java编程语言中,开发一个汉字转拼音(包含首...通过以上介绍,我们了解了如何在Java中使用Pinyin4j库创建一个汉字转拼音的工具类,以及如何处理相关的细节问题。在实际项目中,可以根据需求进行适当的定制和优化。

    安卓获取汉字拼音首字母工具类封装

    "安卓获取汉字拼音首字母工具类封装"就是一个这样的解决方案,它提供了一种便捷的方式来处理汉字与拼音之间的转换,以适配与IndexBar-master这种通讯录开源控件的配合使用。 首先,我们要理解工具类在编程中的作用...

    拼音工具类(汉字转拼音)

    这个“拼音工具类(汉字转拼音)”就是一个专门解决此类问题的实用工具,它提供了将汉字转换为拼音的能力。下面我们将详细探讨这个工具类的实现原理和相关知识点。 首先,我们要明白汉字转拼音的基本概念。汉字转拼音...

    java汉字转拼音工具类

    汉字转拼音,或拼音缩写,pinyin4j。maven,非maven项目如需jar包私聊我

    pinyin4j工具类和jar包

    Pinyin4j的基本用法 ...+ 还支持拼音的格式化输出,比如第几声之类的, + 同时支持简体中文、繁体中文转换为拼音…使用起来也非常简单。下面是其官方网址,其中提供了下载: http://pinyin4j.sourceforge.net/

    汉子转拼音工具类

    【汉字转拼音工具类】是一种在Java编程中常见的实用工具,它主要用于将汉字转换成对应的汉语拼音表示。这种工具在处理中文数据时非常有用,比如搜索引擎优化、文本分析、中文排序以及语音合成等领域。在给定的【描述...

    汉语转拼音之pinyin4j 通用类

    4. **通用类PinyinUtil**:在提供的压缩文件中,我们看到一个名为`PinyinUtil.java`的文件,这通常是一个工具类,封装了Pinyin4j的核心功能,如汉字到拼音的转换方法。开发者可以通过调用这个类的方法,快速在自己的...

    汉字和拼音转换jar和工具类

    2. 多个汉字转拼音:对于输入的一串汉字,工具类可以一次性转换成拼音字符串,如“北京欢迎你”转换为“běi jīng huān yíng nǐ”。 3. 声母、韵母和声调的处理:在某些情况下,可能需要单独获取汉字的声母、...

    汉字转拼音工具类

    标题中的“汉字转拼音工具类”指的是一个编程类库或模块,主要用于将汉字转换为对应的汉语拼音。在处理中文文本时,这样的工具非常有用,比如搜索引擎优化、语音合成、自动纠错或者面向非中文用户的界面本地化。这个...

    使用拼音4j汉字转拼音例子

    这是一个包含了拼音4j库的Java类和方法的JAR文件,我们需要将其添加到项目的类路径(Classpath)中,以便在程序中使用。通常,我们可以将其放在项目的`lib`目录下,或者在构建工具如Maven或Gradle的依赖管理中引用。...

    java拼音搜索pinyin4j

    总的来说,"java拼音搜索pinyin4j"这个项目结合了Java Web开发的基础知识和汉字拼音处理的专业工具,通过Servlet三层架构实现了一个高效的中文搜索功能。开发者可以在这个基础上进一步扩展,如增加拼音排序、语音...

    汉语转换成拼音的jar包pinyin4j-2.5.0版本

    在处理大量汉字文本时,`pinyin4j`的高效性能和准确度使得它成为Java开发者的首选工具。无论是进行文本分析,还是创建具有拼音功能的应用,`pinyin4j`都能提供坚实的支持。在实际开发中,结合其他文本处理技术,如...

    Java实现的汉语拼音工具类完整实例

    本资源主要介绍了Java实现的汉语拼音工具类,结合完整实例形式分析了Java基于pinyin4j包实现编码转换的相关操作技巧。pinyin4j是一个Java库,提供了汉语拼音转换的功能,能够将汉字转换为拉丁字母的音译形式。 资源...

Global site tag (gtag.js) - Google Analytics