`
oywl2008
  • 浏览: 1051870 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

Java汉字排序(汉字转拼音 pinyin4j)

 
阅读更多
package com.albert.pinyin;

import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;

/**
 * 拼音工具类
 * 
 * @author WangXinghao
 * @createDate 2011-04-26
 */
public class PinyinUtil {

/**
* 将字符串转换成拼音数组
* @param src
*            字符串
* @return 拼音数组
* @author WangXinghao
* @createDate 2011-04-26
*/
public static String[] stringToPinyin(String src) {
return stringToPinyin(src);
}

/**
* 将字符串转换成拼音数组
* @param src
*            字符串
* @param separator
*            多音字拼音之间的分隔符
* @return 拼音数组
* @author WangXinghao
* @createDate 2011-04-26
*/
public static String[] StringToPinyin(String src, String separator) {
return stringToPinyin(src);
}

/**
* 将字符串转换成拼音数组
* @param src
*            字符串
* @param isPolyphone
*            是否查处多音字的所有拼音
* @param separator
*            多音字拼音之间的分隔符
* @author WangXinghao
* @createDate 2011-04-26
* @return
*/
public static String[] stringToPinyin(String src, boolean isPolyphone,
String separator) {
// 判断字符串是否为空
if ("".equals(src) || null == src) {
return null;
}
char[] srcChar = src.toCharArray();
int srcCount = srcChar.length;
String[] srcStr = new String[srcCount];
for (int i = 0; i < srcCount; i++) {
srcStr[i] = charToPinyin(srcChar[i], isPolyphone, separator);
}
return srcStr;
}

/**
* 将单个字符转换成拼音
* @param src
* @param isPolyphone
* @param separator
* @author WangXinghao
* @createDate 2011-04-26
* @return
*/
public static String charToPinyin(char src, boolean isPolyphone,
String separator) {
// 创建汉语拼音处理类
HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
// 输出设置,大小写,音标方式
defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
StringBuffer tempPinying = new StringBuffer();
// 如果是中文
if (src > 128) {
try {
// 转换得出结果
String[] strs = PinyinHelper.toHanyuPinyinStringArray(src,
defaultFormat);

// 是否查出多音字,默认是查出多音字的第一个字符
if (isPolyphone && null != separator) {
for (int i = 0; i < strs.length; i++) {
tempPinying.append(strs[i]);
if (strs.length != (i + 1)) {
// 多音字之间用特殊符号间隔起来
tempPinying.append(separator);
}
}
} else {
tempPinying.append(strs[0]);
}

} catch (BadHanyuPinyinOutputFormatCombination e) {
e.printStackTrace();
}
} else {
tempPinying.append(src);
}
return tempPinying.toString();
}

public static String hanziToPinyin(String hanzi) {
return hanziToPinyin(hanzi, " ");
}

/**
* 将汉字转换成拼音
* @param hanzi
* @param separator
* @author WangXinghao
* @return
*/
@SuppressWarnings("deprecation")
public static String hanziToPinyin(String hanzi, String separator) {
// 创建汉语拼音处理类
HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
// 输出设置,大小写,音标方式
defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);

String pinyingStr = "";
try {
pinyingStr = PinyinHelper.toHanyuPinyinString(hanzi, defaultFormat,
separator);
} catch (BadHanyuPinyinOutputFormatCombination e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
return pinyingStr;
}

/**
* 将字符串数组转换成字符串
* @param str
* @param separator
*            各个字符串之间的分隔符
* @author WangXinghao
* @return
*/
public static String stringArrayToString(String[] str, String separator) {
StringBuffer sb = new StringBuffer();
for (int i = 0; i < str.length; i++) {
sb.append(str[i]);
if (str.length != (i + 1)) {
sb.append(separator);
}
}
return sb.toString();
}

/**
* 简单的将各个字符数组之间连接起来
* @param str
* @author WangXinghao
* @return
*/
public static String stringArrayToString(String[] str) {
return stringArrayToString(str, "");
}

/**
* 将字符数组转换成字符串
* @param str
* @param separator
*            各个字符串之间的分隔符
* @author WangXinghao
* @return
*/
public static String charArrayToString(char[] ch, String separator) {
StringBuffer sb = new StringBuffer();
for (int i = 0; i < ch.length; i++) {
sb.append(ch[i]);
if (ch.length != (i + 1)) {
sb.append(separator);
}
}
return sb.toString();
}

/**
* 将字符数组转换成字符串
* @param str
* @author WangXinghao
* @return
*/
public static String charArrayToString(char[] ch) {
return charArrayToString(ch, " ");
}

/**
* 取汉字的首字母
* @param src
* @param isCapital
*            是否是大写
* @author WangXinghao
* @return
*/
public static char[] getHeadByChar(char src, boolean isCapital) {
// 如果不是汉字直接返回
if (src <= 128) {
return new char[] { src };
}
// 获取所有的拼音
String[] pinyingStr = PinyinHelper.toHanyuPinyinStringArray(src);

// 创建返回对象
int polyphoneSize = pinyingStr.length;
char[] headChars = new char[polyphoneSize];
int i = 0;
// 截取首字符
for (String s : pinyingStr) {
char headChar = s.charAt(0);
// 首字母是否大写,默认是小写
if (isCapital) {
headChars[i] = Character.toUpperCase(headChar);
} else {
headChars[i] = headChar;
}
i++;
}

return headChars;
}

/**
* 取汉字的首字母(默认是大写)
* @param src
* @author WangXinghao
* @return
*/
public static char[] getHeadByChar(char src) {
return getHeadByChar(src, true);
}

/**
* 查找字符串首字母
* @param src
* @author WangXinghao
* @return
*/
public static String[] getHeadByString(String src) {
return getHeadByString(src, true);
}

/**
* 查找字符串首字母
* @param src
* @param isCapital
*            是否大写
* @author WangXinghao
* @return
*/
public static String[] getHeadByString(String src, boolean isCapital) {
return getHeadByString(src, isCapital, null);
}

/**
* 查找字符串首字母
* @param src
* @param isCapital
*            是否大写
* @param separator
*            分隔符
* @author WangXinghao
* @return
*/
public static String[] getHeadByString(String src, boolean isCapital,
String separator) {
char[] chars = src.toCharArray();
String[] headString = new String[chars.length];
int i = 0;
for (char ch : chars) {

char[] chs = getHeadByChar(ch, isCapital);
StringBuffer sb = new StringBuffer();
if (null != separator) {
int j = 1;

for (char ch1 : chs) {
sb.append(ch1);
if (j != chs.length) {
sb.append(separator);
}
j++;
}
} else {
sb.append(chs[0]);
}
headString[i] = sb.toString();
i++;
}
return headString;
}

public static void main(String[] args) {
System.out.println(PinyinUtil.stringArrayToString(
getHeadByString("我的心肝爱上"), "-"));

}
}


package com.albert.test;

import java.util.ArrayList;
import java.util.Collections;
import java.util.Comparator;
import java.util.List;

import com.albert.bean.User;
import com.albert.pinyin.PinyinUtil;

/**
 * 测试拼音
 * 
 * @author WangXinghao
 * @createDate 2011-04-26
 */
public class PinyinUtilTest {

public static void main(String[] args) {
List<User> list = new ArrayList<User>();
User u = new User();
u.setName("张三");
u.setAge(21);
list.add(u);

u = new User();
u.setName("李四");
u.setAge(18);
list.add(u);

u = new User();
u.setName("王五");
u.setAge(25);
list.add(u);

u = new User();
u.setName("寒子");
u.setAge(89);
list.add(u);

for (User user : list) {
System.out.println(PinyinUtil.hanziToPinyin(user.getName()));
}
Collections.sort(list, new ToSort());// new ToSort() 根据需求定义排序
System.out.println("排序后!!!!!!!!!");
for (User user : list) {
System.out.println(PinyinUtil.hanziToPinyin(user.getName()));
}
}
}

class ToSort implements Comparator<User> {
public int compare(User o1, User o2) {
String s1 = PinyinUtil.hanziToPinyin(o1.getName());
String s2 = PinyinUtil.hanziToPinyin(o2.getName());
if (s1.compareTo(s2) > 0) {
return 1;
} else {
return -1;
}
}
}
分享到:
评论

相关推荐

    java中文排序,数字字母汉字排序

    一种常见的方式是使用第三方库,如`pinyin4j`,它可以帮助我们将中文字符转换为拼音。 以下是使用`pinyin4j`库实现的示例代码: ```java import net.sourceforge.pinyin4j.PinyinHelper; import ...

    Java 中文排序 使用pinyin4j组件

    以下是如何使用`pinyin4j`进行中文排序的详细步骤: 1. **添加依赖**:首先,你需要在项目中引入`pinyin4j`库。如果你的项目是Maven项目,可以在`pom.xml`文件中添加如下依赖: ```xml &lt;groupId&gt;...

    JAVA 汉字转换拼音

    总的来说,Java中的汉字转拼音通过pinyin4j库变得非常简单,只需要正确引入库并编写一些辅助方法,就可以轻松地在程序中实现汉字与拼音之间的转换。这在处理中文数据时非常有用,能够帮助开发出更加适应中国用户的...

    java拼音搜索pinyin4j

    总的来说,"java拼音搜索pinyin4j"这个项目结合了Java Web开发的基础知识和汉字拼音处理的专业工具,通过Servlet三层架构实现了一个高效的中文搜索功能。开发者可以在这个基础上进一步扩展,如增加拼音排序、语音...

    java集合某个字段按照中文拼音排序.docx

    但是,需要注意的是,JDK自带的Collator类可能不能正确地排序一些生僻的姓氏,因此我们可以使用IBM的ICU4J库,该库提供了更好的中文拼音排序功能。 ```java import com.ibm.icu.text.Collator; List&lt;String&gt; list ...

    java源码:中文转拼音库 pinyin4j.zip

    《Java源码解析:pinyin4j中文转拼音库》 在Java开发中,处理中文字符,特别是将中文转换为拼音的需求广泛存在。pinyin4j是一个经典的Java库,专门用于实现这一功能。这个库简单易用,适用于各种场景,如搜索引擎...

    汉字转拼音jar包_pinyin4j(java)

    `pinyin4j`是由Barry Zhang开发的一个开源项目,它提供了一套简洁的API,使得在Java或Android项目中集成汉字转拼音功能变得简单。该库不仅适用于标准Java环境,还兼容Android平台,因此在移动开发中也十分适用。 要...

    汉字转拼音大小写全拼首字母pinyin4j-jar

    《汉字转拼音:pinyin4j-jar工具详解》 在信息技术领域,处理中文字符时,经常需要将汉字转换为拼音,以便进行各种文本处理任务,如搜索、语音合成等。pinyin4j是一个广泛使用的Java库,专门用于实现这个功能。本文...

    pinyin4j-2.5.0.jar 下载 java汉字转拼音 jar包 附带超级简单小dome

    《pinyin4j-2.5.0.jar:Java实现汉字转拼音的高效工具》 在信息化时代,处理中文字符成为许多开发者的必备技能。在Java编程语言中,pinyin4j是一个非常实用的库,它能将汉字转换为拼音,从而解决了在处理汉字排序、...

    中文转拼音工具类,pinyin4j-2.5.0.jar 适用于地址人名

    《中文转拼音工具类——pinyin4j-2.5.0.jar 在处理地址与人名中的应用》 在处理中文数据时,有时我们需要将汉字...通过合理利用pinyin4j提供的API,开发者可以极大地提高工作效率,简化涉及中文拼音转换的项目开发。

    java实现中文转拼音

    首先,Java中实现中文转拼音主要依赖于第三方库,如Pinyin4j或HanyuPinyin等。Pinyin4j是一个广泛使用的Java库,它提供了方便的方法来获取汉字的拼音表示。下面是一段简单的使用Pinyin4j库将中文转换为拼音的示例...

    java 取汉字拼音工具包

    Java中的汉字拼音工具包主要服务于程序开发,尤其是前端开发,用于处理汉字与拼音之间的转换,这对于构建具有中文支持的应用或网站至关重要。这类工具包能够帮助开发者轻松地将汉字转换为对应的拼音,便于进行搜索、...

    java汉字与拼音的转换

    首先,我们要介绍一个名为"Pinyin4j"的Java库,它是一个用于汉字到拼音转换的开源工具。在你的压缩包文件名列表中提到的`pinyin4j`正是这个库的相关文件。Pinyin4j由Barry De Zwart开发,它可以方便地将汉字转换为...

    Android中文按拼音排序

    在Java和Android中,我们可以使用Pinyin4j、HanLP等第三方库,或者使用Android内置的`PinYinHelper`类(如果API等级支持)来转换汉字到拼音。 1. **Pinyin4j** 是一个流行的Java库,可以处理汉字到拼音的转换。使用...

    java汉字转拼音

    在Java编程语言中,汉字转拼音是一项常见的需求,特别是在处理中文数据、搜索引擎优化(SEO)或者构建基于拼音的排序和搜索功能时。本教程将详细讲解如何在Java中实现这一功能,并提供一个DEMO示例。 首先,我们...

    java汉字排序

    4. * 汉字按照拼音排序的比较器 5. * @author KennyLee 2009-2-23 10:08:59 6. * 7. */ 8.public class PinyinComparator implements Comparator&lt;Object&gt; { 9. public int compare(Object o1, Object o2) { 10...

    中文拼音排序

    这个“中文拼音排序”项目利用了`pinyin4j`库来实现这一功能。 `pinyin4j`是一个强大的Java库,专门用于处理中文字符的拼音转换。它支持多音字、声调以及多种拼音输出格式,使得在Java环境中处理中文字符变得更加...

    java汉字转拼音代码+多音字词汇表

    这个“java汉字转拼音代码+多音字词汇表”资源提供了一个工具类,用于高效地完成这个任务。下面将详细讨论相关知识点。 1. **汉字转拼音**: 汉字转拼音是将汉字转化为对应的汉语拼音的过程。在Java中,可以使用...

    汉字转换为拼音,取汉字的拼音首字母

    总的来说,`pinyin4j`库为Java开发者提供了强大的汉字转拼音功能,简化了处理中文文本的复杂性,是进行汉字相关处理的得力工具。通过熟练掌握和运用`pinyin4j`,我们可以轻松实现汉字到拼音的转换,从而在各种IT应用...

Global site tag (gtag.js) - Google Analytics