`

java开源类库pinyin4j的使用

阅读更多
最近CMS系统为了增加查询的匹配率,需要增加拼音检索字段,在网上找到了pinyin4j的java开源类库,提供中文转汉语拼音(并且支持多音字),呵呵,看了看他的demo,决定就用它了,因为我在实际使用的时候,需要考虑多音字的不同排列组合,下面的代码就是支持多音字的.

pinyin4j官方网址:http://pinyin4j.sourceforge.net/

import java.util.HashSet;
import java.util.Set;

import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;

public class pinyin4j {
 
 /**
  * 字符串集合转换字符串(逗号分隔)
  * @author wyh
  * @param stringSet
  * @return
  */
 public static String makeStringByStringSet(Set<String> stringSet){
  StringBuilder str = new StringBuilder();
  int i=0;
  for(String s : stringSet){
   if(i == stringSet.size() - 1){
    str.append(s);
   }else{
    str.append(s + ",");
   }
   i++;
  }
  return str.toString().toLowerCase();
 }
 
 /**
  * 获取拼音集合
  * @author wyh
  * @param src
  * @return Set<String>
  */
 public static Set<String> getPinyin(String src){
  if(src!=null && !src.trim().equalsIgnoreCase("")){
   char[] srcChar ;
   srcChar=src.toCharArray();
   //汉语拼音格式输出类
   HanyuPinyinOutputFormat hanYuPinOutputFormat = new HanyuPinyinOutputFormat();

//输出设置,大小写,音标方式等
   hanYuPinOutputFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE); 
   hanYuPinOutputFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE)
   hanYuPinOutputFormat.setVCharType(HanyuPinyinVCharType.WITH_V);
   
   String[][] temp = new String[src.length()][];
   for(int i=0;i<srcChar.length;i++){
    char c = srcChar[i];
    //是中文或者a-z或者A-Z转换拼音(我的需求,是保留中文或者a-z或者A-Z)
    if(String.valueOf(c).matches("[\\u4E00-\\u9FA5]+")){
     try{
      temp[i] = PinyinHelper.toHanyuPinyinStringArray(srcChar[i], hanYuPinOutputFormat);
     }catch(BadHanyuPinyinOutputFormatCombination e) {
      e.printStackTrace();
     }
    }else if(((int)c>=65 && (int)c<=90) || ((int)c>=97 && (int)c<=122)){
     temp[i] = new String[]{String.valueOf(srcChar[i])};
    }else{
     temp[i] = new String[]{""};
    }
   }
   String[] pingyinArray = Exchange(temp);
   Set<String> pinyinSet = new HashSet<String>();
   for(int i=0;i<pingyinArray.length;i++){
    pinyinSet.add(pingyinArray[i]);
   }
   return pinyinSet;
  }
  return null;
 }
 
 /**
  * 递归
  * @author wyh
  * @param strJaggedArray
  * @return
  */
    public static String[] Exchange(String[][] strJaggedArray){
        String[][] temp = DoExchange(strJaggedArray);
        return temp[0];       
    }
   
    /**
     * 递归
     * @author wyh
     * @param strJaggedArray
     * @return
     */
    private static String[][] DoExchange(String[][] strJaggedArray){
        int len = strJaggedArray.length;
        if(len >= 2){           
            int len1 = strJaggedArray[0].length;
            int len2 = strJaggedArray[1].length;
            int newlen = len1*len2;
            String[] temp = new String[newlen];
            int Index = 0;
            for(int i=0;i<len1;i++){
                for(int j=0;j<len2;j++){
                    temp[Index] = strJaggedArray[0][i] + strJaggedArray[1][j];
                    Index ++;
                }
            }
            String[][] newArray = new String[len-1][];
            for(int i=2;i<len;i++){
                newArray[i-1] = strJaggedArray[i];                           
            }
            newArray[0] = temp;
            return DoExchange(newArray);
        }else{
         return strJaggedArray;   
        }
    }
   
 /**
  * @param args
  */
 public static void main(String[] args) {
  String str = "单田芳";
  System.out.println(makeStringByStringSet(getPinyin(str)));

}

}

控制台输出:dantianfang,shantianfang,chantianfang
22
3
分享到:
评论
13 楼 735920595 2014-05-27  
一直报空指针怎么解决
12 楼 xingkongdeasi 2014-01-10  
很不错,顶一个!!
11 楼 zhao_xiaolu 2013-11-29  
toHanyuPinyinStringArray这个方法亲
10 楼 cl1154781231 2013-10-23  
谢谢分享!!
9 楼 pop1030123 2013-09-24  
ytpytp222 写道
抄了这个代码去用,大规模用出现bug。
line 60 ++
if(temp[i]==null){
temp[i] = new String[]{""};
}
拼音拿不到值是null,不给个空字符串下面exchange的时候
int len1 = strJaggedArray[0].length;
int len2 = strJaggedArray[1].length;
会遇到空指针错误

返回null是怎样解决的呢?
8 楼 sxlswjh 2013-06-19  
很靠谱啊,尤其那个递归,我想了半天才解决掉
7 楼 依米艳 2013-04-16  
代码很好,可以使用,需要pinyin4j2.5的jar包。研究中。
6 楼 ytpytp222 2012-08-02  
抄了这个代码去用,大规模用出现bug。
line 60 ++
if(temp[i]==null){
temp[i] = new String[]{""};
}
拼音拿不到值是null,不给个空字符串下面exchange的时候
int len1 = strJaggedArray[0].length;
int len2 = strJaggedArray[1].length;
会遇到空指针错误
5 楼 yigemajia 2012-05-30  
有没有在android上使用过,我最近在android使用pinyin4j.jar但是无法将汉字转换成pinyin而在普通的java项目中却可以,博主知道是什么原因么
4 楼 wister 2011-02-16  
hehe1987 写道
请问有更详细的资料吗/

pinyin4j官方网址:http://pinyin4j.sourceforge.net/
请详见官方说明。
3 楼 hehe1987 2011-01-27  
请问有更详细的资料吗/
2 楼 zhongaili520 2010-09-28  
能不能根据汉字获得五笔编码?
1 楼 181054867 2010-08-02  
感谢分享!!!!

相关推荐

    一个汉字转拼音的Java开源类库-JPinyin

    JPinyin是一个汉字转拼音的Java开源类库,在PinYin4j的功能基础上做了一些改进。 【JPinyin主要特性】 1、准确、完善的字库; Unicode编码从4E00-9FA5范围及3007(〇)的20903个汉字中,JPinyin能转换除46个异体...

    pinyin4j-2.5.0.jar 下载 java汉字转拼音 jar包 附带超级简单小dome

    pinyin4j是一个开源的Java库,由Barry de Graaff创建,它的主要功能是提供汉字到拼音的转换服务。在pinyin4j-2.5.0.jar这个版本中,包含了完整的类库和必要的资源文件,开发者可以将其添加到Java项目中,快速实现...

    jpinyin.jar

    JPinyin是一个汉字转拼音的Java开源类库 在PinYin4j的功能基础上做了一些改进 github地址https: github com stuxuhai jpinyin 使用方法: String str &quot;你好世界&quot;; PinyinHelper convertToPinyinString ...

    利用Java开源库把汉字转拼音

    pinyin4j是一个支持将中文转换到拼音的Java开源类库。 支持简体中文和繁体中文字符; 支持转换到汉语拼音,通用拼音, 威妥玛拼音(威玛拼法), 注音符号第二式, 耶鲁拼法和国语罗马字; 支持多音字,即可以获取一...

    java开源包6

    Blister是一个用于操作苹果二进制PList文件格式的Java开源类库(可用于发送数据给iOS应用程序)。 重复文件检查工具 FindDup.tar FindDup 是一个简单易用的工具,用来检查计算机上重复的文件。 OpenID的Java客户端...

    java开源包10

    Blister是一个用于操作苹果二进制PList文件格式的Java开源类库(可用于发送数据给iOS应用程序)。 重复文件检查工具 FindDup.tar FindDup 是一个简单易用的工具,用来检查计算机上重复的文件。 OpenID的Java客户端...

    java开源包8

    Blister是一个用于操作苹果二进制PList文件格式的Java开源类库(可用于发送数据给iOS应用程序)。 重复文件检查工具 FindDup.tar FindDup 是一个简单易用的工具,用来检查计算机上重复的文件。 OpenID的Java客户端...

    java开源包9

    Blister是一个用于操作苹果二进制PList文件格式的Java开源类库(可用于发送数据给iOS应用程序)。 重复文件检查工具 FindDup.tar FindDup 是一个简单易用的工具,用来检查计算机上重复的文件。 OpenID的Java客户端...

    Java汉字转拼音pinyin4j用法详解

    pinyin4j是一个支持将简体和繁体中文转换到成拼音的Java开源类库。它支持同一汉字有多个发音,还支持拼音的格式化输出,比如第几声之类的,同时支持简体中文、繁体中文转换为拼音。使用起来也非常简单。 二、目录...

    java开源包4

    Blister是一个用于操作苹果二进制PList文件格式的Java开源类库(可用于发送数据给iOS应用程序)。 重复文件检查工具 FindDup.tar FindDup 是一个简单易用的工具,用来检查计算机上重复的文件。 OpenID的Java客户端...

    java开源包5

    Blister是一个用于操作苹果二进制PList文件格式的Java开源类库(可用于发送数据给iOS应用程序)。 重复文件检查工具 FindDup.tar FindDup 是一个简单易用的工具,用来检查计算机上重复的文件。 OpenID的Java客户端...

    java开源包1

    Blister是一个用于操作苹果二进制PList文件格式的Java开源类库(可用于发送数据给iOS应用程序)。 重复文件检查工具 FindDup.tar FindDup 是一个简单易用的工具,用来检查计算机上重复的文件。 OpenID的Java客户端...

    java开源包101

    Blister是一个用于操作苹果二进制PList文件格式的Java开源类库(可用于发送数据给iOS应用程序)。 重复文件检查工具 FindDup.tar FindDup 是一个简单易用的工具,用来检查计算机上重复的文件。 OpenID的Java客户端...

    java开源包3

    Blister是一个用于操作苹果二进制PList文件格式的Java开源类库(可用于发送数据给iOS应用程序)。 重复文件检查工具 FindDup.tar FindDup 是一个简单易用的工具,用来检查计算机上重复的文件。 OpenID的Java客户端...

    java开源包2

    Blister是一个用于操作苹果二进制PList文件格式的Java开源类库(可用于发送数据给iOS应用程序)。 重复文件检查工具 FindDup.tar FindDup 是一个简单易用的工具,用来检查计算机上重复的文件。 OpenID的Java客户端...

    java开源包11

    Blister是一个用于操作苹果二进制PList文件格式的Java开源类库(可用于发送数据给iOS应用程序)。 重复文件检查工具 FindDup.tar FindDup 是一个简单易用的工具,用来检查计算机上重复的文件。 OpenID的Java客户端...

    java开源包7

    Blister是一个用于操作苹果二进制PList文件格式的Java开源类库(可用于发送数据给iOS应用程序)。 重复文件检查工具 FindDup.tar FindDup 是一个简单易用的工具,用来检查计算机上重复的文件。 OpenID的Java客户端...

    C#汉字转拼音

    Pinyin4j.Net是从Codeplex备份的资源,是一个专门为.NET平台设计的汉字转拼音库,它基于Java版的Pinyin4j进行了移植。 Pinyin4j.Net库包含了多个关键组件,例如: 1. Net.Sourceforge.Pinyin4j:这是核心的拼音...

    JAVA上百实例源码以及开源项目源代码

    Java从网络取得文件 1个目标文件 简单 Java从压缩包中提取文件 1个目标文件 简单 Java存储与读取对象 1个目标文件 如题 Java调色板面板源代码 1个目标文件 摘要:Java源码,窗体界面,调色板 使用Java语言编写的一款...

    jpinyin-1.1.8-javadoc.jar

    JPinyin是一个汉字转拼音的Java开源类库,在PinYin4j的功能基础上做了一些改进。主要特性: 1、准确、完善的字库; Unicode编码从4E00-9FA5范围及3007(〇)的20903个汉字中,JPinyin能转换除46个异体字(异体字不...

Global site tag (gtag.js) - Google Analytics