`
thtwin
  • 浏览: 165857 次
  • 性别: Icon_minigender_1
  • 来自: 成都
社区版块
存档分类
最新评论

pinyin4j将中文转换拼音简单强大

阅读更多
一个强大的中文转换拼音的开源组件。

package com.unutrip.remoting.ws;

import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;

/**
*
* pinyin4j使用
*
* @author longgangbai
*
*/
public class CNSpell {
public static HanyuPinyinToneType[] toneTypes = new HanyuPinyinToneType[] {
   HanyuPinyinToneType.WITH_TONE_NUMBER,
   HanyuPinyinToneType.WITHOUT_TONE,
   HanyuPinyinToneType.WITH_TONE_MARK };
public static HanyuPinyinVCharType[] vCharTypes = new HanyuPinyinVCharType[] {
   HanyuPinyinVCharType.WITH_U_AND_COLON, HanyuPinyinVCharType.WITH_V,
   HanyuPinyinVCharType.WITH_U_UNICODE };
public static HanyuPinyinCaseType[] caseTypes = new HanyuPinyinCaseType[] {
   HanyuPinyinCaseType.LOWERCASE, HanyuPinyinCaseType.UPPERCASE };

/**
  * 将中文字符转换为相应的数组
  *
  * @param chineseCharacter
  * @param toneSelection
  * @param vcharSelection
  * @param caseSelection
  */
private static void updateFormattedText(String chineseCharacter,
   HanyuPinyinToneType toneSelection,
   HanyuPinyinVCharType vcharSelection,
   HanyuPinyinCaseType caseSelection) {
  // 拼音格式化对象
  HanyuPinyinOutputFormat outputFormat = new HanyuPinyinOutputFormat();
  // 设置中文声调
  if (toneSelection != null) {
   if (toneTypes[0] == toneSelection) {
    outputFormat.setToneType(HanyuPinyinToneType.WITH_TONE_NUMBER);
   } else if (toneTypes[1] == toneSelection) {
    outputFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
   } else if (toneTypes[2] == toneSelection) {
    outputFormat.setToneType(HanyuPinyinToneType.WITH_TONE_MARK);
   }
  }
  // 设置特殊拼音的转换
  if (vcharSelection != null) {
   if (vCharTypes[0] == vcharSelection) {
    outputFormat
      .setVCharType(HanyuPinyinVCharType.WITH_U_AND_COLON);
   } else if (vCharTypes[1] == vcharSelection) {
    outputFormat.setVCharType(HanyuPinyinVCharType.WITH_V);
   } else if (vCharTypes[2] == vcharSelection) {
    outputFormat.setVCharType(HanyuPinyinVCharType.WITH_U_UNICODE);
   }
  }
  // 设置转换的拼音的大小写
  if (caseSelection != null) {
   if (caseTypes[0] == caseSelection) {
    outputFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
   } else if (caseTypes[1] == caseSelection) {
    outputFormat.setCaseType(HanyuPinyinCaseType.UPPERCASE);
   }
  }
  // 获取字符串
  char[] cnStr = chineseCharacter.toCharArray();
  for (char chineseChar : cnStr) {
   // 将字符转换为拼音数组
   String[] pinyinArray = null;
   try {
    pinyinArray = PinyinHelper.toHanyuPinyinStringArray(
      chineseChar, outputFormat);
   } catch (BadHanyuPinyinOutputFormatCombination e1) {
    e1.printStackTrace();
   }
   String outputString = concatPinyinStringArray(pinyinArray);
   System.out.println(outputString);
  }

}

/**
  * 测试中文转换拼音方法
  *
  * @param args
  */
public static void main(String[] args) {
  updateFormattedText("我是中国人!", HanyuPinyinToneType.WITH_TONE_MARK,
    HanyuPinyinVCharType.WITH_U_UNICODE,
    HanyuPinyinCaseType.UPPERCASE);
}

/**
  * 将转换的拼音数组转换为字符串
  *
  * @param pinyinArray
  * @return
  */
private static String concatPinyinStringArray(String[] pinyinArray) {
  StringBuffer pinyinStrBuf = new StringBuffer();

  if ((null != pinyinArray) && (pinyinArray.length > 0)) {
   for (int i = 0; i < pinyinArray.length; i++) {
    pinyinStrBuf.append(pinyinArray[i]);
    pinyinStrBuf.append(System.getProperty("line.separator"));
   }
  }
  String outputString = pinyinStrBuf.toString();
  return outputString;
}
}
分享到:
评论

相关推荐

    使用pinyin4j将中文转换为拼音

    《使用pinyin4j将中文转换为拼音》 在处理中文文本时,有时我们需要将汉字转化为拼音,以便进行关键词检索、语音合成或者数据分析等任务。pinyin4j是一个非常实用的Java库,它能帮助我们方便地实现这个功能。本文将...

    汉语转换成拼音的jar包pinyin4j-2.5.0版本

    `pinyin4j`库的核心功能是将汉字转换为汉语拼音。这个过程涉及到多个方面,包括识别多音字、处理声调以及提供不同的拼音输出格式。例如,对于汉字"好",`pinyin4j`可以输出"haο"(无声调形式)或"hǎo"(带声调形式...

    pinyin4j.zip pinyin4j.jar

    Pinyin4j便是一个专门解决这一问题的强大工具,它是一个开源的Java库,能够方便、高效地将汉字转换为汉语拼音,为开发者提供了极大的便利。 Pinyin4j的核心功能在于其对汉字拼音的处理能力。它能够处理单个汉字、...

    将简体中文和繁体中文转换拼音的jar包 pinyin4j-2.5.0.jar

    《使用pinyin4j库进行中文到拼音转换的详解》 在处理中文字符时,有时我们...通过简单调用其提供的API,开发者可以方便地处理汉字、词语乃至整个句子的拼音转换,无论是简体中文还是繁体中文,pinyin4j都能游刃有余。

    pinyin4j-2.5.0.jar 下载 java汉字转拼音 jar包 附带超级简单小dome

    总的来说,pinyin4j-2.5.0.jar是一个强大且易用的Java库,它极大地简化了汉字与拼音之间的转换过程,是处理中文字符问题时不可或缺的工具。通过合理利用这个库,开发者可以更高效地实现各种基于拼音的业务逻辑,提升...

    pinyin4j-2.5.0.jar 中文转化拼音,获取首字母

    《pinyin4j-2.5.0.jar:中文转换拼音与获取首字母的利器》 在处理中文数据时,有时我们需要将汉字转化为拼音,以便进行关键词检索、数据分析或者构建搜索引擎。这时,一个强大的工具库就能派上用场,那就是pinyin4j...

    中文转拼音工具类,pinyin4j-2.5.0.jar 适用于地址人名

    例如,在处理人名时,pinyin4j可以正确识别“欧阳修”的拼音为"Ou Yang Xiu",而不是简单地将其拆分为“ou yang xiu”。对于地名,如“重庆市”,它能够输出“Chongqing Shi”而非“Chong qing Shi”。 在使用...

    pinyin4j jar包

    总结起来,pinyin4j是一个强大且实用的Java拼音处理工具,它涵盖了从基本的汉字转拼音到复杂的声调处理等多种功能,适用于各种需要汉字与拼音转换的场景。对于Java开发者来说,掌握并利用好pinyin4j,无疑能提升项目...

    pinyin4j最新jar包,汉字转pinyin必备

    pinyin4j的核心功能在于,它可以将单个汉字或字符串中的所有汉字转换为其对应的汉语拼音。例如,“中国”会被转换为“China”,“再见”则转换为“zai jian”。它不仅支持基本的拼音转换,还能够处理多音字,提供...

    汉字转拼音大小写全拼首字母pinyin4j-jar

    例如,在搜索引擎中,用户输入的关键词可能包含汉字,通过pinyin4j转换成拼音后,可以方便地与索引中的拼音数据进行匹配。 总结起来,pinyin4j-jar是一个强大的汉字转拼音工具,它提供了灵活的拼音输出格式设置,能...

    pinyin4j 开发jar包

    1. 汉字转拼音:pinyin4j的核心功能就是将单个汉字或字符串中的汉字转换为对应的汉语拼音。例如,“中国”可以转换为“Zhongguo”。 2. 多音字处理:对于具有多个读音的汉字,pinyin4j能提供所有可能的读音。例如,...

    汉字转拼音库pinyin4j

    Pinyin4j是一个开源的Java库,由Barry DeZeng开发,它的主要功能就是将汉字转换成汉语拼音。这个库支持多种拼音表示方式,包括全拼、简拼以及声调标记等,可以满足不同的需求。Pinyin4j的设计简洁而高效,它不依赖...

    pinyin4j拼音java

    pinyin4j是一款开源的Java库,专门用于汉字到拼音的转换,它提供了简单易用的API,使得开发者可以轻松地将汉字转化为拼音,包括全拼和首字母。 首先,我们来了解下pinyin4j的核心类`PinYin4jUtils`。这个工具类是...

    pinyin4j 拼音排序

    pinyin4j是一款强大的Java库,专门用于处理汉字与拼音之间的转换,它极大地简化了汉字拼音排序的过程。本文将深入探讨pinyin4j库的使用方法以及在汉字拼音排序中的应用。 一、pinyin4j简介 pinyin4j是Java平台上的...

    net.sourceforge.pinyin4j.zip

    标签中的“字符转码”是指Pinyin4j能够处理汉字与拼音之间的编码转换,而“中文转汉字”则强调了它的主要功能——将汉字转换为对应的拼音形式。通过Pinyin4j,开发者无需深入理解复杂的汉字拼音规则,只需简单调用...

    pinyin4j-2.5.0.zip

    pinyin4j能够轻松地将汉字转换成拼音,使得这些功能的实现变得简单而高效。 首先,我们来了解一下pinyin4j的基本用法。在Java代码中,你可以通过创建`PinyinHelper`对象并调用其方法,如`toHanyuPinyinStringArray...

    pinyin4j pinyin4j

    本文将深入探讨Pinyin4j库,一个专门为Java开发者设计的,用于实现中文到拼音转换的强大工具。 Pinyin4j,正如其名,是一个专门针对Java平台的开源库,由Barry DeZeng开发,其主要功能是将中文字符转换为汉语拼音。...

    [pinyin4j]java版汉字转换拼音大小写

    ### pinyin4j:Java版汉字转换拼音大小写 #### 概述 本文档主要介绍如何使用`pinyin4j`库实现Java程序中的汉字到拼音的转换,并着重讲解如何控制转换后拼音的大小写形式。`pinyin4j`是一款功能强大的开源库,能够...

    pinyin4j-2.5.0

    3. **拼音分词**:对于含有多个汉字的字符串,`pinyin4j`可以将其拆分为一个个单独的汉字,并分别转换为拼音。这对于进行基于拼音的关键词提取或搜索很有帮助。 4. **首字母提取**:如果你只需要汉字的首字母,`...

    pinyin4j文字转拼音+简单工具类.rar

    总结起来,pinyin4j是一个强大的汉字转拼音工具,通过`PinYinUtil.java`这样的工具类,我们可以方便地将其整合进Java项目中,实现汉字的拼音化处理,无论是用于数据分析、关键词提取还是其他相关应用,都能极大地...

Global site tag (gtag.js) - Google Analytics