`

pinyin4j的使用(转)

 
阅读更多

 

pinyin4j是一个功能强悍的汉语拼音工具包,主要是从汉语获取各种格式和需求的拼音,功能强悍,下面看看如何使用pinyin4j。
 
本人以前用AscII编码提取工具,效果不理想,现在用pinyin4j简单实现了一个。功能还不是很完美,陆续再改进吧。
import net.sourceforge.pinyin4j.PinyinHelper; 
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType; 
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat; 
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType; 
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination; 

import java.io.UnsupportedEncodingException; 

/** 
* 拼音工具 
* 
* @author leizhimin 2009-7-15 15:26:21 
*/ 
public class PinyinToolkit { 

        /** 
         * 获取汉字串拼音首字母,英文字符不变 
         * 
         * @param chinese 汉字串 
         * @return 汉语拼音首字母 
         */ 
        public static String cn2FirstSpell(String chinese) { 
                StringBuffer pybf = new StringBuffer(); 
                char[] arr = chinese.toCharArray(); 
                HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat(); 
                defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE); 
                defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE); 
                for (int i = 0; i < arr.length; i++) { 
                        if (arr[i] > 128) { 
                                try { 
                                        String[] _t = PinyinHelper.toHanyuPinyinStringArray(arr[i], defaultFormat); 
                                        if (_t != null) { 
                                                pybf.append(_t[0].charAt(0)); 
                                        } 
                                } catch (BadHanyuPinyinOutputFormatCombination e) { 
                                        e.printStackTrace(); 
                                } 
                        } else { 
                                pybf.append(arr[i]); 
                        } 
                } 
                return pybf.toString().replaceAll("\\W", "").trim(); 
        } 

        /** 
         * 获取汉字串拼音,英文字符不变 
         * 
         * @param chinese 汉字串 
         * @return 汉语拼音 
         */ 
        public static String cn2Spell(String chinese) { 
                StringBuffer pybf = new StringBuffer(); 
                char[] arr = chinese.toCharArray(); 
                HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat(); 
                defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE); 
                defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE); 
                for (int i = 0; i < arr.length; i++) { 
                        if (arr[i] > 128) { 
                                try { 
                                        pybf.append(PinyinHelper.toHanyuPinyinStringArray(arr[i], defaultFormat)[0]); 
                                } catch (BadHanyuPinyinOutputFormatCombination e) { 
                                        e.printStackTrace(); 
                                } 
                        } else { 
                                pybf.append(arr[i]); 
                        } 
                } 
                return pybf.toString(); 
        } 

        public static void main(String[] args) throws UnsupportedEncodingException { 
                String x = "嘅囧誰說壞學生來勼髮視頻裆児"; 
                System.out.println(cn2FirstSpell(x)); 
                System.out.println(cn2Spell(x)); 
        } 
}
 运行结果:
kjsshxsljfspde 
kaijiongshuishuohuaixueshenglaijiufashipindanger 

Process finished with exit code 0
 
在某些系统上可能有字符集的问题,需要做预处理。


分享到:
评论

相关推荐

    pinyin4j.zip pinyin4j.jar

    总的来说,Pinyin4j是一个功能强大且易于使用的汉字转拼音工具,无论是Java还是Android开发者,都能从中受益。通过它的帮助,我们可以更便捷地进行汉字与拼音之间的转换,进一步推动中文信息处理技术的发展。在实际...

    中文转拼音工具类,pinyin4j-2.5.0.jar 适用于地址人名

    《中文转拼音工具类——pinyin4j-2.5.0.jar 在处理地址与人名中的应用》 在处理中文数据时,有时我们需要将汉字转换为拼音,以便进行搜索、排序或者国际化处理。这时,一个高效且准确的中文转拼音工具显得尤为重要...

    汉语转换成拼音的jar包pinyin4j-2.5.0版本

    `pinyin4j`库的使用并不复杂,但它的功能强大,可以满足大部分汉语转拼音的需求。在处理大量汉字文本时,`pinyin4j`的高效性能和准确度使得它成为Java开发者的首选工具。无论是进行文本分析,还是创建具有拼音功能的...

    pinyin4j jar包

    1. **汉字转拼音**:pinyin4j可以将单个汉字或字符串中的所有汉字转化为对应的拼音。它支持多种输出格式,如全拼、简拼、声母、韵母等。此外,它还能处理多音字,根据上下文提供最合适的读音。 2. **声调处理**:...

    pinyin4j-2.5.0-API文档-中文版.zip

    赠送jar包:pinyin4j-2.5.0.jar; 赠送原API文档:pinyin4j-2.5.0-javadoc.jar; 赠送源代码:pinyin4j-2.5.0-sources.jar; 赠送Maven依赖信息文件:pinyin4j-2.5.0.pom; 包含翻译后的API文档:pinyin4j-2.5.0-...

    pinyin4j-2.5.0

    使用`pinyin4j-2.5.0`,开发者只需简单导入库,然后通过API调用来实现汉字到拼音的转换。例如: ```java import net.sourceforge.pinyin4j.PinyinHelper; public class Main { public static void main(String[] ...

    pinyin4j最新jar包,汉字转pinyin必备

    《pinyin4j:汉字转拼音的利器》 在处理汉字到拼音转换的场景中,pinyin4j是一个不可或缺的工具。它是一个Java库,专为处理汉字转换为拼音而设计,尤其适用于需要进行中文信息处理、搜索引擎优化、或者任何需要汉字...

    pinyin4j-2.5.0.jar下载

    "pinyin4j-2.5.0.jar"就是这样一款高效且易用的工具,它专为Java和Kotlin设计,提供了强大的汉字转拼音功能。 pinyin4j是一款开源的Java库,由Barry De Zwart开发,其主要功能是将汉字转换为汉语拼音。这个库不仅...

    pinyin4j-2.5.0.jar+使用说明+使用代码

    本文将详细探讨pinyin4j-2.5.0.jar这个Java汉字转拼音的jar包,包括其核心功能、使用方法以及实际应用中的示例代码。 一、pinyin4j概述 pinyin4j是一个轻量级的Java库,它提供了高效且灵活的汉字转拼音功能。该库...

    pinyin4j-2.5.0.jar 下载 java汉字转拼音 jar包 附带超级简单小dome

    本文将详细介绍pinyin4j-2.5.0.jar这个jar包以及如何使用它来实现汉字转拼音的功能。 pinyin4j是一个开源的Java库,由Barry de Graaff创建,它的主要功能是提供汉字到拼音的转换服务。在pinyin4j-2.5.0.jar这个版本...

    pinyin4j(解决多音字问题源码)

    在使用OYRong1988pinyin4j.jar这个特定版本时,开发者可以先尝试其默认功能,看看是否满足项目需求。如果不满足,那么就需要对源码进行分析,找出处理多音字的逻辑,并根据自己的业务场景,如用户输入习惯、领域词汇...

    pinyin4j pinyin4j

    《使用Pinyin4j库将中文转换为拼音的深度解析》 在信息技术高速发展的今天,中文与英文的交互成为日常工作中不可或缺的一部分。特别是在编程领域,将中文转化为拼音的需求日益凸显,尤其是在处理汉字文本、搜索引擎...

    PinYin4jUtils PinYin4j使用案例

    PinYin4jUtils PinYin4j使用案例

    将简体中文和繁体中文转换拼音的jar包 pinyin4j-2.5.0.jar

    《使用pinyin4j库进行中文到拼音转换的详解》 在处理中文字符时,有时我们需要将汉字转换为对应的拼音,以便进行各种文本处理任务,如搜索引擎优化、文本分析或语音合成。在这种情况下,Java开发者可以利用开源库...

    pinyin4j-2.5.0.jar

    在压缩包中,附带的`PinyinUtils.java`是一个使用示例,它展示了如何在实际项目中集成和使用pinyin4j。这个示例文件通常包含了初始化、转换和处理结果的基本步骤,对于初学者来说,是一个很好的学习起点。通过阅读和...

    pinyin4j 开发jar包

    《pinyin4j:汉字转拼音的利器》 在信息技术高速发展的今天,处理中文字符,尤其是将汉字转换为拼音的需求日益凸显。pinyin4j,作为一个强大的Java库,专门用于解决这个问题,它使得开发者能够在Java应用程序中轻松...

    pinyin4j-2.5.1.jar

    在Java开发中,处理中文字符转化为拼音是一项常见的任务,这时我们常常会使用到pinyin4j这个开源库。然而,如果在项目中遇到"The import net.sourceforge.pinyin4j cannot be resolved"的异常,这通常意味着pinyin4j...

    pinyin4j-2.5.0.zip

    只需要将pinyin4j-2.5.0.jar添加到项目的依赖库中,就可以在代码中直接使用。对于Maven项目,可以在pom.xml文件中添加相应的依赖配置,对于Gradle项目,可以在build.gradle文件中声明依赖。这样,你就可以在...

    net.sourceforge.pinyin4j.zip

    《Pinyin4j工具包详解:汉字转拼音的利器》 在处理中文数据时,我们经常需要将汉字转换为拼音,以便进行各种处理,如排序、搜索或建立索引。这时,一个强大的工具包——net.sourceforge.pinyin4j就显得尤为重要。这...

    pinyin4j.jar中文转拼音及多音字配置文件

    Java pinyin4j.jar中文转拼音 详细可查看我的博客https://me.csdn.net/Extraordinarylife 中《Java pinyin4j.jar中文转拼音 》

Global site tag (gtag.js) - Google Analytics