package com.anyitzy.publish.util;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;
public class PinyinUtil {
public static String nameToPinyin(String chines) {
if(chines==null || "".equals(chines)){
return "";
}else{
String pinyinName = "";
char[] nameChar = chines.replaceAll("[^\u4E00-\u9FA5|\\d|\\w]+", "").toCharArray();
HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
for (int i = 0; i < nameChar.length; i++) {
if (nameChar[i] > 128) {
try {
pinyinName += PinyinHelper.toHanyuPinyinStringArray(
nameChar[i], defaultFormat)[0].charAt(0);
} catch (BadHanyuPinyinOutputFormatCombination e) {
e.printStackTrace();
}
} else {
pinyinName += nameChar[i];
}
}
return pinyinName;
}
}
public static String regexReplace(String str){
// 只允许字母和数字
// String regEx = "[^a-zA-Z0-9]";
// 清除掉所有特殊字符
String regEx="[`~!@#$%^&*()+=|{}':;',\\[\\].<>/?~!@#¥%……&*()——+|{}【】‘;:”“’。,、?]";
Pattern p = Pattern.compile(regEx);
Matcher m = p.matcher(str);
m.find();
return m.replaceAll("").trim();
}
public static void main(String[] args) {
//String content = "规*规范";
//System.out.println(regexReplace(content));
//String content = "法律、法12QQ-规类";
//System.out.println(content.replaceAll("[^\u4E00-\u9FA5|\\d|\\w]+", ""));
}
}
相关推荐
《使用pinyin4j将中文转换为拼音》 在处理中文文本时,有时我们需要将汉字转化为拼音,以便进行关键词检索、语音合成或者数据分析等任务。pinyin4j是一个非常实用的Java库,它能帮助我们方便地实现这个功能。本文将...
`pinyin4j`库的核心功能是将汉字转换为汉语拼音。这个过程涉及到多个方面,包括识别多音字、处理声调以及提供不同的拼音输出格式。例如,对于汉字"好",`pinyin4j`可以输出"haο"(无声调形式)或"hǎo"(带声调形式...
Pinyin4j是一个功能强悍的汉语拼音工具包,是sourceforge.net上的一个开源项目。 主要的功能有: - 支持同一汉字有多个发音 - 支持拼音的格式化输出,比如第几声之类的 - 支持简体中文、繁体中文转换为拼音
Pinyin4j便是一个专门解决这一问题的强大工具,它是一个开源的Java库,能够方便、高效地将汉字转换为汉语拼音,为开发者提供了极大的便利。 Pinyin4j的核心功能在于其对汉字拼音的处理能力。它能够处理单个汉字、...
pinyin4j是一个轻量级的Java库,专门用于将汉字转换为汉语拼音。它支持简体中文和繁体中文的转换,能够处理单个汉字、词语甚至整个句子。该库由Barry S. Wang开发,并在Apache 2.0许可下发布,意味着你可以自由地在...
pinyin4J java拼音转换工具 java汉字转换拼音工具
在Java编程语言中,pinyin4j是一个非常实用的库,它能将汉字转换为拼音,从而解决了在处理汉字排序、分类、搜索等需求时遇到的问题。本文将详细介绍pinyin4j-2.5.0.jar这个jar包以及如何使用它来实现汉字转拼音的...
《pinyin4j-2.5.0.jar:中文转换拼音与获取首字母的利器》 在处理中文数据时,有时我们需要将汉字转化为拼音,以便进行关键词检索、数据分析或者构建搜索引擎。这时,一个强大的工具库就能派上用场,那就是pinyin4j...
在处理中文数据时,有时我们需要将汉字转换为拼音,以便进行搜索、排序或者国际化处理。这时,一个高效且准确的中文转拼音工具显得尤为重要。pinyin4j是一个专门用于Java平台的开源库,它提供了方便的API,能够帮助...
pinyin4j的核心功能在于,它可以将单个汉字或字符串中的所有汉字转换为其对应的汉语拼音。例如,“中国”会被转换为“China”,“再见”则转换为“zai jian”。它不仅支持基本的拼音转换,还能够处理多音字,提供...
1. **汉字转拼音**:pinyin4j可以将单个汉字或字符串中的所有汉字转化为对应的拼音。它支持多种输出格式,如全拼、简拼、声母、韵母等。此外,它还能处理多音字,根据上下文提供最合适的读音。 2. **声调处理**:...
1. 汉字转拼音:pinyin4j的核心功能就是将单个汉字或字符串中的汉字转换为对应的汉语拼音。例如,“中国”可以转换为“Zhongguo”。 2. 多音字处理:对于具有多个读音的汉字,pinyin4j能提供所有可能的读音。例如,...
在信息技术领域,处理中文字符时,经常需要将汉字转换为拼音,以便进行各种文本处理任务,如搜索、语音合成等。pinyin4j是一个广泛使用的Java库,专门用于实现这个功能。本文将深入探讨pinyin4j-jar这个工具,介绍其...
标签中的“字符转码”是指Pinyin4j能够处理汉字与拼音之间的编码转换,而“中文转汉字”则强调了它的主要功能——将汉字转换为对应的拼音形式。通过Pinyin4j,开发者无需深入理解复杂的汉字拼音规则,只需简单调用...
Pinyin4j是一个开源的Java库,由Barry DeZeng开发,它的主要功能就是将汉字转换成汉语拼音。这个库支持多种拼音表示方式,包括全拼、简拼以及声调标记等,可以满足不同的需求。Pinyin4j的设计简洁而高效,它不依赖...
对于Java开发者来说,pinyin4j是一个不可或缺的工具包,它专门用于将汉字转换为拼音,从而解决了中文数据处理中的诸多问题。pinyin4j-2.5.0.zip这个压缩包便是这一强大工具的载体,包含了一切你需要的功能,以适应...
pinyin4j是Java平台上的一个开源项目,由Barry de Zaayter开发,主要功能是将汉字转换为对应的拼音,支持声母、韵母、声调等多种拼音形式。此外,pinyin4j还提供了一些辅助功能,如拼音比较、拼音搜索等,对于处理...
《使用Pinyin4j库将中文转换为拼音的深度解析》 在信息技术高速发展的今天,中文与英文的交互成为日常工作中不可或缺的一部分。特别是在编程领域,将中文转化为拼音的需求日益凸显,尤其是在处理汉字文本、搜索引擎...
这个类可能已经封装了pinyin4j的核心功能,如`HanyuPinyinHelper`或类似的类名,提供了简单易用的接口,如`toPinyin()`或`getPinyin()`方法,用于将汉字字符串转换为拼音。例如,调用`HanyuPinyinHelper.toPinyin(...