`
331008019
  • 浏览: 22232 次
  • 性别: Icon_minigender_1
  • 来自: 湖南株洲
社区版块
存档分类
最新评论

Java获取汉字全拼和首拼

    博客分类:
  • Java
阅读更多
import java.util.Collections;
import java.util.Iterator;
import java.util.LinkedHashMap;
import java.util.Map;

/**
 * 将汉字转化为全拼
 */
public class CnToSpell1 {

	private static Map<String, Integer> spellMap = null;
	//存放生僻字和其拼音的Map
	private static Map<Character, String> uncommonWordsMap = null;

	static {
		if (spellMap == null) {
			spellMap = Collections.synchronizedMap(new LinkedHashMap<String, Integer>(396)) ;
			uncommonWordsMap = Collections.synchronizedMap(new LinkedHashMap<Character, String>(200)) ;
		}
		initialize();
		initUncommonWords(); 
	}

	private CnToSpell1() {}

	/**
	 * 初始化
	 */
	private static void initialize() {
		spellMap.put("’a", -20319);
		spellMap.put("’ai", -20317);
		spellMap.put("’an", -20304);
		spellMap.put("’ang", -20295);
		spellMap.put("’ao", -20292);
		spellMap.put("ba", -20283);
		spellMap.put("bai", -20265);
		spellMap.put("ban", -20257);
		spellMap.put("bang", -20242);
		spellMap.put("bao", -20230);
		spellMap.put("bei", -20051);
		spellMap.put("ben", -20036);
		spellMap.put("beng", -20032);
		spellMap.put("bi", -20026);
		spellMap.put("bian", -20002);
		spellMap.put("biao", -19990);
		spellMap.put("bie", -19986);
		spellMap.put("bin", -19982);
		spellMap.put("bing", -19976);
		spellMap.put("bo", -19805);
		spellMap.put("bu", -19784);
		spellMap.put("ca", -19775);
		spellMap.put("cai", -19774);
		spellMap.put("can", -19763);
		spellMap.put("cang", -19756);
		spellMap.put("cao", -19751);
		spellMap.put("ce", -19746);
		spellMap.put("ceng", -19741);
		spellMap.put("cha", -19739);
		spellMap.put("chai", -19728);
		spellMap.put("chan", -19725);
		spellMap.put("chang", -19715);
		spellMap.put("chao", -19540);
		spellMap.put("che", -19531);
		spellMap.put("chen", -19525);
		spellMap.put("cheng", -19515);
		spellMap.put("chi", -19500);
		spellMap.put("chong", -19484);
		spellMap.put("chou", -19479);
		spellMap.put("chu", -19467);
		spellMap.put("chuai", -19289);
		spellMap.put("chuan", -19288);
		spellMap.put("chuang", -19281);
		spellMap.put("chui", -19275);
		spellMap.put("chun", -19270);
		spellMap.put("chuo", -19263);
		spellMap.put("ci", -19261);
		spellMap.put("cong", -19249);
		spellMap.put("cou", -19243);
		spellMap.put("cu", -19242);
		spellMap.put("cuan", -19238);
		spellMap.put("cui", -19235);
		spellMap.put("cun", -19227);
		spellMap.put("cuo", -19224);
		spellMap.put("da", -19218);
		spellMap.put("dai", -19212);
		spellMap.put("dan", -19038);
		spellMap.put("dang", -19023);
		spellMap.put("dao", -19018);
		spellMap.put("de", -19006);
		spellMap.put("deng", -19003);
		spellMap.put("di", -18996);
		spellMap.put("dian", -18977);
		spellMap.put("diao", -18961);
		spellMap.put("die", -18952);
		spellMap.put("ding", -18783);
		spellMap.put("diu", -18774);
		spellMap.put("dong", -18773);
		spellMap.put("dou", -18763);
		spellMap.put("du", -18756);
		spellMap.put("duan", -18741);
		spellMap.put("dui", -18735);
		spellMap.put("dun", -18731);
		spellMap.put("duo", -18722);
		spellMap.put("’e", -18710);
		spellMap.put("’en", -18697);
		spellMap.put("’er", -18696);
		spellMap.put("fa", -18526);
		spellMap.put("fan", -18518);
		spellMap.put("fang", -18501);
		spellMap.put("fei", -18490);
		spellMap.put("fen", -18478);
		spellMap.put("feng", -18463);
		spellMap.put("fo", -18448);
		spellMap.put("fou", -18447);
		spellMap.put("fu", -18446);
		spellMap.put("ga", -18239);
		spellMap.put("gai", -18237);
		spellMap.put("gan", -18231);
		spellMap.put("gang", -18220);
		spellMap.put("gao", -18211);
		spellMap.put("ge", -18201);
		spellMap.put("gei", -18184);
		spellMap.put("gen", -18183);
		spellMap.put("geng", -18181);
		spellMap.put("gong", -18012);
		spellMap.put("gou", -17997);
		spellMap.put("gu", -17988);
		spellMap.put("gua", -17970);
		spellMap.put("guai", -17964);
		spellMap.put("guan", -17961);
		spellMap.put("guang", -17950);
		spellMap.put("gui", -17947);
		spellMap.put("gun", -17931);
		spellMap.put("guo", -17928);
		spellMap.put("ha", -17922);
		spellMap.put("hai", -17759);
		spellMap.put("han", -17752);
		spellMap.put("hang", -17733);
		spellMap.put("hao", -17730);
		spellMap.put("he", -17721);
		spellMap.put("hei", -17703);
		spellMap.put("hen", -17701);
		spellMap.put("heng", -17697);
		spellMap.put("hong", -17692);
		spellMap.put("hou", -17683);
		spellMap.put("hu", -17676);
		spellMap.put("hua", -17496);
		spellMap.put("huai", -17487);
		spellMap.put("huan", -17482);
		spellMap.put("huang", -17468);
		spellMap.put("hui", -17454);
		spellMap.put("hun", -17433);
		spellMap.put("huo", -17427);
		spellMap.put("ji", -17417);
		spellMap.put("jia", -17202);
		spellMap.put("jian", -17185);
		spellMap.put("jiang", -16983);
		spellMap.put("jiao", -16970);
		spellMap.put("jie", -16942);
		spellMap.put("jin", -16915);
		spellMap.put("jing", -16733);
		spellMap.put("jiong", -16708);
		spellMap.put("jiu", -16706);
		spellMap.put("ju", -16689);
		spellMap.put("juan", -16664);
		spellMap.put("jue", -16657);
		spellMap.put("jun", -16647);
		spellMap.put("ka", -16474);
		spellMap.put("kai", -16470);
		spellMap.put("kan", -16465);
		spellMap.put("kang", -16459);
		spellMap.put("kao", -16452);
		spellMap.put("ke", -16448);
		spellMap.put("ken", -16433);
		spellMap.put("keng", -16429);
		spellMap.put("kong", -16427);
		spellMap.put("kou", -16423);
		spellMap.put("ku", -16419);
		spellMap.put("kua", -16412);
		spellMap.put("kuai", -16407);
		spellMap.put("kuan", -16403);
		spellMap.put("kuang", -16401);
		spellMap.put("kui", -16393);
		spellMap.put("kun", -16220);
		spellMap.put("kuo", -16216);
		spellMap.put("la", -16212);
		spellMap.put("lai", -16205);
		spellMap.put("lan", -16202);
		spellMap.put("lang", -16187);
		spellMap.put("lao", -16180);
		spellMap.put("le", -16171);
		spellMap.put("lei", -16169);
		spellMap.put("leng", -16158);
		spellMap.put("li", -16155);
		spellMap.put("lia", -15959);
		spellMap.put("lian", -15958);
		spellMap.put("liang", -15944);
		spellMap.put("liao", -15933);
		spellMap.put("lie", -15920);
		spellMap.put("lin", -15915);
		spellMap.put("ling", -15903);
		spellMap.put("liu", -15889);
		spellMap.put("long", -15878);
		spellMap.put("lou", -15707);
		spellMap.put("lu", -15701);
		spellMap.put("lv", -15681);
		spellMap.put("luan", -15667);
		spellMap.put("lue", -15661);
		spellMap.put("lun", -15659);
		spellMap.put("luo", -15652);
		spellMap.put("ma", -15640);
		spellMap.put("mai", -15631);
		spellMap.put("man", -15625);
		spellMap.put("mang", -15454);
		spellMap.put("mao", -15448);
		spellMap.put("me", -15436);
		spellMap.put("mei", -15435);
		spellMap.put("men", -15419);
		spellMap.put("meng", -15416);
		spellMap.put("mi", -15408);
		spellMap.put("mian", -15394);
		spellMap.put("miao", -15385);
		spellMap.put("mie", -15377);
		spellMap.put("min", -15375);
		spellMap.put("ming", -15369);
		spellMap.put("miu", -15363);
		spellMap.put("mo", -15362);
		spellMap.put("mou", -15183);
		spellMap.put("mu", -15180);
		spellMap.put("na", -15165);
		spellMap.put("nai", -15158);
		spellMap.put("nan", -15153);
		spellMap.put("nang", -15150);
		spellMap.put("nao", -15149);
		spellMap.put("ne", -15144);
		spellMap.put("nei", -15143);
		spellMap.put("nen", -15141);
		spellMap.put("neng", -15140);
		spellMap.put("ni", -15139);
		spellMap.put("nian", -15128);
		spellMap.put("niang", -15121);
		spellMap.put("niao", -15119);
		spellMap.put("nie", -15117);
		spellMap.put("nin", -15110);
		spellMap.put("ning", -15109);
		spellMap.put("niu", -14941);
		spellMap.put("nong", -14937);
		spellMap.put("nu", -14933);
		spellMap.put("nv", -14930);
		spellMap.put("nuan", -14929);
		spellMap.put("nue", -14928);
		spellMap.put("nuo", -14926);
		spellMap.put("’o", -14922);
		spellMap.put("’ou", -14921);
		spellMap.put("pa", -14914);
		spellMap.put("pai", -14908);
		spellMap.put("pan", -14902);
		spellMap.put("pang", -14894);
		spellMap.put("pao", -14889);
		spellMap.put("pei", -14882);
		spellMap.put("pen", -14873);
		spellMap.put("peng", -14871);
		spellMap.put("pi", -14857);
		spellMap.put("pian", -14678);
		spellMap.put("piao", -14674);
		spellMap.put("pie", -14670);
		spellMap.put("pin", -14668);
		spellMap.put("ping", -14663);
		spellMap.put("po", -14654);
		spellMap.put("pu", -14645);
		spellMap.put("qi", -14630);
		spellMap.put("qia", -14594);
		spellMap.put("qian", -14429);
		spellMap.put("qiang", -14407);
		spellMap.put("qiao", -14399);
		spellMap.put("qie", -14384);
		spellMap.put("qin", -14379);
		spellMap.put("qing", -14368);
		spellMap.put("qiong", -14355);
		spellMap.put("qiu", -14353);
		spellMap.put("qu", -14345);
		spellMap.put("quan", -14170);
		spellMap.put("que", -14159);
		spellMap.put("qun", -14151);
		spellMap.put("ran", -14149);
		spellMap.put("rang", -14145);
		spellMap.put("rao", -14140);
		spellMap.put("re", -14137);
		spellMap.put("ren", -14135);
		spellMap.put("reng", -14125);
		spellMap.put("ri", -14123);
		spellMap.put("rong", -14122);
		spellMap.put("rou", -14112);
		spellMap.put("ru", -14109);
		spellMap.put("ruan", -14099);
		spellMap.put("rui", -14097);
		spellMap.put("run", -14094);
		spellMap.put("ruo", -14092);
		spellMap.put("sa", -14090);
		spellMap.put("sai", -14087);
		spellMap.put("san", -14083);
		spellMap.put("sang", -13917);
		spellMap.put("sao", -13914);
		spellMap.put("se", -13910);
		spellMap.put("sen", -13907);
		spellMap.put("seng", -13906);
		spellMap.put("sha", -13905);
		spellMap.put("shai", -13896);
		spellMap.put("shan", -13894);
		spellMap.put("shang", -13878);
		spellMap.put("shao", -13870);
		spellMap.put("she", -13859);
		spellMap.put("shen", -13847);
		spellMap.put("sheng", -13831);
		spellMap.put("shi", -13658);
		spellMap.put("shou", -13611);
		spellMap.put("shu", -13601);
		spellMap.put("shua", -13406);
		spellMap.put("shuai", -13404);
		spellMap.put("shuan", -13400);
		spellMap.put("shuang", -13398);
		spellMap.put("shui", -13395);
		spellMap.put("shun", -13391);
		spellMap.put("shuo", -13387);
		spellMap.put("si", -13383);
		spellMap.put("song", -13367);
		spellMap.put("sou", -13359);
		spellMap.put("su", -13356);
		spellMap.put("suan", -13343);
		spellMap.put("sui", -13340);
		spellMap.put("sun", -13329);
		spellMap.put("suo", -13326);
		spellMap.put("ta", -13318);
		spellMap.put("tai", -13147);
		spellMap.put("tan", -13138);
		spellMap.put("tang", -13120);
		spellMap.put("tao", -13107);
		spellMap.put("te", -13096);
		spellMap.put("teng", -13095);
		spellMap.put("ti", -13091);
		spellMap.put("tian", -13076);
		spellMap.put("tiao", -13068);
		spellMap.put("tie", -13063);
		spellMap.put("ting", -13060);
		spellMap.put("tong", -12888);
		spellMap.put("tou", -12875);
		spellMap.put("tu", -12871);
		spellMap.put("tuan", -12860);
		spellMap.put("tui", -12858);
		spellMap.put("tun", -12852);
		spellMap.put("tuo", -12849);
		spellMap.put("wa", -12838);
		spellMap.put("wai", -12831);
		spellMap.put("wan", -12829);
		spellMap.put("wang", -12812);
		spellMap.put("wei", -12802);
		spellMap.put("wen", -12607);
		spellMap.put("weng", -12597);
		spellMap.put("wo", -12594);
		spellMap.put("wu", -12585);
		spellMap.put("xi", -12556);
		spellMap.put("xia", -12359);
		spellMap.put("xian", -12346);
		spellMap.put("xiang", -12320);
		spellMap.put("xiao", -12300);
		spellMap.put("xie", -12120);
		spellMap.put("xin", -12099);
		spellMap.put("xing", -12089);
		spellMap.put("xiong", -12074);
		spellMap.put("xiu", -12067);
		spellMap.put("xu", -12058);
		spellMap.put("xuan", -12039);
		spellMap.put("xue", -11867);
		spellMap.put("xun", -11861);
		spellMap.put("ya", -11847);
		spellMap.put("yan", -11831);
		spellMap.put("yang", -11798);
		spellMap.put("yao", -11781);
		spellMap.put("ye", -11604);
		spellMap.put("yi", -11589);
		spellMap.put("yin", -11536);
		spellMap.put("ying", -11358);
		spellMap.put("yo", -11340);
		spellMap.put("yong", -11339);
		spellMap.put("you", -11324);
		spellMap.put("yu", -11303);
		spellMap.put("yuan", -11097);
		spellMap.put("yue", -11077);
		spellMap.put("yun", -11067);
		spellMap.put("za", -11055);
		spellMap.put("zai", -11052);
		spellMap.put("zan", -11045);
		spellMap.put("zang", -11041);
		spellMap.put("zao", -11038);
		spellMap.put("ze", -11024);
		spellMap.put("zei", -11020);
		spellMap.put("zen", -11019);
		spellMap.put("zeng", -11018);
		spellMap.put("zha", -11014);
		spellMap.put("zhai", -10838);
		spellMap.put("zhan", -10832);
		spellMap.put("zhang", -10815);
		spellMap.put("zhao", -10800);
		spellMap.put("zhe", -10790);
		spellMap.put("zhen", -10780);
		spellMap.put("zheng", -10764);
		spellMap.put("zhi", -10587);
		spellMap.put("zhong", -10544);
		spellMap.put("zhou", -10533);
		spellMap.put("zhu", -10519);
		spellMap.put("zhua", -10331);
		spellMap.put("zhuai", -10329);
		spellMap.put("zhuan", -10328);
		spellMap.put("zhuang", -10322);
		spellMap.put("zhui", -10315);
		spellMap.put("zhun", -10309);
		spellMap.put("zhuo", -10307);
		spellMap.put("zi", -10296);
		spellMap.put("zong", -10281);
		spellMap.put("zou", -10274);
		spellMap.put("zu", -10270);
		spellMap.put("zuan", -10262);
		spellMap.put("zui", -10260);
		spellMap.put("zun", -10256);
		spellMap.put("zuo", -10254);
	}

	/**
	 * 添加生僻字
	 * @param cnWord 生僻字
	 * @param spell 生僻字的拼音, 如果拼音以 a, o ,e 开头, 请将开头分别改为 ’a, ’o, ’e, 如:安(’an)
	 */
	public static void putUncommonWord(char cnWord, String spell){
		uncommonWordsMap.put(cnWord, spell);
	}
	
	/**
	 * 初始化生僻字
	 */
	private static void initUncommonWords(){
		putUncommonWord('奡', "ao");
		putUncommonWord('灞', "ba");
		putUncommonWord('犇', "ben");
		putUncommonWord('猋', "biao");
		putUncommonWord('骉', "biao");
		putUncommonWord('杈', "cha");
		putUncommonWord('棽', "chen");
		putUncommonWord('琤', "cheng");
		putUncommonWord('魑', "chi");
		putUncommonWord('蟲', "chong");
		putUncommonWord('翀', "chong");
		putUncommonWord('麤', "cu");
		putUncommonWord('毳', "cui");
		putUncommonWord('昉', "fang");
		putUncommonWord('沣', "feng");
		putUncommonWord('玽', "gou");
		putUncommonWord('焓', "han");
		putUncommonWord('琀', "han");
		putUncommonWord('晗', "han");
		putUncommonWord('浛', "han");
		putUncommonWord('翮', "he");
		putUncommonWord('翯', "he");
		putUncommonWord('嬛', "huan");
		putUncommonWord('翙', "hui");
		putUncommonWord('劼', "jie");
		putUncommonWord('璟', "jing");
		putUncommonWord('誩', "jing");
		putUncommonWord('競', "jing");
		putUncommonWord('焜', "kun");
		putUncommonWord('琨', "kun");
		putUncommonWord('鹍', "kun");
		putUncommonWord('骊', "li");
		putUncommonWord('鎏', "liu");
		putUncommonWord('嫚', "man");
		putUncommonWord('槑', "mei");
		putUncommonWord('淼', "miao");
		putUncommonWord('婻', "nan");
		putUncommonWord('暔', "nan");
		putUncommonWord('甯', "ning");
		putUncommonWord('寗', "ning");
		putUncommonWord('掱', "pa");
		putUncommonWord('玭', "pi");
		putUncommonWord('汧', "qian");
		putUncommonWord('骎', "qin");
		putUncommonWord('甠', "qing");
		putUncommonWord('暒', "qing");
		putUncommonWord('凊', "qing");
		putUncommonWord('郬', "qing");
		putUncommonWord('靘', "qing");
		putUncommonWord('悫', "que");
		putUncommonWord('慤', "que");
		putUncommonWord('瑢', "rong");
		putUncommonWord('珅', "shen");
		putUncommonWord('屾', "shen");
		putUncommonWord('燊', "shen");
		putUncommonWord('焺', "sheng");
		putUncommonWord('珄', "sheng");
		putUncommonWord('晟', "sheng");
		putUncommonWord('昇', "sheng");
		putUncommonWord('眚', "sheng");
		putUncommonWord('湦', "sheng");
		putUncommonWord('陹', "sheng");
		putUncommonWord('竔', "sheng");
		putUncommonWord('琞', "sheng");
		putUncommonWord('湜', "shi");
		putUncommonWord('甦', "su");
		putUncommonWord('弢', "tao");
		putUncommonWord('瑱', "tian");
		putUncommonWord('仝', "tong");
		putUncommonWord('烓', "wei");
		putUncommonWord('炜', "wei");
		putUncommonWord('玮', "wei");
		putUncommonWord('沕', "wu");
		putUncommonWord('邬', "wu");
		putUncommonWord('晞', "xi");
		putUncommonWord('顕', "xian");
		putUncommonWord('婋', "xiao");
		putUncommonWord('虓', "xiao");
		putUncommonWord('筱', "xiao");
		putUncommonWord('勰', "xie");
		putUncommonWord('忻', "xin");
		putUncommonWord('庥', "xiu");
		putUncommonWord('媭', "xu");
		putUncommonWord('珝', "xu");
		putUncommonWord('昫', "xu");
		putUncommonWord('烜', "xuan");
		putUncommonWord('煊', "xuan");
		putUncommonWord('翾', "xuan");
		putUncommonWord('昍', "xuan");
		putUncommonWord('暄', "xuan");
		putUncommonWord('娅', "ya");
		putUncommonWord('琰', "yan");
		putUncommonWord('妍', "yan");
		putUncommonWord('焱', "yan");
		putUncommonWord('玚', "yang");
		putUncommonWord('旸', "yang");
		putUncommonWord('飏', "yang");
		putUncommonWord('垚', "yao");
		putUncommonWord('峣', "yao");
		putUncommonWord('怡', "yi");
		putUncommonWord('燚', "yi");
		putUncommonWord('晹', "yi");
		putUncommonWord('祎', "yi");
		putUncommonWord('瑛', "ying");
		putUncommonWord('煐', "ying");
		putUncommonWord('媖', "ying");
		putUncommonWord('暎', "ying");
		putUncommonWord('滢', "ying");
		putUncommonWord('锳', "ying");
		putUncommonWord('莜', "you");
		putUncommonWord('昱', "yu");
		putUncommonWord('沄', "yun");
		putUncommonWord('晢', "zhe");
		putUncommonWord('喆', "zhe");
		putUncommonWord('臸', "zhi");
	}
	
	/**
	 * 获得单个汉字的Ascii.
	 * @param cn 汉字字符
	 * @return 汉字对应的 ascii, 错误时返回 0
	 */
	public static int getCnAscii(char cn) {
		byte[] bytes = (String.valueOf(cn)).getBytes();
		if (bytes == null || bytes.length == 0|| bytes.length > 2 ) { // 错误
			return 0;
		}
		if (bytes.length == 1) { // 英文字符
			return bytes[0];
		}
		if (bytes.length == 2) { // 中文字符
			int hightByte = 256 + bytes[0];
			int lowByte = 256 + bytes[1];
			return (256 * hightByte + lowByte) - 256 * 256; //返回 ASCII
		}
		return 0; // 错误
	}

	/**
	 * 根据ASCII码到SpellMap中查找对应的拼音
	 * @param ascii ASCII
	 * @return ascii对应的拼音, 如果ascii对应的字符为单字符,则返回对应的单字符, 如果不是单字符且在 spellMap 中没找到对应的拼音,则返回空字符串(""), 
	 */
	public static String getSpellByAscii(int ascii) {
		if (ascii > 0 && ascii < 160) { // 单字符
			return String.valueOf((char) ascii);
		}

		if (ascii < -20319 || ascii > -10247) { // 不知道的字符
			return "";
		}

		String spell = null; //key
		Integer asciiRang; //value
		String spellPrevious = null; //用来保存上次轮循环的key
		int asciiRangPrevious = -20319; //用来保存上一次循环的value
		for (Iterator it = spellMap.keySet().iterator(); it.hasNext();) {
			spell = (String) it.next(); //拼音
			asciiRang = spellMap.get(spell); //拼音的ASCII
			if(asciiRang != null){
				if (ascii >= asciiRangPrevious && ascii < asciiRang) { // 区间找到, 返回对应的拼音
					return (spellPrevious == null) ? spell : spellPrevious;
				} else {
					spellPrevious = spell;
					asciiRangPrevious = asciiRang;
				}
			}
		}
		return "";
	}

	/**
	 * 获取字符串的全拼或首拼,是汉字则转化为对应的拼音或拼音首字母,其它字符不进行转换
	 * @param cnStr 要获取全拼或首拼的字符串
	 * @param onlyFirstSpell 是否只获取首拼,为true时,只获取首拼,为false时,获取全拼
	 * @return String cnStr的全拼或首拼, 如果 cnStr 为null 时, 返回""
	 */
	public static String getSpell(String cnStr, boolean onlyFirstSpell) {
		if (cnStr == null) {
			return "";
		}
		
		char[] chars = cnStr.trim().toCharArray();
		StringBuffer sb = new StringBuffer();
		for (int i = 0, len = chars.length; i < len; i++) {
			int ascii = getCnAscii(chars[i]);
			if (ascii == 0){ //如果获取汉字的ASCII出错,则不进行转换
				sb.append(chars[i]);
			}else{
				String spell = getSpellByAscii(ascii); //根据ASCII取拼音
				if(spell == null || spell.length() == 0){ //如果根据ASCII取拼音没取到,则到生僻字Map中取
					spell = uncommonWordsMap.get(chars[i]);
				}
				
				if(spell == null || spell.length() == 0){ //如果没有取到对应的拼音,则不做转换,追加原字符
					spell = uncommonWordsMap.get(chars[i]);
				}else{
					if(onlyFirstSpell){
						sb.append(spell.startsWith("’") ? spell.substring(1, 2) : spell.substring(0, 1));
					}else{
						sb.append(spell);
					}
				}
			}
		} // end of for
		return sb.toString();
	}

	public static void main(String[] args) {
		String[] s = {"获取汉字全拼和首拼测试","This is a test","a,b; c[d]","标,点。","圆角数字123,特殊符号·¥%——……", "繁体字:西安會議", "西安", "棽 燊 顕 峣 山 "};
		for (int i = 0; i < s.length; i++) {
			long l1 = System.currentTimeMillis();
			System.out.println(s[i]+" 的全拼:" + getSpell(s[i], false));
			System.out.println(s[i]+" 的首拼:" + getSpell(s[i], true));
			System.out.println("获取全拼和首拼共用了"+(System.currentTimeMillis()-l1)+"毫秒\n");
		}
	}
}
 
分享到:
评论

相关推荐

    java汉字转拼音(全拼和首字母)

    本篇文章将深入探讨如何使用Java实现汉字转拼音的功能,包括获取汉字的全拼和首字母。 首先,我们需要理解汉字转拼音的基本原理。汉语拼音是用拉丁字母表示汉字发音的一种方式,全拼是每个汉字对应的完整拼音,而首...

    java根据汉字获取全拼和首字母 jar包

    java根据汉字获取全拼和首字母 的jar包,有需要可以下载下载下载下载下载下载下载下载下载

    Java获取汉字拼音的全拼和首拼实现代码分享

    这个代码分享提供了一种实现方式,它能够获取汉字的全拼(完整拼音)和首拼(首字母拼音)。下面我们将详细探讨这段代码的工作原理。 首先,代码定义了两个`Map`对象:`spellMap`和`uncommonWordsMap`。`spellMap`...

    JS汉语转拼音 全拼字母和首拼字母

    这些库不仅提供全拼和首拼,还可能包括其他拼音格式,如声母、韵母等,以满足不同的需求。 在开发过程中,了解和掌握这类库的使用,能够帮助我们实现如搜索关键词高亮、拼音排序、拼音输入法等功能。例如,如果你...

    java获取汉字的首字母

    一个常用的库是`Pinyin4j`,它是一个用于Java的中文拼音处理库,可以方便地获取汉字的全拼和首字母。 以下是一个使用`Pinyin4j`库获取汉字首字母的基本步骤: 1. **添加依赖**: 在项目中引入`Pinyin4j`库,如果是...

    获取汉字的五笔,全拼和双拼的工具类

    本文将深入探讨一个专门用于获取汉字五笔、全拼和双拼编码的工具类,这对于我们理解和优化中文输入体验至关重要。 首先,我们要了解汉字编码的三种主要类型:五笔、全拼和双拼。五笔字型是一种形码输入法,根据汉字...

    汉字转拼音、首字母、多音字java

    在Java编程语言中,处理汉字转换为拼音、获取汉字首字母以及处理多音字的问题是一项常见的任务,尤其在中文信息处理、搜索引擎优化(SEO)或者中文输入法开发等领域。这里我们将详细探讨这些知识点。 首先,我们要...

    Java获取汉字对应的拼音(全拼或首字母)

    pinyin4j是一个开源的Java库,用于将汉字转换成对应的拼音形式,包括全拼和首字母缩写。 pinyin4j库提供了简单而强大的API,支持多音字的处理,可选择是否输出拼音中的声调。使用pinyin4j之前,需要将pinyin4j-...

    java实现读取汉字的首字母

    在Java编程语言中,处理汉字并获取其首字母是一项常见的任务,特别是在中文信息处理、搜索引擎优化(SEO)或拼音输入法等场景下。这个过程通常涉及到汉字与Unicode编码的转换,因为Java内部使用Unicode来表示字符。...

    汉字转全拼或首字母Oracle存储过程

    总结起来,"汉字转全拼或首字母Oracle存储过程"是一个利用PL/SQL实现的工具,它可以将汉字字符串转换为其全拼或首字母,这对于处理汉字数据和提升搜索效率具有重要意义。通过创建和使用这样的存储过程,我们可以灵活...

    java中文名字转变拼音或者简拼

    它支持全拼和简拼,还能处理多音字,是进行中文转拼音的得力工具。`pinyin4j-2.5.0.zip`就是这个库的压缩包,包含了库的源码、文档以及编译好的jar文件。 要使用`pinyin4j`,首先需要将`pinyin4j-2.5.0.jar`添加到...

    汉字转换全拼或首字母

    在IT行业中,尤其是在数据库管理和数据处理领域,有时候我们需要将汉字转换为全拼或首字母形式。这在构建搜索引擎、文本分析或实现特定的查询功能时非常有用。Oracle数据库系统提供了强大的SQL查询语言,可以帮助...

    java 提取汉字的首字母、拼音

    在Java编程中,提取汉字的首字母和拼音是一项常见的需求,尤其在中文数据处理和搜索优化方面。这里我们将深入探讨如何使用Java实现这一功能,并基于提供的`pinyin4j-2.5.0.jar`库和`Pinyin.java`源码进行讲解。 `...

    java获取中文首字母等jar包

    Java获取中文首字母的jar包,如描述中提到的`pinyin4j-2.5.0.jar`,是Java编程领域中处理汉字拼音转换的一个重要工具。在处理中文字符时,尤其是进行数据检索、排序或者关键词提取时,将中文转化为拼音能够带来很大...

    取汉字拼音或首字母的PL/SQL存储过程

    本文将详细解析如何利用PL/SQL编写存储过程来获取汉字的拼音或首字母,主要针对Oracle 9i及以上版本。 首先,我们需要理解汉字转拼音的基本原理。在Oracle中,我们可以借助内置的UTL_I18N和UTL_RAW库来实现这一功能...

    获取中文首字母与全拼pinyin4j-2.5.0.jar

    总结来说,Pinyin4j-2.5.0.jar是Java环境下处理中文拼音的强大工具,它提供了一套完善的API,使得开发者能轻松地将汉字转换为拼音,无论是首字母还是全拼,都能高效准确地完成。在实际项目中,正确集成并使用Pinyin4...

    java中文转全拼工具类分享

    总结起来,Java的中文转全拼工具类利用`pinyin4j`库实现了将汉字转换为全拼和首字母的功能,对于需要处理中文数据的应用来说,这是一个非常实用的工具。通过理解和使用这样的工具类,开发者可以更方便地处理涉及汉语...

    java 取汉字拼音工具包

    Java中的汉字拼音工具包主要服务于程序开发,尤其是前端开发,用于处理汉字与拼音之间的转换,这对于构建具有中文支持的应用或网站至关重要。这类工具包能够帮助开发者轻松地将汉字转换为对应的拼音,便于进行搜索、...

Global site tag (gtag.js) - Google Analytics