`
daoshud1
  • 浏览: 556591 次
  • 性别: Icon_minigender_1
  • 来自: 济南
社区版块
存档分类
最新评论

java 汉字转Unicode

    博客分类:
  • java
 
阅读更多
 /**
     * 汉字转Unicode
     * @param s
     * @return
     */
    public static String gbEncoding(final String s){
        String str = "";
        if(!"".equals(s) && null!=s){
	        for (int i = 0; i < s.length(); i++) {
	        int ch = (int) s.charAt(i);
	        str += "\\u" + Integer.toHexString(ch);
	        }
        }
        return str;
    }
    /**
     * Unicode转汉字
     * @param str
     * @return
     */
    public static String encodingtoStr(String str){
    	if(!"".equals(str) && null!=str){
	        Pattern pattern = Pattern.compile("(\\\\u(\\p{XDigit}{4}))");
	        Matcher matcher = pattern.matcher(str);
	        char ch;
	        while (matcher.find()) {
	        ch = (char) Integer.parseInt(matcher.group(2), 16);
	        str = str.replace(matcher.group(1), ch + "");
	        }
    	}
        return str;
    }
    /**
     * 将汉字转为Unicode编码
     * @param str
     * @return
     */
    public static String chinaToUnicode(String str){  
        String result="";
        if(!"".equals(str) && null!=str){
	        for (int i = 0; i < str.length(); i++){  
	            int chr1 = (char) str.charAt(i);  
	            if(chr1>=19968&&chr1<=171941){//汉字范围 \u4e00-\u9fa5 (中文)  
	                result+="\\u" + Integer.toHexString(chr1);  
	            }else{  
	                result+=str.charAt(i);  
	            }  
	        }  
        }
        return result;  
    }  
  
    /** 
     * 判断是否为中文字符 
     * @param c 
     * @return 
     */  
    public  boolean isChinese(char c) {  
        Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);  
        if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS  
                || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS  
                || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A  
                || ub == Character.UnicodeBlock.GENERAL_PUNCTUATION  
                || ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION  
                || ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS) {  
            return true;  
        }  
        return false;  
    }
分享到:
评论
3 楼 linksky1018 2014-11-10  
是我弄错啦,我忘了进行url解码了
2 楼 linksky1018 2014-11-10  
纯汉字转换还行
1 楼 linksky1018 2014-11-10  
貌似有问题吧

相关推荐

    java 中文Unicode转换

    在Java编程语言中,Unicode编码是一种广泛使用的字符集,它包含了世界上几乎所有的文字,包括中文。Unicode使得在程序中处理不同语言的文本变得更加方便。本文将深入探讨如何在Java中进行中文字符到Unicode编码的...

    java实现十六进制字符unicode与中英文转换示例

    在Java编程语言中,处理Unicode编码和十六进制字符转换是一项常见的任务,特别是在处理文本数据时。本示例探讨了如何使用Java实现从Unicode十六进制字符串到中英文字符的转换,以及反过来的过程。理解Unicode和UTF...

    Java编程将汉字转Unicode码代码示例

    文章中提供的Java代码示例即是实现汉字转Unicode码的功能。具体而言,代码中定义了一个名为`ToUnicode`的类,并在其中定义了`main`方法和`toUnicode`方法。`main`方法是程序的入口点,用于调用`toUnicode`方法并打印...

    常用的java汉字unicode编码

    在给定的文件中,虽然部分内容难以直接解析为明确的IT知识,但通过其标题“常用的java汉字unicode编码”以及描述“该文档有常用的java汉字unicode编码”,我们可以深入探讨与之相关的知识点。 ### Unicode编码的...

    中文转化为unicode格式的方法类

    本文将深入探讨如何将中文字符转换为 Unicode 格式,并介绍一个名为 `unicodeConvert.java` 的 Java 类,该类已通过实际程序验证,确保了其功能的可行性。 Unicode 编码通常采用 UTF-8、UTF-16 或 UTF-32 这样的...

    Java做的Unicode编码转换器

    Java编写的Unicode编码转换器是一种实用工具,它能够帮助用户将各种国家和地区的文字转换成Unicode编码,同时也能实现从Unicode编码回转到原始字符。Unicode是一种国际标准,旨在为全球所有的字符提供一个统一的编码...

    Unicode码转中文和中文转Unicode码的最简便的方法

    中文转Unicode码和Unicode码转中文的过程在Java环境下可以通过`native2ascii`工具轻松实现,这个工具是Java开发工具包(JDK)的一部分。 **中文转Unicode码**: 1. 首先,你需要确保已经安装了Java JDK。JDK包含了...

    Java实现中文字符串与unicode互转工具类

    "Java实现中文字符串与unicode互转工具类" Java实现中文字符串与unicode互转工具类是指使用Java语言实现中文字符串与unicode码之间的相互转换。这个工具类主要用于解决中文字符串与unicode码之间的转换问题,提供了...

    JAVA反编译和unicode转字符.rar

    标题“JAVA反编译和unicode转字符.rar”表明这个压缩包包含了一套Java反编译工具Jad.exe和相关的使用手册,以及一个用于将反编译后汉字Unicode格式转换为可读字符格式的代码。Jad是Java反编译器的代表之一,它能够将...

    java对汉字unicode处理

    java对汉字理得unicode 编码与解码处理

    Unicode编码转GBK编码(汉字转GBK)

    在网上找资料很少有汉字直接转GBK编码格式,一般都是汉字转Unicode编码,这套是将汉字先转换成Unicode编码,在通过参照表得出汉字的GBK编码数据。虽然是一个js文件,但是加以修改可以用于很多平台上如:小程序,...

    java中文繁体转中文简体

    在“java中文繁体转中文简体”这个主题中,我们主要讨论的是如何利用Java技术来实现中文繁体字到简体字的转换。 首先,我们需要了解中文字符集。在计算机中,中文字符的表示通常使用Unicode编码,它包含了繁体字和...

    java汉字转拼音(全拼和首字母)

    在Java编程语言中,汉字转拼音是一项常见的需求,特别是在处理中文数据、搜索引擎优化或文本处理等领域。本篇文章将深入探讨如何使用Java实现汉字转拼音的功能,包括获取汉字的全拼和首字母。 首先,我们需要理解...

    中英文与Unicode码互转

    《中英文与Unicode码互转》是一款非常实用的工具,主要功能是帮助用户将中文和英文字符转换成Unicode编码,反之亦然。Unicode是一种全球通用的字符编码标准,旨在为世界上所有的文字提供一个统一的表示方式,使得...

    Java 中文字符按Unicode排序的实现方法

    Java 中文字符按 Unicode 排序的实现方法 在 Java 中,实现中文字符按 Unicode 排序是一件非常重要的事情,特别是在处理中文字符串时。今天,我们将探讨如何使用 Java 语言来实现中文字符按 Unicode 排序。 在 ...

    汉字与unicode相互转换

    汉字转 Unicode 的过程主要是查找汉字在 Unicode 字符集中的位置,并将其对应的 16 进制数值表示出来。例如,汉字“我”的 Unicode 编码是 U+6211。这里的“U+”表示这是一个 Unicode 编码,后面的数字是十六进制的...

    Unicode编码所有汉字

    要使用Java来处理Unicode编码的所有汉字,首先你需要确保你的开发环境已经正确安装了Java运行时环境(JRE)和Java开发工具包(JDK)。JDK包含了Java编译器和各种开发工具,其中`javac`命令用于将源代码编译成可执行...

    Java显示Unicode特殊字符.rar

    Java显示Unicode特殊字符, protected char base; // 指定我们显示的初始值7  protected Font font = new Font("serif", Font.PLAIN, 18); // 指定缺省的显示字体  protected Font headingfont = new Font(...

    中文 转 Unicode,及判断中文及中中文位置

    java 中 中文ToUnicode,找字符串中的中文,进行转,只转中文,相当方便

    Unicode和汉字互相转换工具

    汉字转换则是将汉字在不同的编码格式间进行转换,如从Unicode转到GBK或者BIG5等。 Unicode与汉字的转换工具有多种实现方式,这里提到的是一个基于Java开发的工具,使用了Eclipse作为集成开发环境,并且兼容JDK7。...

Global site tag (gtag.js) - Google Analytics