`

java unicode编码转换才成汉字

    博客分类:
  • java
阅读更多
package com.bky.controller;


public class Test {

private static String loadConvert (char[] in, int off, int len, char[] convtBuf) { 
        if (convtBuf.length < len) { 
            int newLen = len * 2; 
            if (newLen < 0) { 
            newLen = Integer.MAX_VALUE; 
        }  
        convtBuf = new char[newLen]; 
        } 
        char aChar; 
        char[] out = convtBuf;  
        int outLen = 0; 
        int end = off + len; 
        while (off < end) { 
            aChar = in[off++]; 
            if (aChar == '\\') { 
                aChar = in[off++];    
                if(aChar == 'u') { 
                    int value=0; 
            for (int i=0; i<4; i++) { 
                aChar = in[off++];   
                switch (aChar) { 
                  case '0': case '1': case '2': case '3': case '4': 
                  case '5': case '6': case '7': case '8': case '9': 
                     value = (value << 4) + aChar - '0'; 
                 break; 
              case 'a': case 'b': case 'c': 
                          case 'd': case 'e': case 'f': 
                 value = (value << 4) + 10 + aChar - 'a'; 
                 break; 
              case 'A': case 'B': case 'C': 
                          case 'D': case 'E': case 'F': 
                 value = (value << 4) + 10 + aChar - 'A'; 
                 break; 
              default: 
                              throw new IllegalArgumentException( 
                                           "Malformed \\uxxxx encoding."); 
                        } 
                     } 
                    out[outLen++] = (char)value; 
                } else { 
                    if (aChar == 't') aChar = '\t';  
                    else if (aChar == 'r') aChar = '\r'; 
                    else if (aChar == 'n') aChar = '\n'; 
                    else if (aChar == 'f') aChar = '\f';  
                    out[outLen++] = aChar; 
                } 
            } else { 
            out[outLen++] = (char)aChar; 
            } 
        } 
        return new String (out, 0, outLen); 
    } 

public static void main(String[] args) {
//String str="\u5f00\u53d1\u533a\u5e97";
String str="\u5218\u6d9b";
char[] convtBuf=new char[2]; 
System.out.println(loadConvert(str.toCharArray(),0,str.length(),convtBuf));
}

}
分享到:
评论

相关推荐

    java 中文Unicode转换

    总的来说,Java提供了丰富的API来处理Unicode编码,无论是转换中文字符还是从Unicode码点恢复字符,都可以轻松实现。在处理多语言文本时,理解和熟练运用Unicode编码是至关重要的。通过上述方法,你可以有效地在Java...

    Java做的Unicode编码转换器

    Java编写的Unicode编码转换器是一种实用工具,它能够帮助用户将各种国家和地区的文字转换成Unicode编码,同时也能实现从Unicode编码回转到原始字符。Unicode是一种国际标准,旨在为全球所有的字符提供一个统一的编码...

    Unicode编码转换源码

    总之,Unicode编码转换源码是关于在不同编码体系之间进行转换的程序,涉及Unicode码点和各种编码格式如UTF-8的交互。掌握这一技术有助于实现跨平台、跨语言的信息交换,对于构建全球化软件至关重要。通过深入理解...

    Unicode码转中文和中文转Unicode码的最简便的方法

    这将把`b.txt`中的Unicode码转换回中文,并保存到`c.txt`中。 通过这种方式,你可以方便地在Unicode码和中文字符之间进行转换,这对于处理多语言文本或跨平台的字符编码问题非常有帮助。在处理涉及不同编码格式的...

    Unicode中文编码对照表

    标签“源码”暗示了这个话题可能涉及到编程和代码实现,可能讲解了如何在编程语言中使用Unicode编码来处理中文字符,例如Java、Python或C++。而“工具”标签则可能意味着存在某种工具或库,可以帮助开发者进行...

    最全的常用汉字Unicode码表

    3. **文本编辑器插件**:部分高级文本编辑器提供了专门用于查看和转换Unicode编码的插件或扩展功能。 #### Unicode与汉字的发展趋势 随着技术的进步和社会需求的变化,Unicode也在不断地更新和完善中。未来,我们...

    java实现十六进制字符unicode与中英文转换示例

    在Java编程语言中,处理Unicode编码和十六进制字符转换是一项常见的任务,特别是在处理文本数据时。本示例探讨了如何使用Java实现从Unicode十六进制字符串到中英文字符的转换,以及反过来的过程。理解Unicode和UTF...

    Unicode码转换器

    1. **文件整体转换**:能够将整个包含汉字的文件转换成Unicode编码。这意味着文件中的每个字符都会被替换为对应的Unicode值,这样不论在何种操作系统或编程环境中,都能正确识别并显示文件中的文字,解决了由于不同...

    中文与asc码unicode码互转

    在中文环境下,常用的Unicode编码方案有GB2312、GBK和UTF-8等,其中UTF-8是目前最广泛使用的编码格式,它是一种变长编码,可以高效地存储英文和中文混合的文本。 中文与ASC码、Unicode码之间的转换通常需要特定的...

    Java利用ascii码表把汉字转换成拼音

    然而,由于ASCII码表不包含汉字,所以直接使用ASCII码表来转换汉字并不直接可行。我们需要借助其他方法。 Java中,我们可以使用Pinyin4j这样的第三方库来实现汉字到拼音的转换。Pinyin4j是一个Java工具包,它能够将...

    汉字与unicode相互转换

    汉字与 Unicode 的转换在处理中文文本时尤其重要,例如在网页编码、数据库存储、文本传输等方面。不同的编码方式(如 GB2312, GBK, Big5 等)可能会导致乱码问题,而使用 Unicode(如 UTF-8 编码)可以避免这类问题...

    JAVA反编译和unicode转字符.rar

    描述中的“反编译后的汉字unicode显示格式转换为字符格式的代码”意味着在反编译过程中,可能会遇到汉字以Unicode编码形式出现,这通常是由于Java字节码中存储字符串的方式决定的。Unicode编码虽然通用,但在直接...

    汉字unicode转换换工具可直接用浏览器打开.rar

    总之,"汉字unicode转换换工具可直接用浏览器打开.rar"是一个方便的、无需安装的Unicode转换解决方案,尤其适用于Java开发者在处理配置文件时快速转换汉字到Unicode编码。其易用性和高效性使得它成为日常工作中的...

    Java文件编码转换源码

    UTF-8则是一种可变长度的Unicode编码,能表示世界上几乎所有的字符。 在Java中,我们可以使用`java.nio.charset`包下的类来处理编码转换。其中,`Charset`类代表了一种字符集,`CharsetDecoder`和`CharsetEncoder`...

    Unicode码转换工具

    “Unicode码转换工具”是指用于处理Unicode编码的软件或程序,它能够帮助用户在不同的字符编码之间进行转换,确保不同系统或语言环境下的文本数据能够正确无误地显示和交换。Unicode是一种国际标准,它为世界上几乎...

    java汉字<<>>Unicode编码转换工具

    利用java快速完成汉字、Unicode编码的互相转换。 请自行编译成class文件并运行。 程序自动识别汉字和Unicode码并进行转换。

    中文转化为unicode格式的方法类

    本文将深入探讨如何将中文字符转换为 Unicode 格式,并介绍一个名为 `unicodeConvert.java` 的 Java 类,该类已通过实际程序验证,确保了其功能的可行性。 Unicode 编码通常采用 UTF-8、UTF-16 或 UTF-32 这样的...

    java编码格式转换

    - 示例:将字符串`"中文"`从Unicode编码转换为GBK编码。 - 使用`public String(byte[] bytes, String charsetName)`方法可以将字节数组从指定编码转换回字符串。 - 示例:将GBK编码的字节数组转换回Unicode编码的...

    Unicode编码转换小工具

    这个“Unicode编码转换小工具”是由Java开发的,可以帮助用户将字符串转化为Unicode编码形式,这对于处理多语言文本或者进行数据传输时避免字符乱码问题非常有用。 在编程领域,尤其是涉及到字符串处理时,了解...

    Unicode编码转GBK编码(汉字转GBK)

    在网上找资料很少有汉字直接转GBK编码格式,一般都是汉字转Unicode编码,这套是将汉字先转换成Unicode编码,在通过参照表得出汉字的GBK编码数据。虽然是一个js文件,但是加以修改可以用于很多平台上如:小程序,...

Global site tag (gtag.js) - Google Analytics