`

如何将文本中的Unicode转换成中文

 
阅读更多

 

  Unicode 是为了解决传统的字符编码方案的局限而产生的,例如ISO 8859所定义的字符虽然在不同的国家中广泛地使用,可是在不同国家间却经常出现不兼容的情况。很多传统的编码方式都有一个共同的问题,即容许电脑处理双语环境(通常使用拉丁字母以及其本地语言),但却无法同时支持多语言环境(指可同时处理多种语言混合的情况)。

/**
* unicode 转换成 中文
* @param str
* @return
*/
public static String decodeUnicode(String str) {
    char aChar;
    int len = str.length();
    StringBuffer outBuffer = new StringBuffer(len);
    for (int x = 0; x < len;) {
        aChar = str.charAt(x++);
        if (aChar == '\\') {
        aChar = str.charAt(x++);
        if (aChar == 'u') {
            // Read the xxxx
            int value = 0;
            for (int i = 0; i < 4; i++) {
                aChar = str.charAt(x++);
                switch (aChar) {
                case '0':
                case '1':
                case '2':
                case '3':
                case '4':
                case '5':
                case '6':
                case '7':
                case '8':
                case '9':
                    value = (value << 4) + aChar - '0';
                    break;
                case 'a':
                case 'b':
                case 'c':
                case 'd':
                case 'e':
                case 'f':
                    value = (value << 4) + 10 + aChar - 'a';
                    break;
                case 'A':
                case 'B':
                case 'C':
                case 'D':
                case 'E':
                case 'F':
                    value = (value << 4) + 10 + aChar - 'A';
                    break;
                default:
                    throw new IllegalArgumentException(
                            "Malformed   \\uxxxx   encoding.");
                }
            }
            outBuffer.append((char) value);
        } else {
            if (aChar == 't')
                aChar = '\t';
            else if (aChar == 'r')
                aChar = '\r';
            else if (aChar == 'n')
                aChar = '\n';
            else if (aChar == 'f')
                aChar = '\f';
                outBuffer.append(aChar);
            }
        } else
            outBuffer.append(aChar);
    }
    return outBuffer.toString();
}

 

分享到:
评论

相关推荐

    java 中文Unicode转换

    总的来说,Java提供了丰富的API来处理Unicode编码,无论是转换中文字符还是从Unicode码点恢复字符,都可以轻松实现。在处理多语言文本时,理解和熟练运用Unicode编码是至关重要的。通过上述方法,你可以有效地在Java...

    unicode和中文互相转换工具

    unicode和中文互相转换工具,支持不同编码格式。

    Unicode码转中文和中文转Unicode码的最简便的方法

    这会将`a.txt`中的中文字符转换成Unicode码,并保存到`b.txt`中。 **Unicode码转中文**: 1. 假设你已经有了一个包含Unicode码的文件`b.txt`,现在要将其转换回中文。 2. 同样,打开命令行窗口并切换到`b.txt`...

    文本与unicode转换工具

    本文将深入探讨“文本与Unicode转换工具”及其相关知识点,帮助你理解和利用这种工具进行有效的文本处理。 首先,我们来理解什么是Unicode。Unicode是一个非营利组织制定的字符集,它为每个字符分配了一个唯一的...

    汉字unicode转换器

    总之,汉字Unicode转换器是一个实用的工具,它简化了在汉字和Unicode编码之间的转换操作,确保了在不同环境下的文本处理和数据交换的准确性。Unicode编码系统的使用,对于全球化的信息交流和处理具有重要意义,尤其...

    汉字unicode相互转换器

    汉字Unicode转换器的工作原理是将汉字字符转换成对应的Unicode码点,或者反之。例如,当我们输入汉字“你好”,这个工具会将其转换为Unicode编码:“\u4f60\u597d”。在计算机内部,这些Unicode码点会被存储和传输,...

    TXT电子书批量转换中文Unicode编码

    "TXT电子书批量转换中文Unicode编码"这个工具就是为了应对这种情况而设计的。它是一个高效、便捷的解决方案,帮助用户将TXT格式的电子书从非Unicode编码转换为Unicode编码,确保在各种设备上都能正确显示中文字符。 ...

    unicode和汉字转换

    在描述中提到的“实现Unicode和汉字的互相转码”,这意味着提供的资源可能是一个工具或者程序,可以将Unicode编码的文本转换为特定的汉字编码,反之亦然。这在处理不同系统间的数据交换时尤其有用,例如,当需要将...

    Unicode转换成GBK

    ### Unicode转换成GBK知识点解析 #### 一、前言 在多语言环境下,字符编码转换是常见的需求之一。Unicode作为一种国际标准的字符编码方案,能够支持世界上几乎所有已知的文字系统,而GBK则是一种用于简体中文环境...

    中文转化为unicode格式的方法类

    本文将深入探讨如何将中文字符转换为 Unicode 格式,并介绍一个名为 `unicodeConvert.java` 的 Java 类,该类已通过实际程序验证,确保了其功能的可行性。 Unicode 编码通常采用 UTF-8、UTF-16 或 UTF-32 这样的...

    将中文转换成unicode格式

    将中文字符转换成Unicode格式是一项基本的技术操作,特别适用于需要将中文内容以编码形式传输或存储的场合。例如,在进行短信发送时,为了确保中文字符能够在不同系统间正确显示,通常需要将中文内容转换为Unicode...

    汉字Unicode转换器

    汉字Unicode转换器是一种工具,主要用于在汉字和Unicode编码之间进行转换。...通过理解汉字Unicode转换器的工作原理和使用方法,我们可以更有效地处理包含汉字的文本,特别是在多语言环境下的信息技术工作中。

    unicode 转换工具 集合

    在Unicode转换中,decode可能是指将使用特定编码(如UTF-8或GBK)的字符串转换回Unicode码点的过程。例如,使用Python的`codecs.decode()`函数可以实现这一操作。 4. "ParseUnicode": ParseUnicode可能是一个功能...

    Txt To unicode转换器

    Unicode转换器是一款针对文本文件的专业工具,主要用于将普通的ASCII编码的TXT文本文件转换为Unicode编码格式,以便在各种设备上,特别是智能手机上,能够正确显示和阅读这些文本内容。Unicode是一种广泛使用的字符...

    汉字转换成Unicode

    汉字转换成Unicode是一种常见的字符编码转换过程,尤其是在处理多语言文本和网络传输时。Unicode是一种国际标准,旨在统一世界上所有语言的文字表示,提供一个唯一的数字来代表每一个字符,无论这个字符属于哪种语言...

    汉字与unicode转换工具

    总的来说,汉字与Unicode转换工具的目的是帮助开发者和用户在不同编码系统之间进行有效的数据交换和处理,确保汉字信息的准确无误。这样的工具通常会提供接口或者命令行选项,允许用户选择输入和输出的编码格式,...

    gb18030与unicode转换表

    总的来说,GB18030与Unicode转换表是跨平台、跨语言数据交换的重要工具,理解并掌握其工作原理和使用方法,对于IT从业人员来说具有重要意义,特别是在处理中文字符集的项目中。通过深入学习和应用这个转换表,我们...

    unicode至汉字的批量转换

    2. **码点转换**:遍历指定范围内的每一个码点,使用Unicode转换函数将其转换为对应的汉字。例如,在Python中可以使用`chr()`函数完成这个任务。 3. **存储结果**:将转换得到的汉字存储到合适的数据结构中,如列表...

    Go-Unicode文本的ASCII转换形式

    "Go-Unicode文本的ASCII转换形式"这个主题聚焦于如何将Unicode文本转换成ASCII可表示的形式,这对于处理跨语言数据、存储或传输时保持兼容性至关重要。Unicode是一个广泛采用的字符集,它包含了世界上几乎所有的文字...

Global site tag (gtag.js) - Google Analytics