`

toUnicode

    博客分类:
  • JAVA
阅读更多

//特殊字符转UNICODE
public static String toUnicode(String theString, boolean escapeSpace) {
        int len = theString.length();
        int bufLen = len * 2;
        if (bufLen < 0) {
            bufLen = Integer.MAX_VALUE;
        }
        StringBuffer outBuffer = new StringBuffer(bufLen);

        for(int x=0; x<len; x++) {
            char aChar = theString.charAt(x);
            // Handle common case first, selecting largest block that
            // avoids the specials below
            if ((aChar > 61) && (aChar < 127)) {
                if (aChar == '\\') {
                    outBuffer.append('\\'); outBuffer.append('\\');
                    continue;
                }
                outBuffer.append(aChar);
                continue;
            }
            switch(aChar) {
                case ' ':
                    if (x == 0 || escapeSpace)
                        outBuffer.append('\\');
                    outBuffer.append(' ');
                    break;
                case '\t':outBuffer.append('\\'); outBuffer.append('t');
                          break;
                case '\n':outBuffer.append('\\'); outBuffer.append('n');
                          break;
                case '\r':outBuffer.append('\\'); outBuffer.append('r');
                          break;
                case '\f':outBuffer.append('\\'); outBuffer.append('f');
                          break;
                case '=': // Fall through
                case ':': // Fall through
                case '#': // Fall through
                case '!':
                    outBuffer.append('\\'); outBuffer.append(aChar);
                    break;
                default:
                    if ((aChar < 0x0020) || (aChar > 0x007e)) {
                        outBuffer.append('\\');
                        outBuffer.append('u');
                        outBuffer.append(toHex((aChar >> 12) & 0xF));
                        outBuffer.append(toHex((aChar >>  8) & 0xF));
                        outBuffer.append(toHex((aChar >>  4) & 0xF));
                        outBuffer.append(toHex( aChar        & 0xF));
                    } else {
                        outBuffer.append(aChar);
                    }
            }
        }
        return outBuffer.toString();
    }

        private static char toHex(int nibble) {
        return hexDigit[(nibble & 0xF)];
    }
        private static final char[] hexDigit = {
        '0','1','2','3','4','5','6','7','8','9','A','B','C','D','E','F'
    };

分享到:
评论

相关推荐

    免费且超小的unicode编码转换软件(toUnicode)

    标题中的“免费且超小的unicode编码转换软件(toUnicode)”指的是一个专门用于进行Unicode编码转换的小型软件。这个工具允许用户将编辑的文本中的各种符号和字符转换成Unicode编码,以UTF-16LE、UTF-16BE和UTF-8三...

    gb2312tounicode对照表

    本文将深入探讨GB2312与Unicode这两种字符编码系统,并围绕提供的"gb2312tounicode对照表"进行详细的解析。 GB2312,全称为“汉字国标交换码”,是中国大陆于1980年制定的一种简体汉字编码标准,主要用于早期的中文...

    Txt To unicode转换器

    Unicode转换器是一款针对文本文件的专业工具,主要用于将普通的ASCII编码的TXT文本文件转换为Unicode编码格式,以便在各种设备上,特别是智能手机上,能够正确显示和阅读这些文本内容。Unicode是一种广泛使用的字符...

    TharConvert.zip_arc_ascii_ascii to unicode_unicode_unicode ascii

    在本压缩包"TharConvert.zip_arc_ascii_ascii to unicode_unicode_unicode ascii"中,包含的源程序和文档可能涉及了将ASCII编码转换为Unicode编码,以及反过来将Unicode转换为ASCII的过程。下面将详细解释这些概念和...

    vb utf8转Unicode

    1. **函数定义**:`Utf8ToUnicode`接受一个字节数组`Utf()`作为参数,返回转换后的Unicode字符串。 2. **循环处理**:通过循环遍历每个字节,根据第一个字节的值判断当前字符占用的字节数。 3. **多字节处理**:对于...

    ASCII to Unicode

    在IT领域,字符编码是处理文本数据的基础,而ASCII与Unicode是两种常见的字符编码标准。本文将深入探讨ASCII到Unicode的转换,以及涉及到的相关技术,如UTF-16和unescape函数。 首先,ASCII(美国信息交换标准代码...

    UTF-8转Unicode

    `Utf8ToUnicode.exe` 是一个用于将UTF-8格式的文本文件转换为Unicode(通常是UTF-16LE,小端字节序)的命令行工具。其用法非常简单:`Utf8ToUnicode.exe 源文件名 目标文件名`。在这个命令中,`源文件名`是你想要...

    GB2312于Unicode互转C语言程序(完整VS2010工程)

    压缩包内的文件“gB2312toUnicode”可能是一个可执行文件,也可能是源代码文件,或者是包含转换函数的库。如果它是源代码,那么可能包含了上述步骤的具体实现,可以通过阅读和分析代码来学习如何在C语言中处理字符...

    delphi code update from ansi to unicode

    ANSI转 Unicode 文本替换 替换规则 old=new (用txt维护替换规则,一行维护一个记录) 打包 fr2x-fr3converter.zip 工具,转换*.frf 到 *.fr3 适合delphi程序 ansi版升级到 unicode版 特点:批量检索工程文件,批量...

    to-unicode:将字符串转换为unicode

    )安装npm install to-unicode 例子 var str = 'capitalism'var unicody = toUnicode(str, 'inverted')var flipper = '(╯°□°)╯︵ 'console.log(flipper + unicody.split("").reverse().join(""))=&gt; (╯°□°...

    CP1252、GB2312 to Unicode映射表

    这是一个包括CP1252(英文)、GB2312(中文)到Unicode的映射表文件。

    Zawgyi Text to Unicode-crx插件

    2.0版更新 **如果所选文本输入文本框,请直接转换 **添加到从Unicode转换为Zawgyi Chrome扩展将选定的文本转换为Unicode或Unicode 这个延伸是对像我这样的人顽固地不想改变字体风格只是为了阅读文本。 但有时当你想...

    Converter:Zawgyi 到 Unicode 转换器的示例使用 Rabbit 谢谢@Ko Saturngod

    项目描述中提到的"Sample project for Zawgyi to Unicode converter"是一个实际的应用示例,它提供了从Zawgyi编码转换到Unicode编码的功能。这个转换器对于那些需要在不同编码系统之间交换文本的用户,尤其是缅甸语...

    UNICODE与UTF-8转换

    **标题:**UNICODE与UTF-8转换 **正文:** 在计算机科学中,字符编码是用于表示文本的一种方式,特别是在计算机系统中。UNICODE和UTF-8是两种广泛使用的字符编码标准,它们各自有着独特的特性和应用场景。本文将...

    utf-8与unicode相互转换代码

    utf-8与unicode相互转换代码

    Convert ANSI files to UNICODE files-开源

    标题中的“Convert ANSI files to UNICODE files-开源”指的是一个开源的命令行工具,其主要功能是将使用ANSI编码的文本文件转换成使用Unicode编码的文本文件。在计算机编程领域,编码方式对于处理多语言字符集至关...

    GB2312转换为Unicode编码表

    用于文字编码转换的GB2312转Unicode数据表,用于文字编码转换的GB2312转Unicode数据表

    GB-Unicode对照表

    # Name: GB2312-80 to Unicode table (complete, hex format) # Unicode version: 3.0 # Table version: 1.0 # Table format: Format A # Date: 1999 October 8 # Author: Ken Whistler # Original authors: Glenn ...

    如何将一个ansi的文本文件转为unicode格式

    在给定的文件信息中,提到了几种不同的方法和过程,包括`TGBUCS.GB_USC2`、`TopAnsiToUTF8`、`UTF8ToUnicode`以及`StringToWideChar`等函数。这里,我们将深入探讨这些方法,理解其工作原理,并提供一些额外的解释和...

    Unicode编码与汉字互转.rar

    这里,`fromUnicode()`方法将UTF-32LE编码的字节序列(对应于\u格式的Unicode编码)转换为QString,而`toUnicode()`方法则将汉字字符串转换为UTF-32BE编码,然后通过`toHex().toUpper()`得到16进制的Unicode编码。...

Global site tag (gtag.js) - Google Analytics