http://my.oschina.net/friendship/blog/485542
public static String decodeUnicode(String theString) {
char aChar;
int len = theString.length();
StringBuffer outBuffer = new StringBuffer(len);
for (int x = 0; x < len;) {
aChar = theString.charAt(x++);
if (aChar == '\\') {
aChar = theString.charAt(x++);
if (aChar == 'u') {
// Read the xxxx
int value = 0;
for (int i = 0; i < 4; i++) {
aChar = theString.charAt(x++);
switch (aChar) {
case '0':
case '1':
case '2':
case '3':
case '4':
case '5':
case '6':
case '7':
case '8':
case '9':
value = (value << 4) + aChar - '0';
break;
case 'a':
case 'b':
case 'c':
case 'd':
case 'e':
case 'f':
value = (value << 4) + 10 + aChar - 'a';
break;
case 'A':
case 'B':
case 'C':
case 'D':
case 'E':
case 'F':
value = (value << 4) + 10 + aChar - 'A';
break;
default:
throw new IllegalArgumentException("Malformed \\uxxxx encoding.");
}
}
outBuffer.append((char) value);
} else {
if (aChar == 't')
aChar = '\t';
else if (aChar == 'r')
aChar = '\r';
else if (aChar == 'n')
aChar = '\n';
else if (aChar == 'f')
aChar = '\f';
outBuffer.append(aChar);
}
} else
outBuffer.append(aChar);
}
return outBuffer.toString();
}
分享到:
相关推荐
本文将深入探讨如何在Java中进行中文字符到Unicode编码的转换,以及如何从Unicode编码还原为中文字符。 首先,我们来了解Unicode的基本概念。Unicode是一个国际标准,它为每个字符分配了一个唯一的数字,这个数字被...
### Java中的Unicode与字符集详解 #### 一、引言 在软件开发过程中,正确处理文本数据至关重要。尤其是在全球化日益加深的今天,软件不仅要能够处理英语等常见的西方语言,还要支持世界各地的语言,包括中文、日文...
首先,它将输入的十六进制字符串转换为字节数组,然后使用这些字节尝试以UTF-8、UTF-16(与Unicode相同)、UTF-16LE(小端字节序)、UTF-16BE(大端字节序)、UTF-32以及各自的LE和BE版本进行解码。`str2all`方法则...
本文将深入探讨如何将中文字符转换为 Unicode 格式,并介绍一个名为 `unicodeConvert.java` 的 Java 类,该类已通过实际程序验证,确保了其功能的可行性。 Unicode 编码通常采用 UTF-8、UTF-16 或 UTF-32 这样的...
描述中的“反编译后的汉字unicode显示格式转换为字符格式的代码”意味着在反编译过程中,可能会遇到汉字以Unicode编码形式出现,这通常是由于Java字节码中存储字符串的方式决定的。Unicode编码虽然通用,但在直接...
Java编写的Unicode编码转换器是一种实用工具,它能够帮助用户将各种国家和地区的文字转换成Unicode编码,同时也能实现从Unicode编码回转到原始字符。Unicode是一种国际标准,旨在为全球所有的字符提供一个统一的编码...
这个工具类主要用于解决中文字符串与unicode码之间的转换问题,提供了escape和unescape两个函数,分别用于将中文字符串转换为unicode码和将unicode码转换回中文字符串。 在了解这个工具类之前,我们需要了解什么是...
2. **转换**:如果输入是Unicode,工具会将其转换为汉字;反之,如果输入是汉字,工具会将其转换为Unicode编码。这通常涉及到`String`类的编码和解码操作。 3. **输出结果**:转换后的结果会以适当的形式展示给用户...
中文转Unicode码和Unicode码转中文的过程在Java环境下可以通过`native2ascii`工具轻松实现,这个工具是Java开发工具包(JDK)的一部分。 **中文转Unicode码**: 1. 首先,你需要确保已经安装了Java JDK。JDK包含了...
针对Java配置文件和其他场景中需要将汉字转换为Unicode编码的需求,有一个便捷的工具,即"汉字unicode转换换工具可直接用浏览器打开.rar",这个工具可以极大地简化这个过程。 该工具的独特之处在于,它可以作为一个...
标签“源码”暗示了这个话题可能涉及到编程和代码实现,可能讲解了如何在编程语言中使用Unicode编码来处理中文字符,例如Java、Python或C++。而“工具”标签则可能意味着存在某种工具或库,可以帮助开发者进行...
在这个例子中,我们首先创建了一个`OpenCc4j`对象,指定配置类型为`SimplifiedChineseToTraditionalChinese`,然后将繁体文本转换为简体文本。这只是一个基本的用法,实际应用中可能需要处理更复杂的情况,比如文件...
在实际编程中,我们可以使用编程语言提供的函数或库来实现这个转换,如 Python 中的 `ord()` 函数可以将汉字转换为 Unicode 码点,`chr()` 函数则可将 Unicode 码点转换回对应的字符。 Unicode 转汉字则是反过来的...
Unicode编码是一种国际标准字符编码方式,它为世界上几乎所有的文字系统提供了一个统一的数字表示,使得计算机能够处理各种语言的文字,包括中文。Unicode编码的核心理念是为每一个字符分配一个唯一的整数,这个整数...
这个方法使用`indexOf`和`substring`来定位和截取Unicode编码片段,然后使用`Integer.parseInt`方法将十六进制字符串转换为对应的整数,最终通过强制类型转换得到对应的字符,并将这些字符拼接起来形成一个完整的...
编码是将字符转换为计算机可以处理的二进制形式的过程。Unicode是一种国际标准编码方式,旨在为世界上所有的文字提供一个唯一的数字标识。以下是对Java中编码方式和Unicode的知识点总结: 1. 基本概念 - bit:...
这个任务要求使用循环遍历0到255之间的每一个整数,并将这些整数转换为对应的Unicode字符。这可以通过使用`char`类型实现: ```java for (int i = 0; i ; i++) { System.out.println(i + " 对应的字符: " + (char) ...
将Unicode转为中文 在Java中,可以编写一个方法将包含Unicode转义序列的字符串转换为对应的中文字符。这个过程涉及到解析Unicode转义序列,并将其转换为相应的字符。以下是一个示例方法: ```java public static ...
在Java编程语言中,将汉字转换为对应的汉语拼音是一项常见的需求,特别是在文本处理、搜索功能或者国际化应用中。为了实现这个功能,Java提供了一些库和API可以利用。本篇文章将详细探讨如何在Java中实现汉字转拼音...