public class Test {
public static void main(String[] args) {
String s = "简介";
String tt = gbEncoding(s);
System.out.println(decodeUnicode(tt));
}
public static String gbEncoding(final String gbString) {
char[] utfBytes = gbString.toCharArray();
String unicodeBytes = "";
for (int byteIndex = 0; byteIndex < utfBytes.length; byteIndex++) {
String hexB = Integer.toHexString(utfBytes[byteIndex]);
if (hexB.length() <= 2) {
hexB = "00" + hexB;
}
unicodeBytes = unicodeBytes + "\\u" + hexB;
}
System.out.println("unicodeBytes is: " + unicodeBytes);
return unicodeBytes;
}
public static String decodeUnicode(final String dataStr) {
int start = 0;
int end = 0;
final StringBuffer buffer = new StringBuffer();
while (start > -1) {
end = dataStr.indexOf("\\u", start + 2);
String charStr = "";
if (end == -1) {
charStr = dataStr.substring(start + 2, dataStr.length());
} else {
charStr = dataStr.substring(start + 2, end);
}
char letter = (char) Integer.parseInt(charStr, 16); // 16进制parse整形字符串。
buffer.append(new Character(letter).toString());
start = end;
}
return buffer.toString();
}
}
分享到:
相关推荐
各类编码转换,从unicode 到 Shift-JIS
总的来说,Java提供了丰富的API来处理Unicode编码,无论是转换中文字符还是从Unicode码点恢复字符,都可以轻松实现。在处理多语言文本时,理解和熟练运用Unicode编码是至关重要的。通过上述方法,你可以有效地在Java...
### JAVA字符编码详解:Unicode, ISO-8859-1, GBK, UTF-8 及其相互转换 #### 一、引言 在Java编程中,字符编码的管理和转换是一项基本而又重要的任务。不同的编码标准适用于不同的场景,而理解和掌握这些编码之间...
本示例探讨了如何使用Java实现从Unicode十六进制字符串到中英文字符的转换,以及反过来的过程。理解Unicode和UTF之间的关系是至关重要的。 Unicode是一个国际标准,它为世界上几乎所有的字符提供了一个唯一的数字...
汉字与 Unicode 的转换在处理中文文本时尤其重要,例如在网页编码、数据库存储、文本传输等方面。不同的编码方式(如 GB2312, GBK, Big5 等)可能会导致乱码问题,而使用 Unicode(如 UTF-8 编码)可以避免这类问题...
### 关于JAVA字符编码:Unicode, ISO-8859-1, GBK, UTF-8 编码及相互转换 在Java开发过程中,字符编码是处理文本数据的基础,不同的编码方式会影响数据的存储、传输以及显示。本文将详细介绍几种常见的字符编码...
在Java开发中,遇到中文乱码问题是一种常见的挑战,特别是在处理URL时。URL中文乱码问题主要是由于URL编码和解码过程中的不一致导致的。下面将详细介绍如何解决这个问题,并探讨几种常用的方法。 首先,我们需要...
这个Java实现的Unicode转换器可能包括以下几个核心功能: 1. **字符到Unicode编码转换**:程序会遍历输入的文本,对每个字符进行编码,输出对应的Unicode值。Unicode值是16进制数字,通常以`\u`开头,例如`\u4E2D`...
GBK,全称“国标汉字扩展A区编码”,是中国大陆的一个汉字编码标准,它是GB2312的扩展,包含更多的汉字和符号,尤其是在处理简体中文时非常常见。GBK编码在UTF-8之前被广泛使用,但因为不支持Unicode,所以在跨语言...
unicode 汉字转换器 unicode 汉字转换器 基于java编写,是个jar包,安装jdk后,直接双击
在这个例子中,它可能链接到了一个与Unicode编码、中文转换或者与"Unicode.exe"相关的网站,提供更多的信息、教程或者更新。 Unicode编码在IT行业中有着广泛的应用。例如,HTML和XML文档使用Unicode作为其字符集的...
标题 "Unicode-Mapping-on-Domain-names-源码.rar" 暗示了这个压缩包包含的是与Unicode在域名中的映射相关的源代码。这通常涉及到国际化的互联网域名系统(IDN,Internationalized Domain Names),它允许使用非...
MySQL Connector/J 5.1.39 是 MySQL 数据库与 Java 应用程序之间的关键桥梁,它是 MySQL 官方提供的 JDBC 驱动程序。JDBC(Java Database Connectivity)是 Java 平台上用于访问数据库的标准 API,使得 Java 开发...
在计算机科学领域,字符编码是将字符转换为二进制表示的过程,以便计算机可以处理和存储文本。Unicode编码是一种国际标准,旨在解决不同语言和字符集之间的兼容性问题。Unicode编码转换源码主要关注如何在不同的编码...
在编程领域,Unicode 是...`unicodeConvert.java` 类是实现这一功能的代码载体,它可以方便地在各种场景下进行中文字符与 Unicode 之间的转换。理解和掌握这些概念与方法对于进行多语言编程和处理国际化问题至关重要。
Java反编译与Unicode字符转换是Java开发过程中两个重要的技术环节。反编译是指将已编译的字节码(.class文件)转换回源代码的过程,这对于理解已有的类库或者进行逆向工程非常有用。Unicode是国际通用的字符编码标准,...
在Java开发过程中,处理Unicode表情符号(Emoji)可能是一项挑战,因为并非所有Java API都原生支持它们。这时,第三方库如"emoji-java"就显得非常有用。这个库由vdurmont开发,专为Java提供了方便的方式来解析、验证...
2. **汉字单独转换**:除了整体转换文件,此工具还支持对单个汉字进行Unicode转换。这对于开发者来说非常有用,例如在编程过程中需要手动输入特殊字符的Unicode编码时,可以直接通过工具快速获取。 3. **结果保存**...
此外,HTML文件中,`ZHS_Unicode.html`可能包含关于汉字与Unicode转换的详细信息。HTML支持使用字符实体(Character Entities)来表示Unicode字符,如`中`代表汉字“中”。通过解析HTML文档,可以提取这些字符...