网上大多都只支持纯中文字符串转换,我修改了一下,支持中英文字符串的转换,代码如下:
/**
* @author lifm
*
*/
public class StringUtil {
public static String gbk2Unicode(String str) {
StringBuffer ret = new StringBuffer();
String tmp = null;
try {
byte[] bb = str.getBytes("UTF-16");
for (int i = 3; i < bb.length; i+=2) {
//i++;
if (bb[i - 1] != 0)
tmp = toHEXString(bb[i - 1]) + toHEXString(bb[i]);
else
tmp = "00" + toHEXString(bb[i]);
ret.append("//u").append(tmp);
}
return ret.toString();
} catch (Exception e) {
// TODO: handle exception
return str;
}
}
public static String unicode2GBK(String str) {
String[] s = str.split("////u");
StringBuffer ret = new StringBuffer();
for(int i = 1 ; i < s.length; i++ ) {
ret.append((char)Integer.parseInt(s[i], 16));
}
return ret.toString();
}
private static String toHEXString(byte b) {
return ("" + "0123456789ABCDEF".charAt(0xf & b >> 4) + "0123456789ABCDEF"
.charAt(b & 0xF));
}
}
分享到:
相关推荐
汉字是中文字符的主要...总之,理解和掌握汉字与 Unicode 的转换技巧,是处理中文信息和跨语言通信的基础。通过合理运用编程语言中的相关函数和方法,可以方便地在两者之间进行转换,从而确保信息的准确传递和处理。
在计算机科学领域,字符编码是...总的来说,汉字与Unicode的互相转换涉及到字符编码理论、字节顺序理解、编程语言的字符串处理技巧以及对HTML的解析能力。掌握这些知识对于进行跨语言、跨平台的文本处理工作至关重要。
### 实现中文与Unicode互相转换的重要性 在信息技术领域中,数据的编码方式是确保信息准确传输和显示的基础。中文字符由于其复杂性,在早期的计算机系统中常常面临着编码不统一的问题,导致信息传递过程中出现乱码...
Unicode和汉字转换是计算机处理中文字符时经常遇到的问题。Unicode是一种国际编码标准,它为世界上几乎所有的文字系统提供了一个统一的编码方式,包括汉字。汉字转换则是将汉字在不同的编码格式间进行转换,如从...
Java实现中文字符串与unicode互转工具类是指使用Java语言实现中文字符串与unicode码之间的相互转换。这个工具类主要用于解决中文字符串与unicode码之间的转换问题,提供了escape和unescape两个函数,分别用于将中文...
利用java快速完成汉字、Unicode编码的互相转换。 请自行编译成class文件并运行。 程序自动识别汉字和Unicode码并进行转换。
### Java字符串取GBK与UNICODE编码及相互转换详解 #### 一、引言 在处理中文等非ASCII字符时,经常需要对字符串进行编码转换,尤其是GBK和Unicode之间的转换。本文将详细介绍如何在Java中实现字符串从GBK到Unicode...
标题"中文和Punycode相互转换Java包"暗示了这是一个Java库,专门设计用于处理中文字符和Punycode之间的转换。这个库包含了两个关键文件:`PunycodeUtil.java`和`PunyException.java`。 `PunycodeUtil.java`很可能是...
这个“Unicode—汉字互相转换工具”正是基于这一标准,为用户提供了一个便捷的平台来查询汉字与Unicode编码之间的相互转换。 在信息技术领域,Unicode的重要性不言而喻。它解决了早期计算机系统中各种不同的字符...
上述代码段展示了如何在Java中实现Unicode和中文字符之间的相互转换。首先是将字符串编码为Unicode表示: ```java public static String gbEncoding(final String gbString) { char[] utfBytes = gbString....
### JAVA字符编码详解:Unicode, ISO-8859-1, GBK, UTF-8 及其相互转换 #### 一、引言 在Java编程中,字符编码的管理和转换是一项基本而又重要的任务。不同的编码标准适用于不同的场景,而理解和掌握这些编码之间...
在这个测试中,我们先将一个包含中文字符的字符串`test`转换为Unicode编码,然后将Unicode编码转换回去,最后打印出原始字符串和转换后的字符串。输出结果应与输入一致,证明了转换过程的正确性。 通过以上代码,...
支持unicode码和字符之间的相互转换
GBK是中国大陆广泛使用的编码标准,它是GB2312的扩展,兼容了大部分GBK字符,主要针对中文环境,包含了许多汉字和一些其他语言的字符,但不支持Unicode。 在C语言中,进行这些编码间的转换是一项基础任务。下面分别...
本文将深入探讨如何在Java中实现中文与Unicode之间的相互转换,这对于跨平台、国际化应用程序的开发至关重要。 #### 二、Unicode基础知识 Unicode是一种字符编码标准,旨在为每种语言中的每个字符分配唯一的数字...
### 关于JAVA字符编码:Unicode, ISO-8859-1, GBK, UTF-8 编码及相互转换 在Java开发过程中,字符编码是处理文本数据的基础,不同的编码方式会影响数据的存储、传输以及显示。本文将详细介绍几种常见的字符编码...
Unicode编码是通过一个唯一的数字来代表每一个字符,使得各种字符集之间能够互相转换。这个软件支持的三种编码格式——UTF-16LE、UTF-16BE和UTF-8,都是Unicode编码的实现方式。 - UTF-16LE(Little Endian)是...
本知识点将详细介绍如何在Java中实现字符串和Unicode字符的相互转换,并通过代码示例进行深入解析。 首先,需要明确Unicode是计算机上使用的一种字符编码方式,它为世界上几乎所有已知的文字符号都提供了唯一性的...
在JAVA系统里进行UNICODE码和汉字间的相互转换,方便书写不同编码下的程序
通过对Big5与Unicode之间的转换原理和Java实现的介绍,我们可以更好地理解不同字符编码之间的关系及其转换机制。这对于我们开发支持多语言的应用程序具有重要意义。同时,掌握这些编码转换的方法也有助于我们在遇到...