字符串转化为unicode编码
package com.bensin.util;
import java.io.UnsupportedEncodingException;
/**
*
* @author Ben.Sin
*
*/
public class UnicodeUtil {
/**
*
* @param gbString
* @return
*/
public static String encodeUnicode(final String data){
char[] utfBytes = data.toCharArray();
String unicodeBytes = "";
for (char utfByte : utfBytes){
String hexByte = Integer.toHexString(utfByte);
if (hexByte.length() <= 2){
hexByte = "00" + hexByte;
}
unicodeBytes += "\\u" + hexByte;
}
return unicodeBytes;
}
public static String decodeUnicode(final String data){
int start = 0;
int end = 0;
final StringBuilder buffer = new StringBuilder();
while(start > -1){
end = data.indexOf("\\u", start + 1);
String charStr = "";
if (end == -1){
charStr = data.substring(data.length() - 4, data.length() );
} else {
charStr = data.substring(end - 4, end);
}
char letter = (char)Integer.parseInt(charStr, 16);
buffer.append(new Character(letter).toString());
start = end;
}
return buffer.toString();
}
public static void main(String[] args) throws UnsupportedEncodingException{
String str = "非常抱歉,暂不支持该文件类型!";
String unicode = encodeUnicode(str);
System.out.println(unicode);
String decode = decodeUnicode(unicode);
System.out.println(decode);
}
}
分享到:
相关推荐
这个压缩包提供的类库专门用于处理GBK和UTF8编码的字符串,并将其转换为Unicode编码,反之亦然。下面我们将深入探讨字符串编码转换的相关知识以及如何使用这个PHP类库。 Unicode是一种广泛使用的字符编码标准,它...
例如,从ANSI字符串转换为Unicode字符串时,需要知道源字符串的代码页,以便正确地解析多字节序列。反之,转换回ANSI时,也需要指定目标代码页。 3. **内存管理**:在转换过程中,需要分配足够的内存来存储目标字符...
C语言字符串转换为Python字符串的方法 C语言字符串转换为Python字符串是指将...C语言字符串转换为Python字符串需要根据不同的编码方式和数据类型选择合适的方法,以确保正确地将C语言字符串转换为Python字符串对象。
该“字符串转Unicode小工具程序”主要功能是将普通的字符串转换为Unicode编码形式。在VB6.0中,这个过程可以通过使用`StrConv`函数来实现。`StrConv`函数可以将字符串转换为不同的格式,包括Unicode编码。例如,以下...
“字符串转Unicode”则是将非Unicode编码的字符串转换为Unicode编码。在C#中,这可能涉及到将其他编码(如GBK、GB2312等)的字符串转换为UTF-16编码。这可以通过`Encoding`类的`GetBytes()`方法实现,先将其他编码的...
UnicodeCode编码转换成字符串编码的C#类 \uA054\uA055 => "中文
将默认string类型的字符串转换为unicode编码的字符串。dest参数指定了保存目的串的缓冲区位置 (2)widecharlentostring function widecharlentostring(source :pwidechar;sourcelen :integer) :string; 将sourcelen...
1. 字符串到Unicode:将普通字符串(可能是AnsiString)按照特定的编码(如UTF-8)转换成Unicode编码(UTF-16)。 2. Unicode到字符串:将Unicode编码(UTF-16)转换回指定编码格式的字符串(如UTF-8后的AnsiString...
通过这种方式,你可以方便地在Unicode码和中文字符之间进行转换,这对于处理多语言文本或跨平台的字符编码问题非常有帮助。在处理涉及不同编码格式的文件时,了解如何使用`native2ascii`工具是非常重要的,它能帮助...
在 C# 中,可以编写一个方法来实现将字符串转换为 Unicode 编码的表示形式。具体步骤如下: 1. **初始化目标字符串**:创建一个空字符串 `dst` 用于存储转换后的结果。 2. **字符数组转换**:将原始字符串 `srcText...
本工具专注于ANSI和UNICODE字符串与十六进制之间的转换,这涉及到字符编码和二进制数据的理解。 首先,我们要理解ANSI和UNICODE的概念。ANSI字符串通常指的是基于特定地区或语言的ASCII编码,它使用7位或8位来表示...
它提供了一个简单易用的API,可以方便地将JSON字符串转化为C结构体,以及将C结构体转化为JSON字符串。然而,原生的CJSON并不直接支持Unicode,尤其是宽字符的处理,这在处理包含多语言字符的JSON数据时可能会遇到...
2. 使用 `setlocale` 函数设置当前地域信息,并使用 `swprintf` 函数将 Ansi 字符串转换为 Unicode 字符串。 Unicode 转 Ansi Unicode 转 Ansi 也有两种方法: 1. 使用 `WideCharToMultiByte` 函数,该函数可以将...
这两个API函数分别用于将多字节字符串转换为宽字符(Unicode)字符串,以及将宽字符字符串转换为多字节字符串,它们允许你指定源和目标编码。 总的来说,字符串与数字、Unicode与ANSI之间的转换在编程中至关重要。...
在C语言中,进行字符编码转换通常涉及到内存操作和位操作,因为C语言没有内置的字符串类或者编码转换函数。以下是一些基本步骤: 1. **读取原始编码**:首先,你需要读取源文件或字符串,确定其当前的编码格式。这...
1. **`public String toUnicodeString(String chineseStr)`**:此方法接收一个中文字符串,然后将其转换为 Unicode 字符串形式,每个字符用 `\u` 开头,后面跟随四位十六进制数字表示其码点。例如,"你好" 变为 `\u4...
字符串是由一系列字符组成的序列,在计算机内存中通常以ASCII或Unicode编码存储。十六进制是一种基数为16的数制系统,由0-9和A-F组成,广泛用于表示二进制数据,因其能更紧凑地展示大量信息。 #### 转换原理 将字符...
例如,可以使用`StrConv`函数配合特定的常量,如`vbFromUnicode`和`vbUnicode`,来在Unicode和非Unicode编码之间转换字符串。例如,`StrConv("Unicode字符串", vbFromUnicode)`会将Unicode字符串转换为系统的默认...
“字符转换为UNICODE”就是将输入的字符按照UNICODE编码规则转换成对应的码点,通常以16进制或者10进制的数值形式表示。 3. "StringToChar.exe"工具的使用 "StringToChar.exe"看起来是一个小型的命令行工具,用于将...