`
Ben.Sin
  • 浏览: 233126 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

字符串转化为unicode编码

    博客分类:
  • Java
 
阅读更多

字符串转化为unicode编码

 

package com.bensin.util;

import java.io.UnsupportedEncodingException;

/**
 * 
 * @author Ben.Sin
 *
 */
public class UnicodeUtil {
	/**
	 * 
	 * @param gbString
	 * @return
	 */
	public static String encodeUnicode(final String data){
		char[] utfBytes = data.toCharArray();
		String unicodeBytes = "";
		
		for (char utfByte : utfBytes){
			String hexByte = Integer.toHexString(utfByte);
			
			if (hexByte.length() <= 2){
				hexByte = "00" + hexByte;
			}
			
			unicodeBytes += "\\u" + hexByte;
		}
		
		return unicodeBytes;
	}
	
	public static String decodeUnicode(final String data){
		int start = 0;
		int end = 0;
		
		final StringBuilder buffer = new StringBuilder();
		
		while(start > -1){
			end = data.indexOf("\\u", start + 1);
			String charStr = "";
			
			if (end == -1){
				charStr = data.substring(data.length() - 4, data.length() );
			} else {
				charStr = data.substring(end - 4, end);
			}
			
			char letter = (char)Integer.parseInt(charStr, 16);
			
			buffer.append(new Character(letter).toString());
			start = end;
		}
		
		return buffer.toString();
	}
	
	public static void main(String[] args) throws UnsupportedEncodingException{
		String str = "非常抱歉,暂不支持该文件类型!";
				
		String unicode = encodeUnicode(str);
		System.out.println(unicode);
		
		String decode = decodeUnicode(unicode);

		System.out.println(decode);
	}
}
 

 

分享到:
评论

相关推荐

    字符串处理类:将GBK,UTF8字符串转化为Unicode编码的php类库.zip

    这个压缩包提供的类库专门用于处理GBK和UTF8编码的字符串,并将其转换为Unicode编码,反之亦然。下面我们将深入探讨字符串编码转换的相关知识以及如何使用这个PHP类库。 Unicode是一种广泛使用的字符编码标准,它...

    ANSI字符串与Unicode字符串的相互转换

    例如,从ANSI字符串转换为Unicode字符串时,需要知道源字符串的代码页,以便正确地解析多字节序列。反之,转换回ANSI时,也需要指定目标代码页。 3. **内存管理**:在转换过程中,需要分配足够的内存来存储目标字符...

    C语言字符串转换为Python字符串的方法

    C语言字符串转换为Python字符串的方法 C语言字符串转换为Python字符串是指将...C语言字符串转换为Python字符串需要根据不同的编码方式和数据类型选择合适的方法,以确保正确地将C语言字符串转换为Python字符串对象。

    字符串转Unicode小工具程序

    该“字符串转Unicode小工具程序”主要功能是将普通的字符串转换为Unicode编码形式。在VB6.0中,这个过程可以通过使用`StrConv`函数来实现。`StrConv`函数可以将字符串转换为不同的格式,包括Unicode编码。例如,以下...

    Unicode转中文 Unicode字符串 转中文编码

    “字符串转Unicode”则是将非Unicode编码的字符串转换为Unicode编码。在C#中,这可能涉及到将其他编码(如GBK、GB2312等)的字符串转换为UTF-16编码。这可以通过`Encoding`类的`GetBytes()`方法实现,先将其他编码的...

    UnicodeCode编码转换成字符串编码的C#类

    UnicodeCode编码转换成字符串编码的C#类 \uA054\uA055 =&gt; "中文

    Delphi中处理字符串的相关方法

    将默认string类型的字符串转换为unicode编码的字符串。dest参数指定了保存目的串的缓冲区位置 (2)widecharlentostring function widecharlentostring(source :pwidechar;sourcelen :integer) :string; 将sourcelen...

    字符串与Unicode互转工具

    1. 字符串到Unicode:将普通字符串(可能是AnsiString)按照特定的编码(如UTF-8)转换成Unicode编码(UTF-16)。 2. Unicode到字符串:将Unicode编码(UTF-16)转换回指定编码格式的字符串(如UTF-8后的AnsiString...

    Unicode码转中文和中文转Unicode码的最简便的方法

    通过这种方式,你可以方便地在Unicode码和中文字符之间进行转换,这对于处理多语言文本或跨平台的字符编码问题非常有帮助。在处理涉及不同编码格式的文件时,了解如何使用`native2ascii`工具是非常重要的,它能帮助...

    C#字串与Unicode互相转换方法

    在 C# 中,可以编写一个方法来实现将字符串转换为 Unicode 编码的表示形式。具体步骤如下: 1. **初始化目标字符串**:创建一个空字符串 `dst` 用于存储转换后的结果。 2. **字符数组转换**:将原始字符串 `srcText...

    字符串十六进制转换工具(包含ANSI和UNICODE)

    本工具专注于ANSI和UNICODE字符串与十六进制之间的转换,这涉及到字符编码和二进制数据的理解。 首先,我们要理解ANSI和UNICODE的概念。ANSI字符串通常指的是基于特定地区或语言的ASCII编码,它使用7位或8位来表示...

    解析unicode的json字符串的cJSON,支持宽字符串

    它提供了一个简单易用的API,可以方便地将JSON字符串转化为C结构体,以及将C结构体转化为JSON字符串。然而,原生的CJSON并不直接支持Unicode,尤其是宽字符的处理,这在处理包含多语言字符的JSON数据时可能会遇到...

    Ansi、Unicode、UTF8字符串之间的转换,wprintf

    2. 使用 `setlocale` 函数设置当前地域信息,并使用 `swprintf` 函数将 Ansi 字符串转换为 Unicode 字符串。 Unicode 转 Ansi Unicode 转 Ansi 也有两种方法: 1. 使用 `WideCharToMultiByte` 函数,该函数可以将...

    字符串与数字、unicode与ansic之间的转换

    这两个API函数分别用于将多字节字符串转换为宽字符(Unicode)字符串,以及将宽字符字符串转换为多字节字符串,它们允许你指定源和目标编码。 总的来说,字符串与数字、Unicode与ANSI之间的转换在编程中至关重要。...

    C语言字符编码转换UNICODE、GBK、UTF-8互相转换

    在C语言中,进行字符编码转换通常涉及到内存操作和位操作,因为C语言没有内置的字符串类或者编码转换函数。以下是一些基本步骤: 1. **读取原始编码**:首先,你需要读取源文件或字符串,确定其当前的编码格式。这...

    中文转化为unicode格式的方法类

    1. **`public String toUnicodeString(String chineseStr)`**:此方法接收一个中文字符串,然后将其转换为 Unicode 字符串形式,每个字符用 `\u` 开头,后面跟随四位十六进制数字表示其码点。例如,"你好" 变为 `\u4...

    将字符串转会为十六进制

    字符串是由一系列字符组成的序列,在计算机内存中通常以ASCII或Unicode编码存储。十六进制是一种基数为16的数制系统,由0-9和A-F组成,广泛用于表示二进制数据,因其能更紧凑地展示大量信息。 #### 转换原理 将字符...

    VB字符串处理(unicode、UTF)

    例如,可以使用`StrConv`函数配合特定的常量,如`vbFromUnicode`和`vbUnicode`,来在Unicode和非Unicode编码之间转换字符串。例如,`StrConv("Unicode字符串", vbFromUnicode)`会将Unicode字符串转换为系统的默认...

    字符转换为UNICODE工具

    “字符转换为UNICODE”就是将输入的字符按照UNICODE编码规则转换成对应的码点,通常以16进制或者10进制的数值形式表示。 3. "StringToChar.exe"工具的使用 "StringToChar.exe"看起来是一个小型的命令行工具,用于将...

Global site tag (gtag.js) - Google Analytics