`

unicode转化

 
阅读更多
// 汉字转化成unicode
public static void encodeUnicode(final String gbString) {
		char[] utfBytes = gbString.toCharArray();
		String unicodeBytes = "";
		for (int byteIndex = 0; byteIndex < utfBytes.length; byteIndex++) {
			String hexB = Integer.toHexString(utfBytes[byteIndex]);
			if (hexB.length() <= 2) {
				hexB = "00" + hexB;
			}
			unicodeBytes = unicodeBytes + "\\u" + hexB;
		}
		System.out.println(unicodeBytes);
	}

	//unicode转化汉字
	public static StringBuffer decodeUnicode(final String dataStr) {
		final StringBuffer buffer = new StringBuffer();
		String tempStr = "";
		String operStr = dataStr;
		if (operStr != null && operStr.indexOf("\\u") == -1)
			return buffer.append(operStr);
		if (operStr != null && !operStr.equals("")
				&& !operStr.startsWith("\\u")) {
			tempStr = operStr.substring(0, operStr.indexOf("\\u"));
			operStr = operStr.substring(operStr.indexOf("\\u"), operStr.length());// operStr字符一定是以unicode编码字符打头的字符串
		}
		buffer.append(tempStr);
		// 循环处理,处理对象一定是以unicode编码字符打头的字符串
		while (operStr != null && !operStr.equals("")&& operStr.startsWith("\\u")) { 
			tempStr = operStr.substring(0, 6);
			operStr = operStr.substring(6, operStr.length());
			String charStr = "";
			charStr = tempStr.substring(2, tempStr.length());
			char letter = (char) Integer.parseInt(charStr, 16); // 16进制parse整形字符串。
			buffer.append(new Character(letter).toString());
			if (operStr.indexOf("\\u") == -1) {
				buffer.append(operStr);
			} else { // 处理operStr使其打头字符为unicode字符
				tempStr = operStr.substring(0, operStr.indexOf("\\u"));
				operStr = operStr.substring(operStr.indexOf("\\u"), operStr.length());
				buffer.append(tempStr);
			}
		}
		return buffer;
	}

分享到:
评论
1 楼 shuaijie506 2010-10-21  
找了好久才找到这种转码方式,真难找啊。

谢谢!

相关推荐

    C# 格式的ASCII到Unicode转化源码

    本文将深入探讨如何在C#中进行ASCII到Unicode的转化,以及相关编码转换的重要性。 ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)是一种基于拉丁字母的字符编码,它只包含128...

    用PHP将Unicode 转化为UTF-8的实现方法(推荐)

    在PHP中,将Unicode转化为UTF-8主要涉及到字符串处理。上述文章中提供的PHP函数`unescape`展示了如何通过正则表达式匹配特定格式的字符串,然后利用`iconv`函数进行编码转换。`iconv`函数是一个强大的字符编码转换...

    gb2312与unicode 转化表

    在这个过程中,"gb_data"和"unicode_data"可能是两个用于存储转换规则和映射关系的文件,它们提供了从GB2312到Unicode或者从Unicode到GB2312的转化表。这样的转化表通常是通过查找算法实现的,每个GB2312编码对映射...

    Unicode转化程序

    Unicode是一种国际标准,用于在各种不同的计算机系统和设备之间统一表示文字。它包含了世界上几乎所有的字符和符号,从拉丁字母到汉字,再到希腊字母和阿拉伯数字。Unicode转换程序是用来处理和转换不同编码格式(如...

    Zebra打印机,中文转ZPL指令的.net实现,替换FNTHEX32.DLL

    编写API的目的,Zebra官方提供的Unicode转化组件FNTHEX32.DLL,是一个非托管组件,托管环境下还需要再封装。 该组件直到现在还未找到对应的64位程序兼容组件,为了解决32位和64位的兼容问题,最后编写开发此API, 此...

    Python-pythonslugifyPythonslug化库可以把unicode转化为ASCII

    在处理多语言或包含特殊字符的文本时,将这些文本转化为ASCII slug就显得尤为重要,因为ASCII字符集在所有现代计算机系统中都是通用的。 slugify库的工作原理是将输入的字符串清理,移除不必要的字符,如空格、标点...

    Unicode和GBK编码转换表

    由于GBK是在Unicode出现之前制定的,所以它没有完全遵循Unicode的编码规则,这就导致了在处理GBK编码和Unicode编码的文本时可能需要进行转换。 GSM中文字库则是针对手机等移动设备设计的一种字符编码,主要用于短信...

    shellcode与unicode互相转换器

    这是个人自己写的一个shellcode与unicode两种代码之间互相转换的一个工具。

    汉字跟Unicode 互相 转化 C# 代码

    本文将深入探讨汉字与Unicode在C#中的相互转化,并提供相关的代码示例。 首先,我们来理解一下汉字与Unicode的关系。汉字是中文的字符,其在计算机中存储通常有两种主要方式:GBK(一种针对简体中文的扩展GBK编码)...

    Unicode编码转UTF-8编码程序

    Unicode转UTF-8

    中文和unicode码互转

    方便国际化资源文件转换,自己随手写的小工具。

    db2连接驱动

    解决无法将 Unicode 字符串转换为 Ebcdic 字符串的问题

    中文转化为unicode格式的方法类

    总结来说,将中文转化为 Unicode 格式是通过理解 Unicode 编码原理,利用 Java 提供的相关 API 完成的。`unicodeConvert.java` 类是实现这一功能的代码载体,它可以方便地在各种场景下进行中文字符与 Unicode 之间的...

    unicode转换器

    unicode unicode unicode unicode 转化器 抓唤起转换器

    汉字转化Unicode工具源代码

    这个“汉字转化Unicode工具源代码”就是专门用于将汉字转换成Unicode编码的软件开发资源。 源代码通常是程序员用编程语言编写的程序文本,通过编译或解释后可以生成可执行程序。在这个项目中,我们可以看到一系列与...

    python-slugify:Python slug 化库,可以把 unicode 转化为 ASCII。-python

    Python-slugify 是一个用于处理文本的 Python 库,专门设计用来将 Unicode 文本转化为 ASCII 字符串,这种转化过程通常被称为 "slugification"。在网页开发中,slug 是URL的一部分,用于简洁地表示页面内容,通常是...

    utf-8、ANSI、Unicode相互转化c++实现

    utf-8、ANSI、Unicode相互转化c++实现 std::string ConverANSI2UTF8(const std::string & str); std::wstring ConverANSI2Unicode(const std::string str); std::wstring ConverUTF82Unicode(const std::string str)...

    字符转化为UNICODE码

    Unicode码,全称为统一码或万国码,是一种在计算机科学领域广泛使用的字符编码标准,旨在为世界上所有的字符提供一个唯一的、统一的数字表示。Unicode的出现解决了早期各种字符编码系统(如ASCII、GB2312等)无法...

    中文转化unicoder码的方法

    本文将详细介绍如何将中文转化为Unicode编码,以及这对中文数据通信和显示的开发有何帮助。 1. Unicode编码介绍: Unicode是一个包含几乎世界上所有语言字符的编码系统,它为每个字符分配了一个唯一的数字,称为码...

    把中文转化为Unicode

    在处理中文字符时,将汉字转化为Unicode编码,特别是在编写正则表达式进行文本处理时,是非常常见且重要的操作。下面我们将深入探讨这个话题。 首先,Unicode编码的核心理念是为每个独特的字符分配一个唯一的数字,...

Global site tag (gtag.js) - Google Analytics