// 汉字转化成unicode
public static void encodeUnicode(final String gbString) {
char[] utfBytes = gbString.toCharArray();
String unicodeBytes = "";
for (int byteIndex = 0; byteIndex < utfBytes.length; byteIndex++) {
String hexB = Integer.toHexString(utfBytes[byteIndex]);
if (hexB.length() <= 2) {
hexB = "00" + hexB;
}
unicodeBytes = unicodeBytes + "\\u" + hexB;
}
System.out.println(unicodeBytes);
}
//unicode转化汉字
public static StringBuffer decodeUnicode(final String dataStr) {
final StringBuffer buffer = new StringBuffer();
String tempStr = "";
String operStr = dataStr;
if (operStr != null && operStr.indexOf("\\u") == -1)
return buffer.append(operStr);
if (operStr != null && !operStr.equals("")
&& !operStr.startsWith("\\u")) {
tempStr = operStr.substring(0, operStr.indexOf("\\u"));
operStr = operStr.substring(operStr.indexOf("\\u"), operStr.length());// operStr字符一定是以unicode编码字符打头的字符串
}
buffer.append(tempStr);
// 循环处理,处理对象一定是以unicode编码字符打头的字符串
while (operStr != null && !operStr.equals("")&& operStr.startsWith("\\u")) {
tempStr = operStr.substring(0, 6);
operStr = operStr.substring(6, operStr.length());
String charStr = "";
charStr = tempStr.substring(2, tempStr.length());
char letter = (char) Integer.parseInt(charStr, 16); // 16进制parse整形字符串。
buffer.append(new Character(letter).toString());
if (operStr.indexOf("\\u") == -1) {
buffer.append(operStr);
} else { // 处理operStr使其打头字符为unicode字符
tempStr = operStr.substring(0, operStr.indexOf("\\u"));
operStr = operStr.substring(operStr.indexOf("\\u"), operStr.length());
buffer.append(tempStr);
}
}
return buffer;
}
分享到:
相关推荐
本文将深入探讨如何在C#中进行ASCII到Unicode的转化,以及相关编码转换的重要性。 ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)是一种基于拉丁字母的字符编码,它只包含128...
在PHP中,将Unicode转化为UTF-8主要涉及到字符串处理。上述文章中提供的PHP函数`unescape`展示了如何通过正则表达式匹配特定格式的字符串,然后利用`iconv`函数进行编码转换。`iconv`函数是一个强大的字符编码转换...
在这个过程中,"gb_data"和"unicode_data"可能是两个用于存储转换规则和映射关系的文件,它们提供了从GB2312到Unicode或者从Unicode到GB2312的转化表。这样的转化表通常是通过查找算法实现的,每个GB2312编码对映射...
Unicode是一种国际标准,用于在各种不同的计算机系统和设备之间统一表示文字。它包含了世界上几乎所有的字符和符号,从拉丁字母到汉字,再到希腊字母和阿拉伯数字。Unicode转换程序是用来处理和转换不同编码格式(如...
编写API的目的,Zebra官方提供的Unicode转化组件FNTHEX32.DLL,是一个非托管组件,托管环境下还需要再封装。 该组件直到现在还未找到对应的64位程序兼容组件,为了解决32位和64位的兼容问题,最后编写开发此API, 此...
在处理多语言或包含特殊字符的文本时,将这些文本转化为ASCII slug就显得尤为重要,因为ASCII字符集在所有现代计算机系统中都是通用的。 slugify库的工作原理是将输入的字符串清理,移除不必要的字符,如空格、标点...
由于GBK是在Unicode出现之前制定的,所以它没有完全遵循Unicode的编码规则,这就导致了在处理GBK编码和Unicode编码的文本时可能需要进行转换。 GSM中文字库则是针对手机等移动设备设计的一种字符编码,主要用于短信...
这是个人自己写的一个shellcode与unicode两种代码之间互相转换的一个工具。
本文将深入探讨汉字与Unicode在C#中的相互转化,并提供相关的代码示例。 首先,我们来理解一下汉字与Unicode的关系。汉字是中文的字符,其在计算机中存储通常有两种主要方式:GBK(一种针对简体中文的扩展GBK编码)...
Unicode转UTF-8
方便国际化资源文件转换,自己随手写的小工具。
解决无法将 Unicode 字符串转换为 Ebcdic 字符串的问题
总结来说,将中文转化为 Unicode 格式是通过理解 Unicode 编码原理,利用 Java 提供的相关 API 完成的。`unicodeConvert.java` 类是实现这一功能的代码载体,它可以方便地在各种场景下进行中文字符与 Unicode 之间的...
unicode unicode unicode unicode 转化器 抓唤起转换器
这个“汉字转化Unicode工具源代码”就是专门用于将汉字转换成Unicode编码的软件开发资源。 源代码通常是程序员用编程语言编写的程序文本,通过编译或解释后可以生成可执行程序。在这个项目中,我们可以看到一系列与...
Python-slugify 是一个用于处理文本的 Python 库,专门设计用来将 Unicode 文本转化为 ASCII 字符串,这种转化过程通常被称为 "slugification"。在网页开发中,slug 是URL的一部分,用于简洁地表示页面内容,通常是...
utf-8、ANSI、Unicode相互转化c++实现 std::string ConverANSI2UTF8(const std::string & str); std::wstring ConverANSI2Unicode(const std::string str); std::wstring ConverUTF82Unicode(const std::string str)...
Unicode码,全称为统一码或万国码,是一种在计算机科学领域广泛使用的字符编码标准,旨在为世界上所有的字符提供一个唯一的、统一的数字表示。Unicode的出现解决了早期各种字符编码系统(如ASCII、GB2312等)无法...
本文将详细介绍如何将中文转化为Unicode编码,以及这对中文数据通信和显示的开发有何帮助。 1. Unicode编码介绍: Unicode是一个包含几乎世界上所有语言字符的编码系统,它为每个字符分配了一个唯一的数字,称为码...
在处理中文字符时,将汉字转化为Unicode编码,特别是在编写正则表达式进行文本处理时,是非常常见且重要的操作。下面我们将深入探讨这个话题。 首先,Unicode编码的核心理念是为每个独特的字符分配一个唯一的数字,...