package test;
import java.io.DataOutputStream;
import java.io.IOException;
public class UnicodeTest {
/**
* @param args
*/
public static void main(String[] args) {
gbEncoding("武力海");
}
public static String gbEncoding( final String gbString ) {
char[] utfBytes = gbString.toCharArray();
String unicodeBytes = "";
for( int i = 0; i < utfBytes.length; i ++ ) {
String hexB = Integer.toHexString( utfBytes[i] );
if( hexB.length() <= 2 ) {
hexB = "00" + hexB;
}
unicodeBytes = unicodeBytes + "\\\\u" + hexB;
}
System.out.println( "unicodeBytes is: " + unicodeBytes );
return unicodeBytes;
}
}
分享到:
相关推荐
### Unicode与汉字编码 #### 一、Unicode简介 Unicode是一种国际化的字符编码方案,旨在为世界上所有的文字提供统一的编码方式。它最初由Unicode联盟在1991年提出,并随着时间的发展不断完善。Unicode的主要目标是...
这些PDF文件为研究者、开发者和对汉字编码感兴趣的人员提供了详细的汉字Unicode编码信息。通过查阅这些文档,你可以找到每个汉字对应的Unicode码点,这对于编程、字体设计、文本处理软件开发等工作具有很高的实用...
本文将深入探讨GB18030、GBK、Unicode这三种汉字编码以及它们在编程中的应用。 首先,让我们了解一下GB18030编码。GB18030是中国国家标准,它是在GBK编码基础上扩展的,增加了对更多汉字和少数民族文字的支持。GB...
Unicode为超过7万个汉字分配了码位,并持续增加新字符。 #### Unicode汉字编码表详解 根据提供的文件内容,我们了解到该文件包含了一段特殊的Unicode编码表示例,范围为`4e00-9fa5`,这部分是Unicode标准中用于...
unicode汉字和拼音对照表,按照: 汉字 编码 拼音声标 拼音声调(声调在字母后)声调在拼音后 纯拼音 的格式排列。一共是20902个汉字编码范围是 U4e00 ~ U9fa5.
标签“通用规范汉字 汉字编码 汉字万国码”则进一步强调了汉字在Unicode中的编码特性,并指出这些汉字编码的重要性。其中“汉字万国码”是对UNICODE的一种通俗说法,意指UNICODE能够处理来自世界各地的字符。 根据...
Unicode汉字编码表.rar Unicode汉字编码表.rar Unicode汉字编码表.rar Unicode汉字编码表.rar Unicode汉字编码表.rar Unicode汉字编码表.rar
可快速查找汉字unicode编码,有十进制,十六进制
Unicode编码是一种国际标准,用于表示世界上几乎所有的文字和符号,包括汉字。它的设计目标是提供一个统一的方式来表示和处理各种语言的文字,使得信息在不同系统间可以无缝交换。Unicode覆盖了超过140,000个字符,...
了解这些文件的用途,我们可以推测这个压缩包提供了一个简易的汉字编码查看工具,用户可以通过它方便地查询和理解汉字与UNICODE编码之间的对应关系,这对于编程、文本处理或翻译工作都十分有用。在实际应用中,...
在处理汉字时,我们经常会将其转换为UTF-8、GBK等编码形式,以便在不同的操作系统和软件环境中进行交换和显示。 在实际应用中,开发者会使用这些对照表来实现汉字与编码之间的转换。例如,在编程中,如果需要查找...
本篇文章将深入探讨如何使用JavaScript将汉字转化为UNICODE编码,并提供相关工具的使用方法。 一、Unicode编码基础知识 Unicode是一种国际标准,用于表示世界上几乎所有的字符集,包括汉字。它使用一个数字来代表每...
本源码演示VB 6.0 如何将汉字转换为Unicode字符代码,在窗口中输入汉字,单击按钮,即可将汉字转换为Unicode字符,其实这个实现起来也比较简单,用VB内置函数AscW即可实现,代码的编写可参考如下: Private Sub ...
只需要几行代码,轻松将汉字转换为Unicode编码,还是挺方便的,本人已经调试过的!
Unicode中的汉字编码范围主要在U+4E00到U+9FFF之间,涵盖了大量常用汉字。而GB码,全称为“国标码”,是中国大陆早期的一种汉字编码标准,包括GB2312和GBK等。GB2312编码包含了6763个常用汉字,GBK则在此基础上扩展...
本文将重点介绍一些常用汉字的Unicode编码及其应用价值,特别是它们在验证码生成中的作用。 #### 二、Unicode简介 Unicode是一种多字节字符编码方案,它包含了几乎所有现存语言文字的字符,并且每个字符都有一个...
在“汉字编码对照表.xls”文件中,你将找到一个详细的表格,它列出了汉字与Unicode码点、GBK编码以及区位码的对应关系。这个表格对于开发者、程序员和对中文编码有需求的人来说非常有价值,可以方便地查找特定汉字的...
本文将深入探讨GBK、Unicode以及汉字编码对照表的相关知识点。 首先,我们要理解什么是GBK编码。GBK是GB2312编码的扩展,全称为“汉字内码扩展规范”(GBK即“国标扩展规范”的拼音缩写)。GB2312是中国大陆于1980...
GB2312,全称为《信息交换用汉字编码字符集·基本集》,是中国国家标准的一种汉字编码方案,主要用于简体中文的处理。GB2312在设计时主要考虑了常用汉字和符号,总共包含了6763个汉字,以及682个其他图形符号。每个...