转载:http://hi.baidu.com/triceratops/blog
import java.io.File;
import java.io.FileWriter;
import java.io.IOException;
import java.io.UnsupportedEncodingException;
public class ChineseCharEncodingList{
private static final int MIN_INDEX = 19968;
private static final int MAX_INDEX = 40869;
private static final String CR = "\r\n";
private static final String TAB = "\t";
public void execute(String fileName) throws IOException{
File f = new File(fileName);
FileWriter fw = new FileWriter(f);
fw.write("字符"+TAB+"Unicode十进制"+TAB+"Unicode十六进制"+TAB+TAB+"GBK十进制"+TAB+"GBK十六进制"+CR);
fw.write("=================================================================================="+CR);
int GBKCode;
for(int i=MIN_INDEX;i<=MAX_INDEX;i++){
GBKCode = getGBKCode(i);
fw.write((char)i+TAB+i+TAB+TAB+Integer.toHexString(i)+TAB+TAB+TAB+GBKCode+TAB+TAB+Integer.toHexString(GBKCode)+CR);
}
fw.flush();
System.out.println("Done!");
}
private int getGBKCode(int unicodeCode) throws UnsupportedEncodingException{
char c = (char) unicodeCode;
byte[] bytes = (c+"").getBytes("GBK");
return ((bytes[0]&255)<<8) + (bytes[1]&255);
}
public static void main(String[] args) throws Exception{
new ChineseCharEncodingList().execute("汉字编码一览表.txt");
}
}
分享到:
相关推荐
Unicode和GBK编码是两种广泛使用的字符编码系统,尤其在中国大陆地区,它们在存储和传输中文字符时扮演着关键角色。 Unicode,全称统一码,是一个国际标准,旨在为全球所有语言提供一个统一的字符集。它定义了一个...
Unicode 使用不同的编码形式(如 UTF-8、UTF-16 等)来表示这些码点,从而实现高效存储和传输。 #### 三、GBK编码简介 **GBK** (GB2312-80) 是中华人民共和国的国家标准,用于汉字编码,支持简体中文及部分符号。...
unicode-GBK编码对照表,支持24068个字转换,这个表格适合运用各个平台,小程序,c语言等。
本文将深入探讨汉字的Unicode编码、GBK编码以及区位码,帮助你理解这些编码方式的作用和它们之间的关系。 首先,Unicode是一种全球统一的字符编码标准,旨在涵盖世界上几乎所有的文字系统,包括汉字。Unicode使用...
Unicode 和 GBK 是两种常见的字符编码标准,它们各自有着不同的特点和应用范围。本篇将详细阐述 Unicode 与 GBK 编码之间的关系、它们的工作原理以及如何进行双向转换。 Unicode 是一个全球性的字符集,它试图为...
在网上找资料很少有汉字直接转GBK编码格式,一般都是汉字转Unicode编码,这套是将汉字先转换成Unicode编码,在通过参照表得出汉字的GBK编码数据。虽然是一个js文件,但是加以修改可以用于很多平台上如:小程序,...
GBK是中国大陆广泛使用的汉字编码标准,它是GB2312的扩展,包含了更多的汉字和符号,能够覆盖大部分中文文本。而Unicode是一种国际化的编码标准,它旨在容纳世界上所有语言的字符,采用统一的编码方式,避免了不同...
Unicode和GBK是两种广泛使用的字符编码标准,它们各自有其特点和适用场景。本文将深入探讨这两个编码体系,以及如何在它们之间进行转换。 Unicode是一个全球性的字符集,它的目标是包含世界上所有已知的语言文字,...
gbk+unicode+汉字编码对照表
字符unicode-GBK编码对照表,可直接导入做为数组查表 可应用与js微信小程序内
总的来说,使用编码转换表在C/C++中进行GBK和Unicode的转换是一种有效的方法,特别是当处理的文本数据量不大时。然而,对于大规模的文本处理,更推荐使用现成的库,如iconv,它们提供了更高效和全面的编码转换支持。
例如,"GBK+unicode+汉字编码对照表.xls"这个文件很可能是一个Excel表格,其中详细列出了GBK编码和Unicode编码下的汉字对应关系。通过这个表格,我们可以方便地查找特定汉字在两种编码下的数值,便于在不同编码之间...
Unicode是一种国际标准,目标是涵盖全球所有语言的字符,而GBK是中国大陆广泛使用的编码,兼容GB2312,同时增加了许多其他汉字和符号。 Unicode编码是一种多字节编码,最常用的形式是UTF-8。UTF-8的特点是它可以...
标签“源码”暗示了这个话题可能涉及到编程和代码实现,可能讲解了如何在编程语言中使用Unicode编码来处理中文字符,例如Java、Python或C++。而“工具”标签则可能意味着存在某种工具或库,可以帮助开发者进行...
本文将详细介绍如何在Windows平台上实现UNICODE与GBK(简体中文编码)之间的转换。这涉及到字符集的基础知识、Windows API函数的使用以及具体的代码实现。 #### 字符编码简介 在计算机科学领域,字符编码是将文本...
gbk unicode 汉字编码对照表 一份xls文件包含: 汉字的unicode 十进制 十六进制 以及对应的gbk的十进制、十六进制
unicode和GBK-BIG5编码对应表,個人辛苦整理,很有參考價值
总的来说,Unicode汉字编码表是理解和使用汉字在数字世界中基础的关键,它促进了不同文化间的沟通,并且随着Unicode标准的不断发展,汉字的编码也在持续扩展和完善。通过深入学习和理解这些编码表,我们可以更好地...
Unicode是一种广泛使用的字符编码标准,它能表示世界上几乎所有的字符,而GBK(国标扩展)是中国大陆使用的一种中文编码,它是GB2312的扩展,增加了更多的汉字和符号。 在易语言中进行Unicode到GBK的转换通常涉及到...