`
zzc1684
  • 浏览: 1225889 次
  • 性别: Icon_minigender_1
  • 来自: 广州
文章分类
社区版块
存档分类
最新评论

编码转换 GBK UnicodeBigUnmarked GB18030 ASCII

阅读更多

 

package com.zzc.aop;

public class UnicodeTest {

	public static void main(String args[]) {
		UnicodeTest UT = new UnicodeTest();
		UT.test1();
	}

	public void test1() {
		String str = "你好测试信息abc123 ";
		try {
			byte[] b = str.getBytes("GBK");
			System.out.println(str + " -(GBK)编码: " + bytesToHexStr(b));
			System.out.println(" ");

			str = new String(b, "GBK");
			System.out.println("从GBK编码 " + bytesToHexStr(b) + " 重新转换为字串: " + str);
			System.out.println("------------------------------------- ");

			b = str.getBytes("UnicodeBigUnmarked");
			System.out.println(str + " -(UCS2)编码: " + bytesToHexStr(b));
			System.out.println(" ");

			str = new String(b, "UnicodeBigUnmarked");
			System.out.println("从(UCS2)编码 " + bytesToHexStr(b) + " 重新转换为字串: " + str);
			System.out.println("------------------------------------- ");

			b = str.getBytes("GB18030");
			System.out.println(str + " -(GB18030)编码: " + bytesToHexStr(b));
			System.out.println(" ");

			str = new String(b, "GB18030");
			System.out.println("从(GB18030)编码 " + bytesToHexStr(b) + " 重新转换为字串: " + str);
			System.out.println("------------------------------------- ");

			b = str.getBytes("ASCII");
			System.out.println(str + " -(ASCII)编码: " + bytesToHexStr(b));
			System.out.println(" ");

			str = new String(b, "ASCII");
			System.out.println("从(ASCII)编码 " + bytesToHexStr(b) + " 重新转换为字串: " + str);

		} catch (Exception e) {
			e.printStackTrace();
		}
	}

	private String bytesToHexStr(byte[] b) {
		if (b == null)
			return " ";
		StringBuffer strBuffer = new StringBuffer(b.length * 3);
		for (int i = 0; i < b.length; i++) {
			strBuffer.append(Integer.toHexString(b[i] & 0xff));
			strBuffer.append(" ");
		}
		return strBuffer.toString();
	}

}

 

 

分享到:
评论

相关推荐

    unicode与GB18030(GB2312,GBK) 转换码表

    GBK是在GB2312基础上的扩展,增加了对GBK18030之前其他编码系统的兼容,包括BIG5(用于繁体中文)和GB2312不涵盖的一些少数民族文字,共收录了20902个汉字和符号,是GB2312的一个广泛使用的扩展版本。 转换码表是...

    GB18030编码以及GBK、GB18030与Unicode的映射

    Gb2312、gbk、gb18030码位空间的约定以及计算,gbk历史回顾以及与Unicode之间的映射。gb18030各个版本的区别以及码位空间的分布以及与Unicode的映射。

    GBK码表 GB18030码表 汉字编码

    GB18030是正式国家标准,是GBK或GB2312的超集。该标准收录了27484个汉字,同时还收录了藏文、蒙文、维吾尔文等主要的少数民族文字。 这里是一个Excle版本的码表,罗列出码元及对应的GBK编码和Unicode编码,是研究编码的...

    GB18030编码研究以及GBK,GB2312,GB18030与Unicode的映射,乱码解决

    ### GB18030编码研究以及GBK,GB2312,GB18030与Unicode的映射,乱码解决 #### 1. GBK与GB2312的关系 - **GB2312**:该标准包含了682个图形符号,并将它们放置在1区。它是中国大陆最早制定的汉字编码标准之一,主要...

    GB18030Tools

    这时,就需要进行编码转换,以确保信息的正确显示和处理。GB18030Tools可以方便地将这些文件转换为Unicode格式,或者从Unicode格式转换回GB18030,解决了跨编码格式的兼容问题。 在实际应用中,GB18030Tools可能...

    gb18030与unicode转换表

    这个转换表列出了GB18030编码下的每个字符对应的Unicode值,以及Unicode编码下的每个字符对应的GB18030值。这种转换对于处理多语言环境下的文本,特别是在处理中文文本时,具有很高的实用价值。 在实际操作中,我们...

    gen-gbk-gb18030.rar_18030_GB18030_GBK

    标题中的"gen-gbk-gb18030.rar_18030_GB18030_GBK"指的是一个压缩包文件,它包含了与GBK和GB18030编码相关的工具或程序。GBK和GB18030是中国大陆广泛使用的汉字编码标准,它们都是对GB2312的扩展,旨在容纳更多的...

    gb18030的汉字编码,Unicode汉字编码表

    "Unicode汉字编码表.txt"和"gb18030的汉字编码.xls"则提供了Unicode和GB18030编码的对照,便于进行编码转换。 了解并熟练运用这些编码标准,不仅可以解决编程中的字符集问题,还可以确保你的软件在全球范围内正确...

    unicode转gb18030编码

    你可以通过阅读和学习这个文件,理解字符编码转换的细节,以及C语言如何处理二进制数据和文件操作。 总结,理解和应用“unicode转gb18030编码”的知识,不仅可以帮助你在处理多语言文本时避免乱码问题,还能增进对...

    gb18030与unicode的映射表

    这两份文件可能列出了每一个字符的GBK或GB18030编码和对应的Unicode编码值,这对于进行编码转换的程序开发或是数据迁移非常有帮助。 总的来说,这个压缩包包含的信息对于理解和处理中文字符编码问题,特别是在需要...

    GB2312、GB 13000、GBK、GB18030 介绍.doc

    它完全兼容 GB 2312 和 GBK 的编码体系,继承 GBK 的代码映射表的优点,解决了 GB 18030 和 GB 13000 之间的代码转换。 GB 18030-2005 是中华人民共和国目前最新的内码字符集,是 GB 18030-2000《信息技术 信息交换...

    gb18030所有字符集与码表.rar

    码表通常包括字符的Unicode编码、GB18030编码、汉字的拼音、部首、笔画数等信息,便于开发者进行编码转换和字符查询。 4. 在嵌入式系统中的应用 在嵌入式系统中,由于资源有限,往往需要对字符集和编码进行精简处理...

    各种字符集编码表,包括iso-8859-1,gbk,gb18030, unicode

    本文将深入探讨四种常见的字符集编码:ISO-8859-1、GBK、GB18030以及Unicode,并结合Java国际化的字符集转换进行详细说明。 1. ISO-8859-1:这是一种西欧字符编码,包含拉丁字母、数字、标点符号和一些特殊字符。它...

    GBK编码转换汉字,汉字转换GBK编码,VC代码实现

    在IT行业中,编码转换是一个常见的任务,特别是在处理中文字符时。GBK编码是GB2312编码的扩展,用于表示更多的汉字和符号,是简体中文环境下广泛使用的一种字符编码。VC++,作为Microsoft的C++开发环境,提供了丰富...

    编码转换器 绿色版 gb2312 gbk utf-8

    标题和描述中提到的"编码转换器 绿色版 gb2312 gbk utf-8 万能转换"是一个软件工具,它能够帮助用户将文本文件从一种编码格式转换到另一种,尤其是GB2312、GBK和UTF-8这三种常见的中文编码格式。 1. **编码系统**:...

    unicode转gb18030的c代码

    总结来说,从"unicode转gb18030的c代码"这个主题中,我们可以学习到字符编码的基础知识,了解Unicode和GB18030的区别,掌握C语言实现编码转换的方法,以及如何处理跨平台的兼容性问题。这对于开发涉及多语言环境的...

    WINDOWS GB18030支持补丁

    GB18030是一种汉字编码标准,全称为“信息技术—多文种字符集—GB18030—2000”,是中国国家标准,也是对GB2312和GBK编码的扩展。GB18030编码系统在1995年的GB2312基础上增加了大量的汉字,同时包含了一些其他语言的...

    gb18030汉字编码

    GB18030则在2000年推出,其最大的突破在于支持了近7万个字符,涵盖了大部分汉字,包括罕见字和古代汉字,同时兼容ASCII、GBK等编码。 GB18030编码的核心特点是采用变长编码方式,每个字符可以由1到4个字节表示。...

Global site tag (gtag.js) - Google Analytics