`
guyongpeng
  • 浏览: 61537 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

gbk中的特殊符号的编码

阅读更多
gbk和gb2312编码中的一些特殊符号的有趣现象

在EmEditor编辑器中以gb2312的方式在文件test.html中存放字符·
1.在IE中以gb2312方式能正确显示
2.在FireFox中以gb2312和gbk均能正确显示
3.在eclipse中以gbk能正确显示,以gb2312显示为另外一个字符・
4.以java程序从文件中读出来的话,gbk方式能正确输出,但gb2312输出乱码?

代码如下所示:

	public static String readContentFromFile(File file, String encode) {
		String result = "";
		try {
			FileInputStream fi = new FileInputStream(file);
			InputStreamReader is = new InputStreamReader(fi, encode);
			char[] tmp = new char[(int) file.length()];
			if (-1 != is.read(tmp)) {
				result += new String(tmp);
			}
			is.close();
			fi.close();
		} catch (FileNotFoundException e) {
			e.printStackTrace();
		} catch (UnsupportedEncodingException e) {
			e.printStackTrace();
		} catch (IOException e) {
			e.printStackTrace();
		}
		return result;
	}
分享到:
评论

相关推荐

    GBK字符集编码表

    本文将详细介绍GBK字符集编码表中的几个关键部分。 #### 二、非汉字符号区段(GBK/1) 在GBK/1区段中主要收录了非汉字的符号,这些符号广泛应用于日常文档编辑、编程语言以及各种文本处理中。例如: - **标点符号...

    GBK汉字编码速查 / GBK汉字编码表

    在GB2312编码中,主要包含了6763个常用汉字和一些基本的符号,而GBK编码则在GB2312的基础上增加了许多生僻字和繁体字,使其更加适用于中文信息处理和交换。GBK编码使用了双字节来表示每个字符,其中高位字节范围在0x...

    GBK编码转换汉字,汉字转换GBK编码,VC代码实现

    GBK编码是GB2312编码的扩展,用于表示更多的汉字和符号,是简体中文环境下广泛使用的一种字符编码。VC++,作为Microsoft的C++开发环境,提供了丰富的库支持来处理这种编码转换。本篇文章将深入探讨如何在VC++环境中...

    GBK编码表GBK编码表

    GBK编码覆盖了简体中文和繁体中文字符,并包含了大量的罕用字和特殊符号。 #### 二、GBK编码结构 GBK编码采用双字节编码方式,每个字符由两个字节组成,其中高位字节(即第一个字节)的取值范围为0x81至0xFE,低位...

    编码表字库编码表GBK

    GBK扩展了GB2312的编码范围,增加了更多汉字以及一些特殊符号。 GBK编码表的结构分为多个区段,每个区段都有对应的编码范围。例如,GBK/1区段包含GB2312的非汉字符号,GBK/2区段则是GB2312中的汉字。GBK/3和GBK/4...

    GBK汉字内码扩展规范编码表

    GBK编码在中国大陆广泛使用,尤其是在早期的软件开发和数据库存储中,因为它能支持超过2万多个汉字。 GB2312编码是1980年代制定的基础汉字编码,包含了6763个常用汉字。然而,随着社会的发展和语言的丰富,GB2312...

    GBK编码规则.zip

    在GBK编码中,每个字节的最高位被设置为1,以区别于ASCII码(ASCII码中的最高位为0)。GBK编码的范围是从8140H到FEFEH,但不包括7FH这个特殊码位,总共可以表示23940个不同的码位。 GBK编码的扩展性体现在它不仅...

    Big5编码台湾繁体字体和GBK编码简体字体之间相互转换示例代码

    它基于ASCII编码,由两个字节组成,包含了大约13,000个字符,主要包括常用汉字、标点符号和一些特殊字符。Big5编码的前128个字节与ASCII兼容,其余部分则用于存储中文字符。 接下来是GBK编码,它是GB2312编码的扩展...

    utf8 gbk big5 多编码批量转换软件

    2. **GBK**(Chinese National Standard GBK)是中国大陆的汉字编码标准,它是GB2312的扩展,包含了更多的汉字和其他符号,主要用于简体中文环境。 3. **BIG5**是繁体中文的常用编码,主要应用于台湾和香港地区,...

    STM32 MDK utf8 gbk编码转换

    UTF-8的优势在于其兼容ASCII编码,对于英文字符和大部分编程语言中的特殊符号,它们在UTF-8和ASCII中具有相同的二进制表示,这使得它在网络传输和跨平台操作中非常便捷。 GBK编码,也称为GB2312的扩展,是中国大陆...

    GBK_汉字内码扩展规范编码表

    GBK编码是中国大陆地区广泛使用的一种汉字编码标准,它在GB2312的基础上扩展了字符集,不仅包含了简体中文汉字,还加入了繁体字、日韩文字以及各种标点符号、特殊符号等,极大地提高了编码的兼容性和实用性。...

    gbk汉字编码拼音对照表21004个字全

    GBK编码包含了GB2312中的所有字符,并且增加了对繁体字、少数民族文字以及一些特殊符号的支持,总共能够表示21004个不同的汉字。 这份“史上最全GBK汉字编码拼音对照表”是学习和处理中文字符编码的重要资源。它...

    GBK 汉字内码扩展规范编码表(二).txt

    - 支持更多的字符集,包括简体字、繁体字以及各种特殊符号。 - 兼容GB2312编码,使得原有的GB2312文档可以直接在支持GBK的环境中使用而无需转换。 - 采用双字节编码方式,每个汉字占用两个字节。 #### 知识点二...

    GBK编码转换和UTF-8编码转换模块源码

    在资源中提到的“GBK编码转换为URL编码”和“UTF-8编码转换为URL编码”,URL编码(也称为percent-encoding)是URL的一部分,用于包含非ASCII字符或者URL中不能直接使用的特殊字符。在URL中,某些字符如空格、中文等...

    DELPHI 10.3编码转换 iso-8859-1转GBK,GBK转iso-8859-1

    本文将深入探讨标题提及的“DELPHI 10.3编码转换:iso-8859-1转GBK,GBK转iso-8859-1”,以及在二维码生成中的应用,以解决乱码问题。 首先,我们需要理解两种编码系统的基础知识。`ISO-8859-1`是一种单字节编码...

    unicode-gbk 编码对照表

    - 对照表中还涉及了一些特殊符号和控制字符的编码转换,例如:“a4a100b7”表示 GBK 编码“a4a1”对应于 Unicode 中的码点“00b7”,这通常代表一些特殊的符号或控制字符。 4. **示例分析:** - “a5a102c9”...

    Unicode和GBK编码转换表

    它列出每个字符在Unicode和GBK编码中的对应关系,使得程序可以按照这个表将一种编码的文本转换成另一种。在实际开发中,例如在网页显示、数据库存储或者文件读写时,我们可能会遇到需要进行编码转换的情况。例如,从...

    GBK 汉字内码扩展规范编码表

    在GBK编码中,不仅包含了GB2312中的所有汉字,还增加了许多其他字符,如繁体字、少数民族文字以及一些特殊符号等,总计可以表示20902个不同的汉字和符号。 GBK编码表分为多个部分,如文中所示的A1到A9等,这些部分...

    GBK编码表.pdf

    GBK编码兼容GB2312,同时增加了更多的汉字和符号,能够覆盖更多的汉字需求,特别是对于古代文献、少数民族语言等特殊需求具有较好的支持。 #### 二、GBK编码结构与特点 ##### 2.1 编码范围 GBK编码表采用了双字节...

Global site tag (gtag.js) - Google Analytics