gbk和gb2312编码中的一些特殊符号的有趣现象
在EmEditor编辑器中以gb2312的方式在文件test.html中存放字符·
1.在IE中以gb2312方式能正确显示
2.在FireFox中以gb2312和gbk均能正确显示
3.在eclipse中以gbk能正确显示,以gb2312显示为另外一个字符・
4.以java程序从文件中读出来的话,gbk方式能正确输出,但gb2312输出乱码?
代码如下所示:
public static String readContentFromFile(File file, String encode) {
String result = "";
try {
FileInputStream fi = new FileInputStream(file);
InputStreamReader is = new InputStreamReader(fi, encode);
char[] tmp = new char[(int) file.length()];
if (-1 != is.read(tmp)) {
result += new String(tmp);
}
is.close();
fi.close();
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
return result;
}
分享到:
相关推荐
本文将详细介绍GBK字符集编码表中的几个关键部分。 #### 二、非汉字符号区段(GBK/1) 在GBK/1区段中主要收录了非汉字的符号,这些符号广泛应用于日常文档编辑、编程语言以及各种文本处理中。例如: - **标点符号...
在GB2312编码中,主要包含了6763个常用汉字和一些基本的符号,而GBK编码则在GB2312的基础上增加了许多生僻字和繁体字,使其更加适用于中文信息处理和交换。GBK编码使用了双字节来表示每个字符,其中高位字节范围在0x...
GBK编码是GB2312编码的扩展,用于表示更多的汉字和符号,是简体中文环境下广泛使用的一种字符编码。VC++,作为Microsoft的C++开发环境,提供了丰富的库支持来处理这种编码转换。本篇文章将深入探讨如何在VC++环境中...
GBK编码覆盖了简体中文和繁体中文字符,并包含了大量的罕用字和特殊符号。 #### 二、GBK编码结构 GBK编码采用双字节编码方式,每个字符由两个字节组成,其中高位字节(即第一个字节)的取值范围为0x81至0xFE,低位...
GBK扩展了GB2312的编码范围,增加了更多汉字以及一些特殊符号。 GBK编码表的结构分为多个区段,每个区段都有对应的编码范围。例如,GBK/1区段包含GB2312的非汉字符号,GBK/2区段则是GB2312中的汉字。GBK/3和GBK/4...
在GBK编码中,每个字节的最高位被设置为1,以区别于ASCII码(ASCII码中的最高位为0)。GBK编码的范围是从8140H到FEFEH,但不包括7FH这个特殊码位,总共可以表示23940个不同的码位。 GBK编码的扩展性体现在它不仅...
GBK编码扩展了GB2312的基础,不仅包含了GB2312的6763个汉字,还增加了大量的生僻字、繁体字和特殊符号。这一扩展大大提升了编码的覆盖面,使其能够支持超过21000个汉字,更加符合中文语言和文化的需求。GBK的出现,...
UTF-8的优势在于其兼容ASCII编码,对于英文字符和大部分编程语言中的特殊符号,它们在UTF-8和ASCII中具有相同的二进制表示,这使得它在网络传输和跨平台操作中非常便捷。 GBK编码,也称为GB2312的扩展,是中国大陆...
它基于ASCII编码,由两个字节组成,包含了大约13,000个字符,主要包括常用汉字、标点符号和一些特殊字符。Big5编码的前128个字节与ASCII兼容,其余部分则用于存储中文字符。 接下来是GBK编码,它是GB2312编码的扩展...
2. **GBK**(Chinese National Standard GBK)是中国大陆的汉字编码标准,它是GB2312的扩展,包含了更多的汉字和其他符号,主要用于简体中文环境。 3. **BIG5**是繁体中文的常用编码,主要应用于台湾和香港地区,...
GBK编码是中国大陆地区广泛使用的一种汉字编码标准,它在GB2312的基础上扩展了字符集,不仅包含了简体中文汉字,还加入了繁体字、日韩文字以及各种标点符号、特殊符号等,极大地提高了编码的兼容性和实用性。...
本文将深入探讨标题提及的“DELPHI 10.3编码转换:iso-8859-1转GBK,GBK转iso-8859-1”,以及在二维码生成中的应用,以解决乱码问题。 首先,我们需要理解两种编码系统的基础知识。`ISO-8859-1`是一种单字节编码...
GBK编码包含了GB2312中的所有字符,并且增加了对繁体字、少数民族文字以及一些特殊符号的支持,总共能够表示21004个不同的汉字。 这份“史上最全GBK汉字编码拼音对照表”是学习和处理中文字符编码的重要资源。它...
- 支持更多的字符集,包括简体字、繁体字以及各种特殊符号。 - 兼容GB2312编码,使得原有的GB2312文档可以直接在支持GBK的环境中使用而无需转换。 - 采用双字节编码方式,每个汉字占用两个字节。 #### 知识点二...
在资源中提到的“GBK编码转换为URL编码”和“UTF-8编码转换为URL编码”,URL编码(也称为percent-encoding)是URL的一部分,用于包含非ASCII字符或者URL中不能直接使用的特殊字符。在URL中,某些字符如空格、中文等...
- 对照表中还涉及了一些特殊符号和控制字符的编码转换,例如:“a4a100b7”表示 GBK 编码“a4a1”对应于 Unicode 中的码点“00b7”,这通常代表一些特殊的符号或控制字符。 4. **示例分析:** - “a5a102c9”...
它列出每个字符在Unicode和GBK编码中的对应关系,使得程序可以按照这个表将一种编码的文本转换成另一种。在实际开发中,例如在网页显示、数据库存储或者文件读写时,我们可能会遇到需要进行编码转换的情况。例如,从...
它不仅包含了GB2312中的全部汉字,还融合了繁体字、少数民族文字以及诸多特殊符号,使得整个GBK编码系统能够表示多达20902个不同的汉字和符号。 GBK编码表被细致地分为了若干部分,每部分都包含特定类别的字符。以...
GBK编码兼容GB2312,同时增加了更多的汉字和符号,能够覆盖更多的汉字需求,特别是对于古代文献、少数民族语言等特殊需求具有较好的支持。 #### 二、GBK编码结构与特点 ##### 2.1 编码范围 GBK编码表采用了双字节...