`

GB2312,GBK,UTF-8的关系

    博客分类:
  • Java
阅读更多

1,GBK编码兼容GB2312.

详细点的信息是:

GB码,全称是GB2312-80,GB码共收录6763个简体汉字、682个符号。

GBK编码是中国大陆制订的、等同于UCS的新的中文编码扩展国家标准。GBK工作小组于1995年10月,同年12月完成GBK规范。该编码标准兼容GB2312,共收录汉字21003个、符号883个,并提供1894个造字码位,简、繁体字融于一库

GBK的文字编码是双字节来表示的,即不论中、英文字符均使用双字节来表示,只不过为区分中文,将其最高位都定成1。

2,UTF-8对中文用3个字节,英文用1个字节

UTF-8编码则是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。对于英文字符较多的论坛则用UTF-8节省空间。

3,所以,如果英文较多的论坛,用UTF-8较合算;中文较多的话,不考虑国际兼容性的话,用GBK编码较合算,但不知道是英文等其他语言的浏览器能否解析GBK编码的网页呢?

分享到:
评论

相关推荐

    UTF-8 Unicode GBK GB2312 编码之间的区别和联系

    ### UTF-8、Unicode、GBK、GB2312 编码之间的区别和联系 #### 一、引言 在互联网技术中,字符编码是非常重要的基础概念之一。字符编码不仅决定了文本在网络上的传输效率,还直接影响到了不同国家和地区用户访问...

    VB6.0 UTF-8转换GB2312函数

    在VB6.0编程环境中,有时我们需要处理不同字符编码之间的转换,例如将UTF-8编码的字符串转换为GB2312编码。UTF-8是一种广泛使用的Unicode编码,而GB2312是中国大陆常用的简体中文字符集,主要用于早期的计算机系统。...

    UNICODE\Unicode,GBK,GB2312,UTF-8概念基础

    UTF-8是最广泛使用的编码格式,它使用8位字节,并根据字符的不同范围使用1至4个字节进行编码。UTF-8的一个显著优点是与CPU字节顺序无关,具有良好的平台兼容性和错误容错能力。UTF-16则是16位的编码,与Unicode的...

    UTF-8转GBK C语言 Linux

    为了在无库的情况下实现这个转换,开发者需要对字符编码有深入的理解,包括UTF-8和GBK的编码规则,以及Unicode码点到GBK码点的映射关系。这种映射通常可以通过查找预先生成的映射表或者实现算法来完成。由于GBK是单...

    GBK_pinyin_table.rar_GBK_gbk utf-8_gbk piny_gbk_to_pinyin_pinyi

    标题中的“GBK_pinyin_table.rar”表明这是一个关于GBK编码的拼音资源文件,而“GBK_gbk_utf-8_gbk_to_pinyin_pinyi”则暗示了这个资源涉及到GBK编码、UTF-8编码以及汉字到拼音的转换。描述中提到这是“GBK拼音字表...

    UTF-8编码转GBK编码

    本主题聚焦于“UTF-8编码转GBK编码”,这是一个常见的需求,特别是在嵌入式系统如单片机中,由于资源限制,可能需要将UTF-8编码的字符串转换为GBK编码以便正确显示中文字符。 首先,我们要理解UTF-8和GBK这两种编码...

    gbk与utf-8的区别

    4. **存储空间**:由于UTF-8的可变长度,对于纯英文或包含少量中文的文本,UTF-8可能会比GBK占用更多空间,反之则可能更少。 5. **处理难度**:GBK处理起来相对简单,而UTF-8由于字节顺序和字节数量的变化,处理起来...

    GBK,unicode,utf-8 conversion.rar

    在IT行业中,字符编码是处理文本数据的基础,GBK、Unicode和UTF-8是三种常见的字符编码格式,它们各自有特定的使用场景和特点。本文将详细介绍这三种编码方式,并提供C语言实现它们之间转换的函数。 GBK编码是中国...

    转换为GB2312.bat转换为UTF8.bat

    标题和描述中提到的"转换为GB2312.bat转换为UTF8.bat"暗示了这是一个批处理(batch script)文件,用于在两种不同的字符编码之间进行转换:GBK(GB2312)和UTF-8。GBK是中国大陆广泛使用的简体中文编码标准,而UTF-8...

    js将字符转换为UTF-8字符的工具

    首先,需要识别出 UTF-8 字节序列中的每个字符,然后根据 UTF-8 到 GB2312 的映射关系还原出对应的 GB2312 字符。这个过程同样涉及到解码和位操作。 5. **在线工具实现** - 在线工具通常包含一个输入框让用户输入...

    unicode转gb18030编码

    在实际应用中,由于历史原因,某些系统或软件可能只支持GB18030编码,因此需要将Unicode(通常以UTF-8形式存在)转换为GB18030。这个转换过程通常包括两个步骤:UTF-8到Unicode,然后Unicode到GB18030。 **1. UTF-8...

    C语言GBK、Unicode与UTF8互转代码,含转码表及接口函数

    本文将深入探讨C语言中GBK、Unicode和UTF-8之间的转换,并提供相关的转码表和接口函数。 首先,让我们了解一下这三种编码标准: 1. **GBK编码**:GBK是中国大陆广泛使用的汉字编码标准,它是GB2312的扩展,兼容GB...

    将文本转换为UTF-8码.zip易语言项目例子源码下载

    1. **字符编码理解**:首先,我们需要了解各种字符编码的区别,如GBK、BIG5、GB2312等,以及它们与UTF-8之间的关系。GBK是在GB2312基础上扩展的,包含了更多的汉字,而BIG5则主要用于繁体中文。在转换过程中,我们...

    gbk_utf8_unicode.zip

    GBK编码是中国大陆使用的一种汉字编码标准,它是GB2312的扩展,包含更多的汉字和符号,但它是单字节编码,对于非ASCII字符,GBK不能直接与UTF-8或Unicode相兼容。 描述中提到的问题是,云端的数据以Unicode编码...

    字符編碼轉化V1.1

    常见的字符编码有ASCII、GBK(GB2312的扩展)、UTF-8、BIG5等。其中,GB2312是中国大陆广泛使用的简体中文字符集,UTF-8是一种可伸缩的Unicode编码方式,支持全球多种语言,而BIG5则主要用于繁体中文环境。 《字符...

    乱码 编码方式解决 gbk ISO8859-1 utf8 编码

    本文将针对标题中的几种常见编码格式(GBK、ISO 8859-1、UTF-8)以及如何解决由这些编码方式引发的乱码问题进行深入探讨。 #### 一、编码概述 1. **GBK编码**:GBK是GB2312标准的扩展,支持简体中文,是Microsoft ...

    GB2312编码表

    ### GB2312编码表知识点详解 #### 一、GB2312编码概述 GB2312是中华人民共和国国家标准《信息交换用汉字编码字符集·...然而,随着技术的进步和需求的变化,GB2312逐渐被更先进的编码标准所取代,如GBK、UTF-8等。

    更改mysql编码

    MySQL是一种广泛使用的开源关系型数据库管理系统,其支持多种字符编码,包括GBK、UTF-8等。在处理中文数据时,不正确的字符编码设置可能导致中文乱码问题。解决这个问题通常涉及对MySQL服务器、数据库、表以及连接的...

    Unicode与GB2312互转.zip

    例如,UTF-8编码的字节顺序标记(BOM)在GB2312中不存在,转换时需要处理。 实际应用中,开发者可能需要这些头文件来处理不同编码间的字符串交互,如网络传输、文件读写或数据库存储。理解Unicode和GB2312的差异,...

Global site tag (gtag.js) - Google Analytics