`

GB2312, GBK

    博客分类:
  • NLP
阅读更多

GB2312GBK

 

对于中文来说,通常都是用GB2312字符集或者GBK字符集。GB2312最初指的是一个编码字符集,其中包含了ASCII所包含的英文字符,同时加入了6763个简体汉字以及其他一些ASCII之外的符号。GB2312字符集同样可以使用UTF-8或者UTF-16对字符进行编码,但是一般都是用GB2312字符集自己的编码方案,即直接使用一个字符在GB2312中的编号作为存储值(与UTF-32的做法类似),平时口头说的GB2312同时指的是其字符集和字符编码。

 

GBK是GB2312的后续标准,添加了更多的汉字和特殊符号,类似的是,GBK也是同时指他的字符集和他的编码。Windows操作系统默认就是使用GBK字符集和编码。(如果使用的是繁体字的操作系统,那么通常为Big5)。

 

现如今,越来越多的网站都采用了UTF-8的编码方式,即页面中的meta标签写的charset=UTF-8。

分享到:
评论

相关推荐

    编码转换器 绿色版 gb2312 gbk utf-8

    标题和描述中提到的"编码转换器 绿色版 gb2312 gbk utf-8 万能转换"是一个软件工具,它能够帮助用户将文本文件从一种编码格式转换到另一种,尤其是GB2312、GBK和UTF-8这三种常见的中文编码格式。 1. **编码系统**:...

    gb2312 gbk 编码表

    GB2312和GBK是中国大陆广泛使用的两种字符编码标准,它们在中文信息处理中扮演了重要角色。让我们深入探讨一下这两个编码系统以及与它们相关的UTF-8编码。 GB2312(国标2312)是1980年制定的简体中文字符编码标准,...

    utf-8、gbk、gb2312区别

    ### UTF-8、GBK、GB2312的区别 在计算机科学领域,字符编码是将文字转换为二进制数字以便计算机处理的过程。常见的字符集包括UTF-8、GBK、GB2312等,它们各有特点,在不同的场景下被广泛应用。 #### GB2312编码 *...

    GB2312 GBK GB18030的汉字编码表

    GB2312字符集 作用:国家简体中文字符集,兼容ASCII。 位数:使用2个字节表示,能表示7445个符号,包括6763个汉字,几乎覆盖所有高频率汉字。 范围:高字节从A1到F7, 低字节从A1到FE。将高字节和低字节分别加上0XA0...

    unicode与GB18030(GB2312,GBK) 转换码表

    GBK是在GB2312基础上的扩展,增加了对GBK18030之前其他编码系统的兼容,包括BIG5(用于繁体中文)和GB2312不涵盖的一些少数民族文字,共收录了20902个汉字和符号,是GB2312的一个广泛使用的扩展版本。 转换码表是...

    国标一二级汉字字符集:GB2312、GBK

    国标一二级汉字字符集是指在中国大陆地区广泛使用的汉字编码标准,包括GB2312和GBK两个标准。GB2312是在1980年由中国国家标准总局发布的一个字符集,它收录了6763个汉字和682个其他符号,共7445个字符,分为一二级...

    趣谈Unicode、Ascii、utf-8、GB2312、GBK等编码学问_.docx

    本文将从头讲解编码的故事,包括 Unicode、Ascii、utf-8、GB2312、GBK 等编码标准的由来和发展。 首先,让我们从基本的概念开始。计算机使用字节来存储信息,而字节是由 8 个可以开合的晶体管组合成的。这些字节...

    GB2312简体中文编码表

    例如,GBK编码是在GB2312的基础上增加了更多的汉字和符号,而GB18030又进一步扩展了GBK,包含了更多的汉字及少数民族文字。因此,GB2312可以看作是这些编码的一个子集。 在实际应用中,如果系统支持GBK或GB18030...

    GBK.rar_GB2312-80_GBK_gb2312_gb2312-To-unicode_汉字编码

    《GBK与GB2312-80:汉字编码的历史演变与应用》 在信息技术领域,汉字编码是一种至关重要的技术,它使得计算机能够识别、存储和处理汉字。本篇文章将深入探讨“GBK”和“GB2312-80”这两种汉字编码标准,以及它们在...

    GB2312中的6700+个汉字以及GBK的21000个汉字.rar

    《GB2312与GBK编码:汉字的数字化之旅》 汉字,作为中华文明的重要载体,自古以来就有丰富的数量和复杂的形式。随着信息技术的发展,如何将这些字符转化为计算机可以识别和处理的数据,成为了编码技术的一大挑战。...

    gb2312标准字符集和gbk标准字符集

    《GB2312与GBK字符集详解》 在信息技术领域,字符编码是至关重要的一个环节,它决定了计算机如何理解和显示各种文字。GB2312和GBK是中国大陆广泛使用的两个字符编码标准,它们为汉字提供了数字化的表示方式,使得...

    Unicode to GB2312 or GBK table

    GBK编码可以视为GB2312的一个扩展,它对GB2312进行了扩展,增加了更多的汉字和符号,以容纳更多的中文字符。GBK编码标准全称为《汉字内码扩展规范》,是一个向后兼容GB2312的编码方案,同时也是简体中文Windows系统...

    GBK1.0和GB2312的汉字

    GBK1.0同样采用双字节编码,其编码空间与GB2312兼容,即保留了GB2312的编码范围,但在GB2312未使用的编码区域内增加了新的字符。GBK1.0的高位字节范围扩大至0x81到0xFE,低位字节范围不变,从而能容纳更多的汉字和...

    UTF-8和GBK及GB2312的区别

    ### UTF-8与GBK及GB2312的区别 #### 一、引言 随着互联网技术的发展和全球化的深入,不同国家和地区之间的信息交流日益频繁。为了满足这种需求,多种字符编码标准应运而生,其中UTF-8、GBK和GB2312是中文环境中最...

    kaiti_GB2312.zip

    由于GB2312仅包含常用汉字,对于一些生僻字或者繁体字无法支持,因此在现代的中文处理中,GBK和UTF-8等编码更为常见。 “kaiti_GB2312.zip”是一个压缩文件,使用的是ZIP压缩格式。ZIP是一种常见的文件归档和压缩...

    C#写的 GBK GB2312 UTF-8转换

    GBK、GB2312和UTF-8是三种常见的字符编码标准,每种都有其特定的应用场景和特点。C#作为.NET框架下的主要编程语言,提供了丰富的类库支持对不同编码格式之间的转换。 1. **GBK编码**:GBK是中国大陆广泛使用的汉字...

    js对中文字符串进行gb2312编码解码

    GB2312编码是一种在中国大陆广泛使用的简体中文字符集,它包含了6763个常用汉字和一些其他字符。在JavaScript中进行GB2312编码和解码可以帮助我们正确地在不同环境间传输和展示中文字符。 首先,让我们理解GB2312...

    仿宋_GB2312字体及其安装方法

    - 文档兼容性:由于仿宋_GB2312是一款GB2312编码的字体,主要支持简体中文,如果文档中包含繁体或特殊字符,可能无法正确显示,这时需要考虑使用支持更多字符集的字体,如GBK或Unicode编码的字体。 - 版本差异:...

    GB2312简体中文编码表及转换程序

    "汉字编码表.txt"和"Unicode、GB2312、GBK和GB18030中的汉字_janvyking999的空间_百度空间.txt"这两个文本文件可能包含了汉字在不同编码中的对应信息,供开发者参考和使用。 在实际开发中,理解和掌握这些编码标准...

Global site tag (gtag.js) - Google Analytics