`
morning2008
  • 浏览: 115257 次
  • 性别: Icon_minigender_1
  • 来自: 合肥
社区版块
存档分类
最新评论

关于GBK、GB2312、UTF8之间的区别

 
阅读更多

本文来自:百度空间

UTF-8:Unicode Transformation Format-8bit,允许含BOM,但通常不含BOM。是用以解决国际上字符的一种多字

节编码,它对英文使用8位(即一个字节),中文使用24为(三个字节)来编码。UTF-8包含全世界所有国家需要用到的字

符,是国际编码,通用性强。UTF-8编码的文字可以在各国支持UTF8字符集的浏览器上显示。如,如果是UTF8编码,则在

外国人的英文IE上也能显示中文,他们无需下载IE的中文语言支持包。

GBK是国家标准GB2312基础上扩容后兼容GB2312的标准。GBK的文字编码是用双字节来表示的,即不论中、英文字符

均使用双字节来表示,为了区分中文,将其最高位都设定成1。GBK包含全部中文字符,是国家编码,通用性比UTF8差,

不过UTF8占用的数据库比GBK大。

GBK、GB2312等与UTF8之间都必须通过Unicode编码才能相互转换:

GBK、GB2312--Unicode--UTF8

UTF8--Unicode--GBK、GB2312

对于一个网站、论坛来说,如果英文字符较多,则建议使用UTF-8节省空间。不过现在很多论坛的插件一般只支持GBK。

GB2312是GBK的子集,GBK是GB18030的子集

GBK是包括中日韩字符的大字符集合

如果是中文的网站 推荐GB2312 GBK有时还是有点问题

为了避免所有乱码问题,应该采用UTF-8,将来要支持国际化也非常方便

UTF-8可以看作是大字符集,它包含了大部分文字的编码。

使用UTF-8的一个好处是其他地区的用户(如香港台湾)无需安装简体中文支持就能正常观看你的文字而不会出现乱码。

gb2312是简体中文的码

gbk支持简体中文及繁体中文

big5支持繁体中文

utf-8支持几乎所有字符

中文内容多的站点可以考虑用gbk或gb2312,英文内容多的站点还是utf-8好
分享到:
评论

相关推荐

    C#写的 GBK GB2312 UTF-8转换

    GBK、GB2312和UTF-8是三种常见的字符编码标准,每种都有其特定的应用场景和特点。C#作为.NET框架下的主要编程语言,提供了丰富的类库支持对不同编码格式之间的转换。 1. **GBK编码**:GBK是中国大陆广泛使用的汉字...

    UTF-8 Unicode GBK GB2312 编码之间的区别和联系

    ### UTF-8、Unicode、GBK、GB2312 编码之间的区别和联系 #### 一、引言 在互联网技术中,字符编码是非常重要的基础概念之一。字符编码不仅决定了文本在网络上的传输效率,还直接影响到了不同国家和地区用户访问...

    GBK GB2312转UTF-8工具

    "GBK GB2312转UTF-8工具"正是为了解决这类问题而设计的,它能够帮助用户批量地将GBK或GB2312编码的文件转换成更通用的UTF-8编码。 GBK编码是GB2312的扩展,全称为“汉字内码扩展规范”,在中国大陆广泛使用,它包含...

    GBK GB2312 UTF-8 ISO-8859-1区别

    GBK、GB2312、UTF-8和ISO-8859-1都是字符编码标准,但是它们之间有所不同。GBK和GB2312主要用于中文编码,而UTF-8则是一个国际标准,能够包含全世界所有国家需要用到的字符。ISO-8859-1则是西欧语言的标准。 六、...

    编码转换器 绿色版 gb2312 gbk utf-8

    4. **万能转换**:这个标签意味着该软件支持多种编码格式之间的转换,不仅限于GB2312、GBK和UTF-8,可能还包括其他编码格式,如Big5、ISO-8859-1等。 5. **字符转换gb2utf8**:这个压缩文件中的"字符转换gb2utf8"很...

    GB2312转UTF-8(C代码)

    GB2312和UTF-8是两种不同的字符编码标准,它们各自有其特点和适用范围。本资源提供了一个C语言实现的GB2312到UTF-8的转换函数,方便开发者在需要进行这种编码转换时使用。 GB2312是中国大陆早期广泛使用的简体中文...

    UTF-8和GBK及GB2312的区别

    ### UTF-8与GBK及GB2312的区别 #### 一、引言 随着互联网技术的发展和全球化的深入,不同国家和地区之间的信息交流日益频繁。为了满足这种需求,多种字符编码标准应运而生,其中UTF-8、GBK和GB2312是中文环境中最...

    STM32 C 语言转换 utf8 gb2312

    4. **编码转换算法**:在C语言中实现UTF-8和GB2312之间的转换,需要理解两者的编码规则并编写相应的转换函数。例如,从UTF-8转GB2312可能需要先解析UTF-8编码的字节序列,然后找到对应的GB2312编码。 5. **内存管理...

    记事本的各种编码转换 GBK GB2312 UNICODE UTF8

    通过这个工具,用户可以方便地在GBK、GB2312、UNICODE和UTF-8之间进行切换,解决编码不匹配导致的乱码问题。 "Readme-说明.htm"文件很可能是该工具的使用指南,它应该会提供详细的步骤和注意事项,包括如何选择输入...

    GB2312编码和UTF-8互转(c语言实现)

    GB2312编码与utf-8编码的字符串的转换,主要使用windows api函数MultiByteToWideChar和WideCharToMultiByte,代码简洁,经测试可用

    utf-8 互转 gb2312 转码

    在处理UTF-8和GB2312之间的转码问题时,我们需要确保正确地转换每个字符的编码,以避免乱码情况的发生。转码过程通常包括两个步骤:解码和编码。首先,我们需要将UTF-8编码的字符串解码为Unicode,然后将Unicode转换...

    VB6.0 UTF-8转换GB2312函数

    在VB6.0编程环境中,有时我们需要处理不同字符编码之间的转换,例如将UTF-8编码的字符串转换为GB2312编码。UTF-8是一种广泛使用的Unicode编码,而GB2312是中国大陆常用的简体中文字符集,主要用于早期的计算机系统。...

    GB2UTF8.rar_GB2UTF8_convert_gb2312 utf8_utf8 gb2312_website

    不同的编码格式如GBK(GB2312的扩展)、UTF-8等,使得在不同系统和平台间的数据交换变得复杂。针对这种情况,"GB2UTF8.rar"提供了一个实用的工具,它能够帮助用户快速、方便地将网站的编码在GB2312和UTF-8之间进行...

    c语言gbk、utf8转换编码表及函数

    - 在C语言中,我们可以编写函数来实现GBK和UTF-8之间的转换。文件`utf8gbk.h`和`utf8gbk.c`可能包含了这样的转换函数。 - 通常,从GBK转UTF-8需要将每个GBK编码的双字节序列转换为对应的Unicode码点,然后根据UTF-...

    gb2312,utf-8,utf-8-bom等编码格式的互相转换

    本文将深入探讨几种常见的编码格式,如GB2312、UTF-8以及UTF-8-BOM,并详细讲解如何在C#中进行这些编码格式之间的转换,同时会涉及到与Stream相关的操作。 GB2312,全称为“国标汉字编码字符集”,是中国大陆广泛...

    c gbk和 utf-8 转换

    GBK是中国大陆广泛采用的一种汉字编码标准,它是GB2312的扩展,包含了更多的汉字和符号,能够覆盖大部分中文字符。UTF-8则是一种多字节的Unicode编码,可以表示世界上几乎所有的字符,包括中文、英文、日文等,其...

    转换为GB2312.bat转换为UTF8.bat

    标题和描述中提到的"转换为GB2312.bat转换为UTF8.bat"暗示了这是一个批处理(batch script)文件,用于在两种不同的字符编码之间进行转换:GBK(GB2312)和UTF-8。GBK是中国大陆广泛使用的简体中文编码标准,而UTF-8...

    GBK与UTF-8转码(C++)

    本文将详细介绍如何在Microsoft Foundation Classes (MFC)环境下实现GBK与UTF-8之间的编码转换。该技术适用于那些需要处理不同字符集数据的应用程序开发场景,特别是在早期Windows系统中广泛使用的MFC框架下进行编码...

    utf8-gb2312-unicode批量转码工具

    UTF-8、GBK(GB2312)和Unicode是三种常见的字符编码标准,它们各有特点,但也有各自的适用场景。 首先,UTF-8是一种变长的 Unicode 字符编码,它广泛应用于互联网和现代操作系统中。UTF-8的优点在于它可以完美兼容...

    UTF-8与GB2312之间的互换类.rar_ UTF-8toGB2312_UTF-8 GB2312_gb2312_mmi_ch

    标题中的"UTF-8与GB2312之间的互换类.rar_ UTF-8toGB2312_UTF-8 GB2312_gb2312_mmi_ch"指的是一个能够帮助开发者在UTF-8和GB2312两种编码格式之间进行转换的程序类库。这个压缩包可能包含了源代码文件,使得用户可以...

Global site tag (gtag.js) - Google Analytics