`
wfwkiss
  • 浏览: 127164 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

UTF—8和GBK的区别

阅读更多

字符均使用双字节来表示,只不过为区分中文,将其最高位都定成1。

至于UTF-8编码则是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。对于英文字符较多的论坛则用UTF-8节省空间。

GBK包含全部中文字符;UTF-8则包含全世界所有国家需要用到的字符。

GBK是在国家标准GB2312基础上扩容后兼容GB2312的标准(好像还不是国家标准)
UTF-8编码的文字可以在各国各种支持UTF8字符集的浏览器上显示。
比如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,而无需他们下载IE的中文语言支持包。 所以,对于英文比较多的论坛 ,使用GBK则每个字符占用2个字节,而使用UTF-8英文却只占一个字节。

UTF8是国际编码,它的通用性比较好,外国人也可以浏览论坛,GBK是国家编码,通用性比UTF8差,不过UTF8占用的数据库比GBK大~
字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24为(三个字节)来编码。UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强。UTF-8编码的文字可以在各国支持UTF8字符集的浏览器上显示。如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,他们无需下载 IE的中文语言支持包。

GBK是国家标准GB2312基础上扩容后兼容GB2312的标准。GBK的文字编码是用双字节来表示的,即不论中、英文字符均使用双字节来表示,为了区分中文,将其最高位都设定成1。GBK包含全部中文字符,是国家编码,通用性比UTF8差,不过UTF8占用的数据库比GBD大。

GBK、GB2312等与UTF8之间都必须通过Unicode编码才能相互转换:

GBK、GB2312--Unicode--UTF8

UTF8--Unicode--GBK、GB2312

对于一个网站、论坛来说,如果英文字符较多,则建议使用UTF-8节省空间。不过现在很多论坛的插件一般只支持GBK。


GB2312是GBK的子集,GBK是GB18030的子集
GBK是包括中日韩字符的大字符集合
如果是中文的网站 推荐GB2312 GBK有时还是有点问题
为了避免所有乱码问题,应该采用UTF-8,将来要支持国际化也非常方便
UTF-8可以看作是大字符集,它包含了大部分文字的编码。
使用UTF-8的一个好处是其他地区的用户(如香港台湾)无需安装简体中文支持就能正常观看你的文字而不会出现乱码。
分享到:
评论

相关推荐

    utf8转gbk-C语言版本.rar

    在IT行业中,字符编码是一个非常重要的领域,尤其是在处理多国语言和不同系统间的数据交换时。...开发者可以通过"Utf8ToGbk.c"和"Utf8ToGbk.h"来理解和使用这个转换功能,以便在资源有限的硬件上正确显示中文字符。

    UTF8-GBK编码互转(C)

    UTF8和GBK是两种广泛使用的字符编码标准,它们各自有其特点和适用场景。本项目聚焦于UTF8与GBK之间的转换,利用C语言编写,无需依赖任何特定的API,使得程序具有高度的独立性和可移植性。 UTF8(Unicode ...

    UTF8转GBK C语言 单片机

    本文主要探讨如何在单片机环境中,使用C语言将UTF-8编码转换为GBK编码,解决在串口通信、TF卡存储或LCD显示时可能出现的中文乱码问题。我们将深入理解UTF-8与GBK编码的原理,并分析基于Keil开发环境的C语言实现过程...

    windows下利用libiconv将实现utf8和gbk编码之间转换

    本主题主要关注如何利用libiconv库在Windows上实现UTF-8和GBK编码之间的转换。libiconv是一个广泛使用的字符编码转换工具,它支持多种编码格式,包括UTF-8和GBK。 UTF-8是一种变长的Unicode编码方式,每个Unicode...

    labview utf8toGBK

    UTF-8和GBK是两种常见的汉字编码格式。UTF-8(8位统一 Transformation Format)是一种可变长度的Unicode编码,它能够表示Unicode字符集中的所有字符,包括世界上大多数语言的字符。UTF-8的优点在于它对英文字符使用...

    UTF8和GBK转码软件.rar

    本文将详细解析UTF8和GBK字符编码,并介绍如何进行这两种编码之间的转换,以及对应的转码软件。 首先,让我们了解UTF8和GBK字符编码的基本概念: 1. **UTF8**:全称为“Unicode Transformation Format - 8 bit”,...

    utf8.rar_GBK_gbk utf8_gbk utf8_unicode_unicode gbk

    先从UTF8中解读出unicode值,再从数组中读出GBK值。 GBK->UTF8 直接以GBK的值为下标,查找数组中对应的UTF8值。 现在解决的问题: 1.可从UTF8转换到GBK编码 2.可对UTF8的编码格式作出判断,如某个UTF8不合要求...

    UTF-8转GBK C语言 Linux

    为了在无库的情况下实现这个转换,开发者需要对字符编码有深入的理解,包括UTF-8和GBK的编码规则,以及Unicode码点到GBK码点的映射关系。这种映射通常可以通过查找预先生成的映射表或者实现算法来完成。由于GBK是单...

    c语言gbk、utf8转换编码表及函数

    在C语言中,字符编码是非常重要...通过`utf8gbk.h`和`utf8gbk.c`这两个文件,你可以直接在C程序中实现GBK与UTF-8的转换,从而满足项目的需求。不过,要注意,这些函数可能需要根据具体环境和需求进行适当的修改和优化。

    文件编码转换(utf8与gbk相互转换)

    在中文环境下,我们常遇到的两种编码格式是UTF-8和GBK。这两种编码都是为了能够正确地存储和显示中文字符,但它们之间存在差异,有时需要进行相互转换。 UTF-8(Unicode Transformation Format - 8 bit)是一种变长...

    UTF-8toGBK_labview编码gbk_LabVIEWUTF-8_utf-8toGbk_源码.zip

    这个压缩包文件"UTF-8toGBK_labview编码gbk_LabVIEWUTF-8_utf-8toGbk_源码.zip"主要涉及到两个常见的字符编码格式:UTF-8和GBK,以及如何在LabVIEW环境下进行编码转换。LabVIEW是美国国家仪器(NI)开发的一种图形化...

    UTF-8toGBK_labview编码gbk_LabVIEWUTF-8_utf-8toGbk_

    UTF-8和GBK是两种常见的字符编码格式,它们各有特点,适用于不同的场景。本篇文章将详细探讨UTF-8与GBK编码,以及如何在LabVIEW环境下进行这两种编码之间的转换。 首先,UTF-8(Unicode Transformation Format - 8 ...

    DiscuzX3.4UTF8转GBK后乱码解决方案

    首先,我们需要理解UTF-8和GBK两种编码的区别。UTF-8是一种国际标准的多字节字符编码,可以表示Unicode字符集中的所有字符,广泛应用于互联网。GBK是中国大陆地区广泛使用的编码,它是GB2312的扩展,兼容大部分简体...

    STM32 MDK utf8 gbk编码转换

    标题和描述中提到的问题核心在于UTF-8和GBK编码之间的转换。 UTF-8是一种变长的Unicode编码方式,它能够表示Unicode标准中的所有字符,包括汉字。UTF-8的优势在于其兼容ASCII编码,对于英文字符和大部分编程语言中...

    c++ utf-8转gbk

    `codecvt_utf8_gbk`是一个特定的`codecvt`类,用于UTF-8和GBK之间的转换。不过需要注意的是,C++11标准之后,`codecvt`类在某些编译器中被标记为过时,因此在现代C++代码中可能会需要寻找替代方案,例如使用第三方库...

    utf8转gbk-C语言完美版.rar

    UTF-8和GBK是两种常见的字符编码标准,它们在处理中文字符时各有特点。本项目提供的"utf8转gbk-C语言完美版.rar"是一个C语言实现的工具,专门用于将UTF-8编码的文本转换为GBK编码,特别地,它增加了对中文标点符号的...

    utf8与gbk互转.zip

    UTF8和GBK是两种常见的字符编码标准,它们在不同的场景下有着广泛的应用。本压缩包文件"utf8与gbk互转.zip"包含两个源文件——utf8togbk.c和utf8togbk.h,它们提供了在C语言环境下,UTF8与GBK编码之间的转换方法,...

    GBK、UTF-8编码转换工具

    GBK、UTF-8批量文件3秒快速转码工具(支持GBK,UTF-8免费转换),UTF-8/GBK编码在线转换工具,压缩包可以有多目录与文件,如目录中有图片不会转码,但是会随转码好的文件一起打包下载。 使用帮助 . 上传压缩包(仅支持zip...

    C++实现判断一个字符串是否为UTF8或GBK格式的方法

    本文实例讲述了C++实现判断一个字符串是否为UTF8或GBK格式的方法。分享给大家供大家参考,具体如下: 在处理外部数据的时候,很可能因为数据格式不一样而导致乱码,甚至导致某些程序挂掉。鉴于对多数系统来说,使用...

    utf8转gbk工具

    UTF-8 和 GBK 是两种广泛使用的字符编码标准,尤其在中国大陆,GBK 编码在传统系统和软件中较为常见,而 UTF-8 则是现代互联网的标准编码。本文将详细讲解 UTF-8 转 GBK 工具的工作原理、应用场景以及如何进行编码...

Global site tag (gtag.js) - Google Analytics