有不少CMS用户对GBK与UTF-8版本有什么区别不太了解,在这给大家提供一些参考
GBK版本与UTF-8版本功能是一样的.只不过编码方式不同。
GBK的文字编码是双字节来表示的,即不论中、英文字符均使用双字节来表示,只不过为区分中文,将其最高位都定成1。
至于UTF-8编码则是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。对于英文字符较多的网站则用UTF-8节省空间。
GBK包含全部中文字符;UTF-8则包含全世界所有国家需要用到的字符。
GBK是在国家标准GB2312基础上扩容后兼容GB2312的标准,UTF-8编码的文字可以在各国各种支持UTF8字符集的浏览器上显示。
比如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,而无需他们下载IE的中文语言支持包。 所以,对于英文比较多的论坛 ,使用GBK则每个字符占用2个字节,而使用UTF-8英文却只占一个字节。
简单的说:
UTF8是国际编码,它的通用性比较好,外国人也可以浏览论坛
GBK是国家编码,通用性比UTF8差,不过UTF8占用的数据库比GBK大~
提示:如果您的网站客户群体主要是面向国内用户的,建议使用GBK版本,因为它可以节省空间,及相对utf-8版本来讲稳定一些。
对于DZ论坛来说,很多插件都只支持GBK的,如果需要装较多插件的论坛还是用GBK比较好,而对装较少插件且有特殊用户群的论坛用UTF8比较好。
本文来自: IT知道网(http://www.itwis.com) 详细出处参考:http://www.itwis.com/html/website/jzcs/20090309/3533.html
分享到:
相关推荐
本篇文章将详细探讨UTF-8与GBK编码,以及如何在LabVIEW环境下进行这两种编码之间的转换。 首先,UTF-8(Unicode Transformation Format - 8 bit)是一种变长的Unicode编码,它使用1到4个字节来表示一个字符。UTF-8...
GBK、UTF-8批量文件3秒快速转码工具(支持GBK,UTF-8免费转换),UTF-8/GBK编码在线转换工具,压缩包可以有多目录与文件,如目录中有图片不会转码,但是会随转码好的文件一起打包下载。 使用帮助 . 上传压缩包(仅支持zip...
GBK采用双字节编码,对于英文字符,GBK使用与ASCII相同的编码,但对于中文字符,GBK编码与UTF-8不同。 LabVIEW中的字符编码转换通常涉及字符串函数,如“转换编码”函数。在这个项目中,开发者可能使用了LabVIEW的...
UTF-8到GBK需要查找对应的GBK编码,GBK到UTF-8则需找到对应的Unicode码点再转换为UTF-8字节序列。 4. 错误处理:在转换过程中可能会遇到非法的字节序列,需要决定如何处理,如忽略、替换或抛出错误。 在"utf2gbk"这...
Python 简单使用 pandas 读取excel 的 csv文件处理,支持utf-8和gbk编码自动识别。
总的来说,这个项目提供了一种在C++环境中使用`codecvt`库进行UTF-8与GBK编码转换的解决方案,特别适用于旧版Visual Studio。然而,对于新的C++标准和跨平台开发,开发者可能需要考虑使用更现代且更稳定的方法,比如...
原理是将UTF-8编码的汉字、字母、符号、数字等转换成unicode编码,而unicode和GBK编码存在对应关系,所以只需要将对应的unicode编码的数据对应转换码表(查表)即可得到GBK编码的内容,实现UTF-8和GBK编码互转。...
- 对于需要支持GBK编码的插件或软件,在没有UTF-8支持的情况下,可能需要使用GBK编码。 #### 八、总结 UTF-8作为一种高效且广泛的字符编码方式,在全球范围内得到了广泛应用。相比之下,GBK和GB2312虽然在某些特定...
Recognize类判定指定文本文件为UTF-8还是GBK编码格式。
### UTF-8与GBK的区别详解 #### 一、从字节上区分 **GBK编码**是一种双字节编码方案,也就是说无论是中文字符还是英文字符,GBK都使用两个字节(即16位)来表示。为了区分中文字符,GBK将最高位设置为1。这种固定...
这篇内容将深入讲解UTF-8与GBK编码,以及如何进行编码转换。 UTF-8(Unicode Transformation Format - 8 bit)是一种基于Unicode字符集的变长编码方式。它广泛应用于互联网,因为其具有良好的跨平台兼容性。UTF-8的...
在`Utf8ToGbk.c`中,可能包含的函数有`utf8_to_gbk()`,这是一个接受UTF-8字符串作为输入,返回GBK编码字符串的函数。其内部逻辑可能包括: 1. 遍历UTF-8字符串,识别每个字符的字节数。 2. 根据UTF-8的编码规则,...
对于GBK到UTF-8的转换,首先需要将GBK编码的每个双字节视为一个独立的字符,然后查找对应的Unicode码点,最后按照UTF-8的规则将其转换成1至3个字节的序列。相反,从UTF-8到GBK的转换则需要识别出UTF-8编码的字节序列...
例如,一个可能的`gbk_to_utf8`函数会遍历GBK编码的输入字符串,根据GBK编码规则将其转换为对应的Unicode码点,然后根据UTF-8的编码规则,将Unicode码点转换为UTF-8编码的字节序列。类似地,`utf8_to_gbk`函数则相反...
本文将详细解析“简单的UTF-8与GBK之间相互转码工具”,并介绍相关的编码概念和实现方法。 首先,让我们理解编码的基础知识。字符编码是用来表示文本的规则,常见的有ASCII、GBK(GB2312的扩展)、UTF-8等。ASCII是...
本文将详细介绍UTF-8和GBK编码,以及如何在.NET环境中进行这两种编码文件的互相转换。 首先,UTF-8是一种基于Unicode的字符编码方案,它能表示Unicode字符集中所有的字符。UTF-8的特点是其编码效率高,对于英文字符...
UTF-8使用1到4个字节来表示一个字符,对于ASCII字符集中的字符,UTF-8与ASCII完全兼容。 #### 三、编码转换方法 在Java中,可以使用`String`类的方法来实现不同编码之间的转换。具体来说: - `getBytes(String ...
- 通常,从GBK转UTF-8需要将每个GBK编码的双字节序列转换为对应的Unicode码点,然后根据UTF-8的规则编码。 - 反之,从UTF-8转GBK则需要解析UTF-8编码的字节序列,找到对应的Unicode码点,再转换成GBK编码。 5. **...
UTF-8、ISO-8859-1 和 GBK 是三种常见的字符编码格式,每种都有其特定的应用场景和优缺点。 首先,UTF-8 是一种广泛使用的多字节编码,能够表示几乎所有的Unicode字符,包括中文。在Java中,UTF-8 支持国际化,是...
在这个例子中,`Encoding.GetEncoding("GBK")`获取了GBK编码器,`GetBytes()`方法将GBK编码的字符串转换为字节数组,然后`Encoding.UTF8.GetString()`将这个字节数组还原为UTF-8编码的字符串。 对于文件的编码转换...