GBK简体中文版和UTF8简体中文版有什么区别?
ASCII(ISO-8859-1)是鼻祖,最简单的方式,字节高位为0
GB2312、GBK、GB18030,这几个是中文编码方式,并向下兼容。GB2312包含7000多个汉字和字符,GBK包含21000多个,GB18030更厉害,到了27000多个。他们都是用2个字节来表示一个汉字。跟ascii是怎么区分的呢?如果高字节的高位为1(也就是高字节大于127),就表示是汉字,低字节并无明显特征。
Unicode是统一编码,它建立了一个全世界统一的码表。世界上的所有文字,在这张码表中都是唯一的。
UTF-8是Unicode的一种存储、传输方式。它将整个Unicode码表分为3部分。
0000 - 007F 这部分是最初的ascii部分,按原始的存储方式,即0xxxxxxx。
0080 - 07FF 这部分存储为110xxxxx 10xxxxxx
0800 - FFFF 这部分存储为1110xxxx 10xxxxxx 10xxxxxx
UTF-16是双字节存储,这就带来一个问题,即高低字节的顺序。两个字节有两种顺序,它们也用BOM来标明。分为大尾码和小尾码两种。大尾码的BOM是FEFF,小尾码的BOM是FFFE
参见:http://hi.baidu.com/wuhongbogood/item/74c7e133b8f359cd1a969617
分享到:
相关推荐
相比之下,GBK(Great Chinese - Byte Kotlin)是基于GB2312的扩展编码,主要用于简体中文环境。GBK包含了大部分常用汉字和一些符号,但不支持Unicode字符集中的所有字符,尤其是非中文字符。在某些老版本或特定的...
### GBK与UTF-8转码(C++) #### 知识点概述 本文将详细介绍如何在Microsoft Foundation Classes (MFC)环境下实现GBK与UTF-8之间的编码转换。该技术适用于那些需要处理不同字符集数据的应用程序开发场景,特别是在...
<br>请注意:UTF-8版本虽然具有良好的国际兼容性,但需要比GBK/BIG5版本多占用50%的数据库存储空间,因此并非推荐使用,仅供对国际兼容性有特殊要求的用户使用。 <br> <br>中国论坛网推荐" src=...
UTF-8是一种广泛使用的Unicode编码,而GBK是中国大陆常用的简体中文编码。`codecvt`是C++标准库中的一个组件,用于处理不同编码间的转换。本项目针对VS2010和2012两个版本的Visual Studio提供了UTF-8到GBK,以及GBK...
《深入理解Discuz! X2.5:GBK与UTF8编码解析》 Discuz! X2.5是一款深受广大网站管理员喜爱的社区论坛系统,它以其强大的...理解这两种编码的区别和应用场景,有助于我们更好地管理和运营基于Discuz! X2.5的社区论坛。
首先,GBK是GB2312编码的升级版,它是针对简体中文的一种字库编码,主要在中国大陆使用。GBK编码支持约20902个汉字,包含了大部分常用汉字。然而,GBK并不兼容Unicode,这意味着它无法直接处理其他语言的字符,如...
首先,我们需要理解UTF-8和GBK两种编码的区别。UTF-8是一种国际标准的多字节字符编码,可以表示Unicode字符集中的所有字符,广泛应用于互联网。GBK是中国大陆地区广泛使用的编码,它是GB2312的扩展,兼容大部分简体...
UTF-8 和 GBK 是两种广泛使用的字符编码标准,尤其在中国大陆,GBK 编码在传统系统和软件中较为常见,而 UTF-8 则是现代互联网的标准编码。本文将详细讲解 UTF-8 转 GBK 工具的工作原理、应用场景以及如何进行编码...
标题和描述中提到的"编码转换器 绿色版 gb2312 gbk utf-8 万能转换"是一个软件工具,它能够帮助用户将文本文件从一种编码格式转换到另一种,尤其是GB2312、GBK和UTF-8这三种常见的中文编码格式。 1. **编码系统**:...
### UTF-8、Unicode、GBK、GB2312 编码之间的区别和联系 #### 一、引言 在互联网技术中,字符编码是非常重要的基础概念之一。字符编码不仅决定了文本在网络上的传输效率,还直接影响到了不同国家和地区用户访问...
6. Readme_Big5.txt、Readme_GBK.txt、Readme_Eng.txt:这三个是不同编码的阅读文件,Big5是繁体中文编码,GBK是简体中文编码,Eng是英文版本的说明,它们提供了关于工具的更多信息。 在实际应用中,这类工具对于...
网页模板的字符编码是网页内容显示的关键因素,不同的编码标准如GBK和UTF-8会影响页面在不同环境下的显示效果。GBK是中国大陆广泛使用的简体中文字符集,它扩展了GB2312,包含了更多的汉字。而UTF-8是一种国际通用的...
标题中的“酒仙网简洁版UTF8和GBK”指的是针对酒仙网的某个简洁版本,分别使用了两种不同的字符编码标准:UTF-8和GBK。这两个编码标准在处理中文字符时有不同的方法,对于IT专业人士来说,理解它们的区别和应用场景...
- **GBK编码**:GBK是对GB2312的扩展,包含更多的汉字和其他字符,主要用于简体中文环境。 - **UTF8编码**:UTF8是一种Unicode编码,可以表示世界上几乎所有的字符,适合全球化的网站。UTF8编码的论坛更利于海外...
首先,我们来了解一下GBK和UTF8编码的区别。GBK是中文简体字库的一种编码方式,它是GB2312的扩展,兼容GB2312,同时包含了更多的汉字,主要在中国大陆使用。UTF8则是Unicode的一种实现方式,能够表示世界上几乎所有...
《中文编码转换器详解:Big5、GBK、Unicode与UTF8的互换之道》 在计算机世界里,字符编码是沟通人类语言与机器之间的重要桥梁。本文将详细讲解标题所提及的“中文 Big5/GBK/Unicode/UTF8 内码转换器”这一工具,...
GBK编码是中国大陆广泛采用的一种汉字编码标准,它是GB2312的扩展,包含了更多的汉字和其他字符,主要用于简体中文环境。 UTF-8编码是一种可变长度的Unicode编码,它可以表示世界上几乎所有的字符,包括ASCII字符、...
GBK全称为“Great Wall Code”或“GBK General Standard”,它是GB2312的扩展,包含了更多的汉字和符号,主要服务于简体中文环境。而UTF-8,全称“8-bit Unicode Transformation Format”,是一种用一到四个字节表示...
GBK是GB2312编码的扩展,主要用于简体中文,它包含了GB2312中的所有字符,并且增加了许多繁体字和其他字符,总共包含约20902个汉字。UTF-8是一种可变长度的Unicode编码,它可以表示全世界几乎所有的字符,包括汉字。...
在处理多语言编码时,GBK和UTF-8是常见的两种字符集,它们各有特点,适应不同的应用场景。本文将深入探讨基于PHP的UCenterHome在GBK和UTF-8编码下的源码实现。 首先,我们需要了解GBK和UTF-8的区别。GBK是GB2312的...