`
lt200819
  • 浏览: 188184 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

GBK简体中文版和UTF8简体中文版有什么区别?

 
阅读更多

GBK简体中文版和UTF8简体中文版有什么区别?
ASCII(ISO-8859-1)是鼻祖,最简单的方式,字节高位为0
GB2312、GBK、GB18030,这几个是中文编码方式,并向下兼容。GB2312包含7000多个汉字和字符,GBK包含21000多个,GB18030更厉害,到了27000多个。他们都是用2个字节来表示一个汉字。跟ascii是怎么区分的呢?如果高字节的高位为1(也就是高字节大于127),就表示是汉字,低字节并无明显特征。

Unicode是统一编码,它建立了一个全世界统一的码表。世界上的所有文字,在这张码表中都是唯一的。

UTF-8是Unicode的一种存储、传输方式。它将整个Unicode码表分为3部分。
0000 - 007F 这部分是最初的ascii部分,按原始的存储方式,即0xxxxxxx。
0080 - 07FF 这部分存储为110xxxxx 10xxxxxx
0800 - FFFF 这部分存储为1110xxxx 10xxxxxx 10xxxxxx

UTF-16是双字节存储,这就带来一个问题,即高低字节的顺序。两个字节有两种顺序,它们也用BOM来标明。分为大尾码和小尾码两种。大尾码的BOM是FEFF,小尾码的BOM是FFFE

参见:http://hi.baidu.com/wuhongbogood/item/74c7e133b8f359cd1a969617

分享到:
评论

相关推荐

    labview utf8toGBK

    相比之下,GBK(Great Chinese - Byte Kotlin)是基于GB2312的扩展编码,主要用于简体中文环境。GBK包含了大部分常用汉字和一些符号,但不支持Unicode字符集中的所有字符,尤其是非中文字符。在某些老版本或特定的...

    GBK与UTF-8转码(C++)

    ### GBK与UTF-8转码(C++) #### 知识点概述 本文将详细介绍如何在Microsoft Foundation Classes (MFC)环境下实现GBK与UTF-8之间的编码转换。该技术适用于那些需要处理不同字符集数据的应用程序开发场景,特别是在...

    Discuz! 4.0.0 Build 20051212 GBK简体中文版(推荐)

    <br>请注意:UTF-8版本虽然具有良好的国际兼容性,但需要比GBK/BIG5版本多占用50%的数据库存储空间,因此并非推荐使用,仅供对国际兼容性有特殊要求的用户使用。 <br> <br>中国论坛网推荐" src=...

    c++ utf-8转gbk

    UTF-8是一种广泛使用的Unicode编码,而GBK是中国大陆常用的简体中文编码。`codecvt`是C++标准库中的一个组件,用于处理不同编码间的转换。本项目针对VS2010和2012两个版本的Visual Studio提供了UTF-8到GBK,以及GBK...

    Discuz_X2.5 GBK和UTF8版本都有

    《深入理解Discuz! X2.5:GBK与UTF8编码解析》 Discuz! X2.5是一款深受广大网站管理员喜爱的社区论坛系统,它以其强大的...理解这两种编码的区别和应用场景,有助于我们更好地管理和运营基于Discuz! X2.5的社区论坛。

    gbk转Utf8_编码转换_firegbi_GBK转UTF-8_

    首先,GBK是GB2312编码的升级版,它是针对简体中文的一种字库编码,主要在中国大陆使用。GBK编码支持约20902个汉字,包含了大部分常用汉字。然而,GBK并不兼容Unicode,这意味着它无法直接处理其他语言的字符,如...

    DiscuzX3.4UTF8转GBK后乱码解决方案

    首先,我们需要理解UTF-8和GBK两种编码的区别。UTF-8是一种国际标准的多字节字符编码,可以表示Unicode字符集中的所有字符,广泛应用于互联网。GBK是中国大陆地区广泛使用的编码,它是GB2312的扩展,兼容大部分简体...

    utf8转gbk工具

    UTF-8 和 GBK 是两种广泛使用的字符编码标准,尤其在中国大陆,GBK 编码在传统系统和软件中较为常见,而 UTF-8 则是现代互联网的标准编码。本文将详细讲解 UTF-8 转 GBK 工具的工作原理、应用场景以及如何进行编码...

    编码转换器 绿色版 gb2312 gbk utf-8

    标题和描述中提到的"编码转换器 绿色版 gb2312 gbk utf-8 万能转换"是一个软件工具,它能够帮助用户将文本文件从一种编码格式转换到另一种,尤其是GB2312、GBK和UTF-8这三种常见的中文编码格式。 1. **编码系统**:...

    UTF-8 Unicode GBK GB2312 编码之间的区别和联系

    ### UTF-8、Unicode、GBK、GB2312 编码之间的区别和联系 #### 一、引言 在互联网技术中,字符编码是非常重要的基础概念之一。字符编码不仅决定了文本在网络上的传输效率,还直接影响到了不同国家和地区用户访问...

    编码转换工具UTF8转GBK或者GBK转UTF8

    6. Readme_Big5.txt、Readme_GBK.txt、Readme_Eng.txt:这三个是不同编码的阅读文件,Big5是繁体中文编码,GBK是简体中文编码,Eng是英文版本的说明,它们提供了关于工具的更多信息。 在实际应用中,这类工具对于...

    gbk网页模板转utf-8的绿色小工具

    网页模板的字符编码是网页内容显示的关键因素,不同的编码标准如GBK和UTF-8会影响页面在不同环境下的显示效果。GBK是中国大陆广泛使用的简体中文字符集,它扩展了GB2312,包含了更多的汉字。而UTF-8是一种国际通用的...

    酒仙网简洁版UTF8和GBK

    标题中的“酒仙网简洁版UTF8和GBK”指的是针对酒仙网的某个简洁版本,分别使用了两种不同的字符编码标准:UTF-8和GBK。这两个编码标准在处理中文字符时有不同的方法,对于IT专业人士来说,理解它们的区别和应用场景...

    Discuz!X3模板 迪恩MOTO模特艺人摄影 商业版 GBK+UTF8 DZ社区论坛.rar

    - **GBK编码**:GBK是对GB2312的扩展,包含更多的汉字和其他字符,主要用于简体中文环境。 - **UTF8编码**:UTF8是一种Unicode编码,可以表示世界上几乎所有的字符,适合全球化的网站。UTF8编码的论坛更利于海外...

    discuz模板:迪恩游戏Time风 商业版GBK UTF8.zip

    首先,我们来了解一下GBK和UTF8编码的区别。GBK是中文简体字库的一种编码方式,它是GB2312的扩展,兼容GB2312,同时包含了更多的汉字,主要在中国大陆使用。UTF8则是Unicode的一种实现方式,能够表示世界上几乎所有...

    gbk_utf8编码转化工具

    GBK编码是中国大陆广泛采用的一种汉字编码标准,它是GB2312的扩展,包含了更多的汉字和其他字符,主要用于简体中文环境。 UTF-8编码是一种可变长度的Unicode编码,它可以表示世界上几乎所有的字符,包括ASCII字符、...

    GBK转UTF_8

    GBK全称为“Great Wall Code”或“GBK General Standard”,它是GB2312的扩展,包含了更多的汉字和符号,主要服务于简体中文环境。而UTF-8,全称“8-bit Unicode Transformation Format”,是一种用一到四个字节表示...

    JEECMS 3.04 模版标签字符 GBK UTF8对照

    GBK是GB2312编码的扩展,主要用于简体中文,它包含了GB2312中的所有字符,并且增加了许多繁体字和其他字符,总共包含约20902个汉字。UTF-8是一种可变长度的Unicode编码,它可以表示全世界几乎所有的字符,包括汉字。...

    基于PHP的UCenterHome简体GBK与utf8源码.zip

    在处理多语言编码时,GBK和UTF-8是常见的两种字符集,它们各有特点,适应不同的应用场景。本文将深入探讨基于PHP的UCenterHome在GBK和UTF-8编码下的源码实现。 首先,我们需要了解GBK和UTF-8的区别。GBK是GB2312的...

    GBK\UTF8互转格式插件 for discuz 7.0.rar

    7.0论坛系统设计的插件,它的主要功能是帮助用户在GBK编码和UTF-8编码之间进行转换。Discuz! 是一款广泛应用的开源社区论坛软件,而GBK和UTF-8是两种常见的字符编码方式。 GBK编码,全称“汉字内码扩展规范”,是...

Global site tag (gtag.js) - Google Analytics