`

GB18030和GB2312

阅读更多

IPHONE上,发现我们的游戏在添加好友时,如果对方使用的是繁体字,则添加失败,提示“名字为空”。后来跟踪了下,发现是我们在把汉字转化成UTF8时,使用的是GB2312,因此转化失败~ 后面改成GB18030,问题解决~~

 

     主要原因是GB2312支持的汉字太少。。。。

 

      因此大概的查找了下关于GB2312和GB18030的资料,分享:

 

早期的计算机使用7位的ASCII编码,为了处理汉字,程序员设计了用于简体中文的GB2312和用 于繁体中文的big5。GB2312(1980年)一共收录了7445个字符,包括6763个汉字和682个其它符号。汉字区的内码范围高字节从B0- F7,低字节从A1-FE,占用的码位是72*94=6768。其中有5个空位是D7FA-D7FE。

 

GB2312支持的汉字太少。

1995年的汉字扩展规范GBK1.0收录了21886个符号,它分为汉字区和图形符号区。汉字区包括21003个字符。

 

2000年的GB18030是取代GBK1.0的正式国家标准。该标准收录了27484个汉字,同时还收录了藏文、蒙文、维吾尔文等主要的少数民族文字。

 

现在的PC平台必须支持GB18030,对嵌入式产品暂不作要求。

所以手机、MP3一般只支持GB2312。从ASCII、GB2312、GBK到GB18030,这 些编码方法是向下兼容的,即同一个字符在这些方案中总是有相同的编码,后面的标准支持更多的字符。在这些编码中,英文和中文可以统一地处理。区分中文编码 的方法是高字节的最高位不为0。按照程序员的称呼,GB2312、GBK到GB18030都属于双字节字符集 (DBCS)。

分享到:
评论

相关推荐

    unicode与GB18030(GB2312,GBK) 转换码表

    GB18030是中国国家标准的字符编码,它是GB2312和GBK的升级版,进一步扩展了汉字的覆盖范围。GB18030包含了27484个汉字,涵盖了中国大陆的大部分常用汉字,同时支持部分繁体字和其他少数民族的文字。它采用双字节和...

    WINDOWS GB18030支持补丁

    GB18030是一种汉字编码标准,全称为“信息技术—多文种字符集—GB18030—2000”,是中国国家标准,也是对GB2312和GBK编码的扩展。GB18030编码系统在1995年的GB2312基础上增加了大量的汉字,同时包含了一些其他语言的...

    汉字字符编码 区位码 GB2312 GB18030-2005及Unicode 8.0字符集

    GB18030-2005是在GB2312的基础上扩展的编码标准,它增强了对汉字和其他中文字符的支持,特别是增加了对少数民族文字和繁体字的编码。GB18030采用变长编码,既能兼容GB2312,又新增了大量字符,包括约27,533个汉字和...

    GB18030编码研究以及GBK,GB2312,GB18030与Unicode的映射,乱码解决

    - **编码演变**:从GB2312到GBK再到GB18030,可以看出汉字编码标准随着技术进步和社会需求的发展不断扩展和完善。GB18030作为最新且最全面的标准,不仅支持了大量的汉字和图形符号,还考虑了与国际标准Unicode的兼容...

    gb18030与unicode的映射表

    GB18030,全称是《信息技术 中文编码扩展规范》,是中国国家标准,旨在扩大GB2312和GBK编码的覆盖范围,以支持更多的汉字和其他中文字符。GB18030编码标准包含了大约27,500多个汉字,包括简体和繁体,以及一些少数...

    gb18030所有字符集与码表.rar

    对于GB2312中的基本区和扩展区的字符,GB18030保持了与GBK相同的双字节编码;对于新增的大量汉字,GB18030引入了四字节编码,通过四个字节来表示一个字符,这使得它能够表示更多的字符。 3. 码表结构 码表是GB18030...

    GB18030汉字全表

    GB18030不仅涵盖了GB2312、GBK等早期汉字编码标准中的所有字符,还增加了大量的少数民族文字、古代汉字以及繁体字,极大地扩展了汉字编码的范围。 #### 标准特点与应用领域 GB18030的特点在于其全面性和兼容性,...

    GB18030-2005标准文字库支持

    国家标准GB18030-2000《信息交换用汉字编码字符集基本集的扩充》是我国继GB2312-1980和GB13000-1993之后最重要的汉字编码标准,是我国计算机系统必须遵循的基础性标准之一。 目前,GB18030有两个版本:GB18030-2000...

    GB18030字符集输出

    7. **兼容性**:GB18030与GB2312和GBK兼容,意味着在GB18030环境下处理GB2312或GBK的文本不会丢失信息,但反过来则可能丢失部分字符。 综上所述,GB18030字符集是中文信息处理领域的重要标准,其丰富的字符集和兼容...

    GB18030Tools

    它包含了GB2312、GBK以及大量其他语言的字符,特别是扩大了对汉字的支持,可表示超过27500个汉字,相比GB2312和GBK有更大的覆盖率。 Unicode,又称为统一码或万国码,是一种国际标准,旨在为世界上所有语言提供一个...

    GB18030实现工具

    GB18030与GBK和GB2312相比,覆盖了更广泛的汉字范围,特别是在少数民族文字和古汉语字符方面的支持更为全面。 54936是GB18030在Windows操作系统中的代码页标识。代码页是一个系统内部使用的数字代码,用于表示特定...

    GB2312简体中文编码表

    例如,GBK编码是在GB2312的基础上增加了更多的汉字和符号,而GB18030又进一步扩展了GBK,包含了更多的汉字及少数民族文字。因此,GB2312可以看作是这些编码的一个子集。 在实际应用中,如果系统支持GBK或GB18030...

    gb18030的汉字编码,Unicode汉字编码表

    "Unicode汉字编码表.txt"和"gb18030的汉字编码.xls"则提供了Unicode和GB18030编码的对照,便于进行编码转换。 了解并熟练运用这些编码标准,不仅可以解决编程中的字符集问题,还可以确保你的软件在全球范围内正确...

    gb18030汉字编码

    GB18030编码是在GBK编码的基础上进一步扩展的,GBK编码又是在GB2312编码的升级版。GB2312编码于1980年发布,包含了6763个常用汉字,而GBK编码在1995年发布,扩展到了20902个汉字,增加了许多繁体字和少数民族文字。...

    GB2312、GB 13000、GBK、GB18030 介绍.doc

    GB2312、GB 13000、GBK、GB18030 的介绍 GB 2312 是一个简体中文字符集的中国国家标准,由中国国家标准总局发布于 1980 年,全称为《信息交换用汉字编码字符集基本集》,规定了 6763 个汉字和 682 个非汉字图形。GB...

    支持GB18030的扩展工具

    GB18030是中国国家标准的字符编码集,是GB2312和GBK的扩展。它支持包括简体中文、繁体中文,以及少数民族文字在内的多文种,同时能兼容国际标准的Unicode字符集。GB18030字符集能表示的字符数量远超GB2312和GBK,...

    字符编码转化、libiconv、gb18030

    libiconv是一个通用的字符转换库,由GNU项目开发,它提供了在不同字符编码间进行转换的功能,支持包括ASCII、UTF-8、UTF-16、GB2312、GBK、GB18030等多种编码。libiconv库的使用极大地简化了跨平台程序中的字符编码...

    GBK码表 GB18030码表 汉字编码

    GB18030是正式国家标准,是GBK或GB2312的超集。该标准收录了27484个汉字,同时还收录了藏文、蒙文、维吾尔文等主要的少数民族文字。 这里是一个Excle版本的码表,罗列出码元及对应的GBK编码和Unicode编码,是研究编码的...

Global site tag (gtag.js) - Google Analytics