`
southforest
  • 浏览: 22626 次
  • 性别: Icon_minigender_1
  • 来自: 福州
文章分类
社区版块
存档分类
最新评论
阅读更多
mysql 中,为了显示中文,采用了函数:convert(col using gb2312)
大多数中文都正常,但是如果col值中含有琯字,则转换出来就是无内容串。
改为convert(col using gbk) 就可以正常了。(不支持gb18030)


GB2312-80仅收汉字6763个,这大大少于现有汉字,随着时间推移及汉字文化的不断延伸推广,有些原来很少用的字,现在变成了常用字,例如:朱镕基的“镕”字,未收入GB2312-80,现在大陆的报业出刊只得使用(金+容)、(金容)、(左金右容)等来表示,形式不一而同,这使得表示、存储、输入、处理都非常不方便,对于搜索引擎等软件的构造来说也不是好消息,而且这种表示没有统一标准。从我们对人民日报98年数据的处理过程中,得出这样的经验:回填外字最困难的就是如何得到这种表示方法的集合。

为了解决这些问题,以及配合UNICODE的实施,全国信息技术化技术委员会于1995年12月1日《汉字内码扩展规范》。GBK向下与GB2312 完全兼容,向上支持ISO 10646国际标准,在前者向后者过渡过程中起到的承上启下的作用。GBK 亦采用双字节表示,总体编码范围为8140-FEFE之间,首字节在81-FE之间,尾字节在40-FE之间,剔除XX7F一条线。

GBK共收入21886个汉字和图形符号,包括:

* GB2312中的全部汉字、非汉字符号。
* BIG5中的全部汉字。
* 与ISO 10646相应的国家标准GB13000中的其它CJK汉字,以上合计20902个汉字。
* 其它汉字、部首、符号,共计984个。

微软公司自Windows 95 简体中文版开始支持GBK代码,但目前的多数搜索引擎都不能很好地支持GBK汉字。

GBK编码区分三部分:

* 汉字区 包括
GBK/2:OXBOA1-F7FE, 收录GB2312汉字6763个,按原序排列;
GBK/3:OX8140-AOFE,收录CJK汉字6080个;
GBK/4:OXAA40-FEAO,收录CJK汉字和增补的汉字8160个。
* 图形符号区 包括
GBK/1:OXA1A1-A9FE,除GB2312的符号外,还增补了其它符号
GBK/5:OXA840-A9AO,扩除非汉字区。
* 用户自定义区
即GBK区域中的空白区,用户可以自己定义字符。


3 GB18030

GB18030 是最新的汉字编码字符集国家标准, 向下兼容 GBK 和 GB2312 标准。 GB18030 编码是一二四字节变长编码。一字节部分从 0x0~0x7F 与 ASCII 编码兼容。 二字节部分, 首字节从 0x81~0xFE, 尾字节从 0x40~0x7E 以及 0x80~0xFE, 与 GBK标准基本兼容。 四字节部分, 第一字节从 0x81~0xFE, 第二字节从 0x30~0x39, 第三和第四字节的范围和前两个字节分别相同。 四字节部分覆盖了从 0x0080 开始, 除去二字节部分已经覆盖的所有 Unicode 3.1 码位。也就是说, GB18030 编码在码位空间上做到了与 Unicode 标准一一对应,这一点与 UTF-8 编码类似。

目前最新的 glibc 2.2.x 系列已经全面支持了 GB18030 Locale 和 GB18030 与 UCS-4 之间的编码转换, 也就是说在系统层上 Linux 已经可以支持 GB18030 标准了。 下面问题的关键就是怎样让 XFree86 窗口系统也支持 GB18030 标准。
分享到:
评论

相关推荐

    QQ非主流个性签名:90后的倔强.docx

    这篇文档主要围绕的是90后一代的个性特点,特别是他们所展现出来的“倔强”精神。倔强在这里被描绘为一种鲜明的个性特质,代表了90后在面对生活挑战时的态度和行为方式。 1. **倔强的独立性**:文档中的签名反映出...

    倔强的小红军5555.pptx

    这篇名为“倔强的小红军5555.pptx”的内容描绘了一个感人至深的故事,讲述了红军长征时期一个小红军战士的坚韧与牺牲精神。故事发生在艰难的行军过程中,小红军尽管饥饿疲劳,却仍然坚定地向前行进,展现了红军战士...

    袁姗姗《倔强》歌词.doc

    虽然提供的文件标题和描述是关于袁姗姗演唱的歌曲《倔强》的歌词,但内容实际展示了三首不同的《倔强》歌词版本,其中两首属于五月天的歌曲。这里我们将聚焦于歌曲中传达的核心思想和可能关联的音乐知识。 1. **...

    吉林省长春市实验初中语文 生命的倔强学生作文素材.doc

    在吉林省长春市实验初中语文的作文教学中,教师们致力于引导学生深刻理解生命的丰富内涵,体会生命的倔强与不屈。这一教学目标体现在《生命的倔强》这一作文素材中,该素材通过具体的生命历程,展现了生命在逆境中的...

    倔强的Linux.pdf

    倔强的Linux.pdf

    愚蠢而倔强的焦仲卿

    愚蠢而倔强的焦仲卿

    小学语文反义词倔强的反义词

    其中,“倔强”作为一个常用的形容词,其反义词的掌握对于学生来说是必不可少的。 “倔强”这个词语,通常用来描绘一个人性格上的特点,意味着顽强不屈、固执己见,不愿意轻易妥协或改变自己的立场。在不同的语境中...

    倔强的小红军.ppt

    倔强的小红军.ppt

    倔强的小红军2.ppt

    倔强的小红军2.ppt

    25倔强的小红军.docx

    25倔强的小红军.docx

    朱彩《倔强的小红军》教学设计.doc

    在《倔强的小红军》一文中,我们通过历史的镜头回望那段硝烟弥漫的岁月,一群稚嫩的红军战士在艰苦卓绝的长征路上,用稚嫩的肩膀肩负着革命的使命。小红军的形象,通过朱彩先生的笔触变得栩栩如生,成为了学生学习的...

    四年级语文下册_倔强的小红军_2课件_鄂教版.ppt

    这篇文档是针对小学四年级语文课程的一份课件,主题为《倔强的小红军》,讲述了长征时期一个小红军战士的故事。课件中包含了几个关键知识点,旨在帮助学生理解文本,体会人物心理,并通过阅读和讨论深化对历史背景和...

    《倔强小红军》.ppt

    这篇语文教材内容讲述的是《倔强的小红军》的故事,它主要展现了红军长征时期一个小红军战士的坚韧不屈和自我牺牲精神。故事发生在中国鄂教版四年级下册第四单元,由阳逻四小的杨成林老师讲解。通过课文的学习,我们...

    小学英语英语故事童话故事ThoseStubbornSoulstheBiellese倔强的彼埃拉人

    《那些固执的灵魂:彼埃拉人》是一个富有教育意义的英语故事,源自意大利民间传说,作者是Virginia Majoli Faccio。这个故事通过一位固执的农民与上帝的互动,传达了对信仰和谦逊的理解。 故事讲述了一个勇敢但固执...

    教学必备教科版三年级语文上册7倔强的贝多芬课件系列PPT学习教案.pptx

    在我们精心编排的语文课件中,《倔强的贝多芬》这篇课文不仅是对音乐大师路德维希·范·贝多芬一生的片段回顾,也是对学生进行情感教育与语言文字学习的良机。这篇课件系列PPT学习教案,是针对教科版三年级语文上册...

    《倔强的小红军》课件(语文S版四年级语文上册课件).ppt

    《倔强的小红军》这篇课文是中国语文S版四年级上册的一篇课件,主要讲述了在举世闻名的二万五千里长征中,一个小红军战士的故事。这个故事展现了红军战士们坚韧不拔、舍己为人的精神风貌,同时也教育我们要理解和...

    《倔强的小红军》课件.ppt

    《倔强的小红军》课件.ppt

    四年级语文下册 倔强的小红军教案 鄂教版.doc

    《倔强的小红军》这篇课文是针对小学四年级学生的一篇语文教学材料,属于鄂教版语文下册的内容。文章讲述了在二万五千里长征中,一个小红军因倔强地不愿拖累他人,最终牺牲的故事,以此教育孩子们学习小红军坚强勇敢...

    教科三年级上册倔强的贝多芬PPT学习教案.pptx

    这篇PPT学习教案主要围绕教科书三年级上册的一个主题——倔强的贝多芬展开,旨在介绍世界著名音乐家贝多芬的人物性格和他对音乐的执着追求。教案通过一系列问题引导学生理解贝多芬的人格特质和他与贵族社会的关系。 ...

    欧洲区块链发展研究报告:欧罗巴的倔强(18页).zip

    欧洲区块链发展研究报告:欧罗巴的倔强(18页),资源名称:欧洲区块链发展研究报告:欧罗巴的倔强(18页)欧洲区块链行业发展研究-欧罗巴的倔强.zip...

Global site tag (gtag.js) - Google Analytics