1,GBK编码兼容GB2312. 详细点的信息是: GB码,全称是GB2312-80,GB码共收录6763个简体汉字、682个符号。 GBK编码是中国大陆制订的、等同于UCS的新的中文编码扩展国家标准。GBK工作小组于1995年10月,同年12月完成GBK规范。该编码标准兼容GB2312,共收录汉字21003个、符号883个,并提供1894个造字码位,简、繁体字融于一库。 GBK的文字编码是双字节来表示的,即不论中、英文字符均使用双字节来表示,只不过为区分中文,将其最高位都定成1。 2,UTF-8对中文用3个字节,英文用1个字节 UTF-8编码则是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。对于英文字符较多的论坛则用UTF-8节省空间。 3,所以,如果英文较多的论坛,用UTF-8较合算;中文较多的话,不考虑国际兼容性的话,用GBK编码较合算,但不知道是英文等其他语言的浏览器能否解析GBK编码的网页呢? |
发表评论
-
从数据库结果集查找树的根节点
2009-08-14 11:26 1595由于在查询出的每条记录里,都有unit_id和par_unit ... -
获取当前应用的相对路径
2009-08-07 13:56 1302public String getApplicatio ... -
Quartz + Spring 实现定时任务配置2
2009-08-06 14:12 876<beans> <!-- 定时服务定义 -- ... -
Quartz + Spring 实现定时任务配置1
2009-08-06 12:02 1016<beans> <!-- 任务调度对象 -- ... -
tomcat组件分解
2009-06-10 13:38 947<!-- tomcat顶层容器 ... -
Commons Logging 的使用方法
2009-06-10 10:13 2070应用程序中使用好日志 ... -
RuntimeException和非RuntimeException
2009-04-25 11:24 1682在java的异常类体系中,Error和RuntimeExcep ... -
Web开发中字符编码的处理
2009-01-14 10:40 775一、概要 在JAVA应用程序特别是基于WEB的程序中,经常遇 ... -
使用Spring、Hibernate、Struts的一些错误总结
2009-01-14 10:24 1051使用Spring、Hibernate、St ... -
Hibernate 体系结构与工作原理
2009-01-14 10:14 833... -
Servlet中listener的应用
2009-01-14 10:03 764由于工作需要,最近在找一些解决方案,发现Listener是一个 ... -
(引用)JVM调优总结 -Xms -Xmx -Xmn -Xss
2009-01-14 09:49 853三、常见配置举例 堆大小设置JVM 中最大堆大小有三方 ... -
关键字: 显示 Hibernate SQL 语句中 ? 的值
2009-01-14 09:35 882Java代码 <?xml v ... -
Apache开源项目分类列表
2009-01-14 09:13 1079查看文章 ... -
使用import简化spring的配置文件
2009-01-14 08:49 882在多个人做同一 ... -
jsp输出js特殊字符替换
2009-01-12 17:23 2336运行: "\n\twomen'".repl ... -
java内存分配研究
2009-01-04 11:12 1047java内存分配研究 今天看了一下java的内存分配,分享 ...
相关推荐
### UTF-8、Unicode、GBK、GB2312 编码之间的区别和联系 #### 一、引言 在互联网技术中,字符编码是非常重要的基础概念之一。字符编码不仅决定了文本在网络上的传输效率,还直接影响到了不同国家和地区用户访问...
UTF-8是最广泛使用的编码格式,它使用8位字节,并根据字符的不同范围使用1至4个字节进行编码。UTF-8的一个显著优点是与CPU字节顺序无关,具有良好的平台兼容性和错误容错能力。UTF-16则是16位的编码,与Unicode的...
在VB6.0编程环境中,有时我们需要处理不同字符编码之间的转换,例如将UTF-8编码的字符串转换为GB2312编码。UTF-8是一种广泛使用的Unicode编码,而GB2312是中国大陆常用的简体中文字符集,主要用于早期的计算机系统。...
为了在无库的情况下实现这个转换,开发者需要对字符编码有深入的理解,包括UTF-8和GBK的编码规则,以及Unicode码点到GBK码点的映射关系。这种映射通常可以通过查找预先生成的映射表或者实现算法来完成。由于GBK是单...
标题中的“GBK_pinyin_table.rar”表明这是一个关于GBK编码的拼音资源文件,而“GBK_gbk_utf-8_gbk_to_pinyin_pinyi”则暗示了这个资源涉及到GBK编码、UTF-8编码以及汉字到拼音的转换。描述中提到这是“GBK拼音字表...
本主题聚焦于“UTF-8编码转GBK编码”,这是一个常见的需求,特别是在嵌入式系统如单片机中,由于资源限制,可能需要将UTF-8编码的字符串转换为GBK编码以便正确显示中文字符。 首先,我们要理解UTF-8和GBK这两种编码...
4. **存储空间**:由于UTF-8的可变长度,对于纯英文或包含少量中文的文本,UTF-8可能会比GBK占用更多空间,反之则可能更少。 5. **处理难度**:GBK处理起来相对简单,而UTF-8由于字节顺序和字节数量的变化,处理起来...
在IT行业中,字符编码是处理文本数据的基础,GBK、Unicode和UTF-8是三种常见的字符编码格式,它们各自有特定的使用场景和特点。本文将详细介绍这三种编码方式,并提供C语言实现它们之间转换的函数。 GBK编码是中国...
标题和描述中提到的"转换为GB2312.bat转换为UTF8.bat"暗示了这是一个批处理(batch script)文件,用于在两种不同的字符编码之间进行转换:GBK(GB2312)和UTF-8。GBK是中国大陆广泛使用的简体中文编码标准,而UTF-8...
首先,需要识别出 UTF-8 字节序列中的每个字符,然后根据 UTF-8 到 GB2312 的映射关系还原出对应的 GB2312 字符。这个过程同样涉及到解码和位操作。 5. **在线工具实现** - 在线工具通常包含一个输入框让用户输入...
在实际应用中,由于历史原因,某些系统或软件可能只支持GB18030编码,因此需要将Unicode(通常以UTF-8形式存在)转换为GB18030。这个转换过程通常包括两个步骤:UTF-8到Unicode,然后Unicode到GB18030。 **1. UTF-8...
本文将深入探讨C语言中GBK、Unicode和UTF-8之间的转换,并提供相关的转码表和接口函数。 首先,让我们了解一下这三种编码标准: 1. **GBK编码**:GBK是中国大陆广泛使用的汉字编码标准,它是GB2312的扩展,兼容GB...
1. **字符编码理解**:首先,我们需要了解各种字符编码的区别,如GBK、BIG5、GB2312等,以及它们与UTF-8之间的关系。GBK是在GB2312基础上扩展的,包含了更多的汉字,而BIG5则主要用于繁体中文。在转换过程中,我们...
GBK编码是中国大陆使用的一种汉字编码标准,它是GB2312的扩展,包含更多的汉字和符号,但它是单字节编码,对于非ASCII字符,GBK不能直接与UTF-8或Unicode相兼容。 描述中提到的问题是,云端的数据以Unicode编码...
常见的字符编码有ASCII、GBK(GB2312的扩展)、UTF-8、BIG5等。其中,GB2312是中国大陆广泛使用的简体中文字符集,UTF-8是一种可伸缩的Unicode编码方式,支持全球多种语言,而BIG5则主要用于繁体中文环境。 《字符...
本文将针对标题中的几种常见编码格式(GBK、ISO 8859-1、UTF-8)以及如何解决由这些编码方式引发的乱码问题进行深入探讨。 #### 一、编码概述 1. **GBK编码**:GBK是GB2312标准的扩展,支持简体中文,是Microsoft ...
### GB2312编码表知识点详解 #### 一、GB2312编码概述 GB2312是中华人民共和国国家标准《信息交换用汉字编码字符集·...然而,随着技术的进步和需求的变化,GB2312逐渐被更先进的编码标准所取代,如GBK、UTF-8等。
MySQL是一种广泛使用的开源关系型数据库管理系统,其支持多种字符编码,包括GBK、UTF-8等。在处理中文数据时,不正确的字符编码设置可能导致中文乱码问题。解决这个问题通常涉及对MySQL服务器、数据库、表以及连接的...
例如,UTF-8编码的字节顺序标记(BOM)在GB2312中不存在,转换时需要处理。 实际应用中,开发者可能需要这些头文件来处理不同编码间的字符串交互,如网络传输、文件读写或数据库存储。理解Unicode和GB2312的差异,...