很好的参考:
http://sunfish.blog.51cto.com/417500/142577/
编码解码分析(仅是乱码的一种情况):
中文的utf-8编码是 每个中文用三个字节来编码,比如下面例子生成6个字节:
c1:
"亢磊".getBytes("utf-8")
(byte[]) [-28, -70, -94, -25, -93, -118]
c2:
"亢磊".getBytes("iso-8859-1")//63 对应的iso-8859-1表查询是'?',(为什么有时候我们的中文传递过程中变成? ?)
(byte[]) [63, 63]
c1,c2是编码过程,再把c1,c2的字节序列按照iso-8859-1解码,我们可以从
这里http://en.wikipedia.org/wiki/ISO_8859-1查结果
c3:
new String("亢磊".getBytes("utf-8"),"iso-8859-1")//每个字节对应iso-8859-1对照表中的一个字符,所以结果为6个字符。(经常看到的乱码?)
(java.lang.String) 亢ç£
结果:“
亢磔是六个字节,byte数值-十六进制-iso-8859-1符号对应关系分别是:
byte数值-十六进制-iso-8859-1符号
byte数值 | 十六进制 | iso-8859-1符号 | iso-8859-1 |
-28 | e4 | ä | |
-70 | ba | º | |
-94 | a2 | ¢ | |
-25 | e7 | ç | |
-93 | a3 | £ | |
-118 | 8a | | |
分享到:
相关推荐
GB2312编码与utf-8编码的字符串的转换,主要使用windows api函数MultiByteToWideChar和WideCharToMultiByte,代码简洁,经测试可用
转换“pb12 gb转utf-8”意味着你可能有一个使用PowerBuilder 12编写的程序或数据库,其中的数据是以GBK编码存储的,现在需要将这些数据转换为UTF-8编码以便在更广泛的环境中使用或与其他系统进行兼容。 这个过程...
转换过程包括读取UTF-8编码的字符串,然后根据GBK编码规则重新排列字节,以生成GBK编码的字符串。这个过程中需要注意字节顺序和多字节字符的处理,以确保转换的准确性。 LabVIEW编程环境中,可以创建自定义VI(虚拟...
在VB6.0编程环境中,有时我们需要处理不同字符编码之间的转换,例如将UTF-8编码的字符串转换为GB2312编码。UTF-8是一种广泛使用的Unicode编码,而GB2312是中国大陆常用的简体中文字符集,主要用于早期的计算机系统。...
这个压缩包可能包含了源代码文件,使得用户可以方便地将UTF-8编码的文本转换为GB2312编码,或者相反。 UTF-8是一种广泛使用的Unicode编码方案,它能够表示世界上几乎所有的字符,包括汉字。UTF-8的一个优点是它对...
随着国际化的推进和技术的发展,现代计算机系统广泛采用了Unicode编码标准,如UTF-8、UTF-16等。这些编码标准不仅包含了GB2312中的所有字符,还支持更多的语言和字符集,从而更好地满足了全球化的需求。 #### 七、...
在提供的压缩包文件“批量文件转码工具”中,我们可以期待找到一个能够帮助我们方便快捷地处理GBK和UTF-8编码转换问题的实用工具。这个工具可能包括了选择文件、设置目标编码、开始转换等一系列功能,并且已经有人...
它提供了一个功能,将UTF-8编码的字符串转换为GBK编码,确保在GBK环境下正确显示。 这个VI可能包含以下组成部分: 1. 输入部分:接收UTF-8编码的字符串或数据。 2. 转换函数:内部实现UTF-8到GBK的转换算法,这通常...
3. **页面`<meta>`标签**: 确保页面中的`<meta>`标签也正确地声明了utf-8编码。例如: ```html <meta charset="utf-8"> ``` 4. **测试**: 在完成上述配置后,重新测试页面在不同浏览器中的表现,以确认问题是否...
然而,在某些情况下,如服务器环境或与其他UTF-8编码的系统交互时,GBK编码可能会遇到问题,此时就需要进行编码转换。 "Discuz_X3.1_SC_GBK源码"是Discuz! X3.1的GBK编码版源代码,它包含了论坛的主要功能模块,如...
将UTF-8编码的文本转换为GB2312编码,需要通过中间步骤,通常是先将UTF-8解码为Unicode,然后再从Unicode编码到GB2312。这一过程可以使用Windows API函数`WideCharToMultiByte`来实现,其中参数`CodePage`设置为GB...
GBK是GB2312编码的扩展,包含了更多的汉字,但在处理多语言或者需要与国际标准兼容时,UTF-8编码更为通用。在Java或类似的编程环境中,处理GBK到UTF-8的转换通常需要以下步骤: 1. **读取GBK编码的源文件**: 当...
通过这个插件,DedeCMS用户可以提升网站的客户服务质量和效率,无论访客使用的是GBK编码还是UTF-8编码的浏览器,都能确保顺畅的交流体验。同时,考虑到不同用户的需求,提供两种编码版本也显示出开发者对兼容性的...
5. **测试**:打开一个包含中文注释的UTF-8编码文件,检查是否能正常显示。如果一切顺利,中文注释应该不再出现乱码。 6. **注意事项**:有些补丁可能需要配合特定版本的Source Insight使用,因此在应用前要确认...
"GBK/UTF-8/BIG5文件互相转换器[支持批量]"这个工具正是为了解决这个问题而设计的,它能够帮助用户方便地在UTF-8、GBK和BIG5这三种常见的中文编码格式之间进行转换,尤其对于处理大量文本文件的场景,批量转换功能...
如果数据库原本是UTF-8编码,强行转换为GBK会导致乱码。检查数据库的字符集设置,确保其与论坛配置一致。 3. **手动转码**:资源中包含“手工UTF8转GBK文件”,这些可能是关键的模板文件或配置文件,已经被转换成...
-----MySQL 字符集: UTF-8 Unicode (utf8) -----> 2)建表时候一切默认;至于导入*.SQL没试应该是不用动什么<!-----MySQL 字符集: UTF-8 Unicode (utf8) -----> 3)在 php 文件头部加入 <meta http-equiv="Content-...
libiconv是一个广泛使用的字符编码转换库,它支持多种编码格式,包括ASCII、ISO-8859系列、Unicode(如UTF-8)以及中国的GBK、GB2312等。 首先,让我们深入理解libiconv的基本概念。libiconv提供了一套API接口,...
转换码表是用来进行不同编码间转换的关键工具,例如,如果你有一个使用GB18030编码的文本文件,而你的系统或程序只支持Unicode,那么就需要一个转换码表来将GB18030编码的文本转换成UTF-8或其他Unicode编码。...
标题"Utf8转GB2312"指出,这个工具或程序用于将UTF-8编码的文件转换为GBK或GB2312编码。FileEncodingTransform.exe可能是这个转换工具的执行文件,用户通过运行这个程序来实现编码转换。而FileEncodingTransform....