`
chenming47
  • 浏览: 94878 次
  • 性别: Icon_minigender_1
  • 来自: 厦门
社区版块
存档分类
最新评论

字符与字节、编码与解码

 
阅读更多

字符:就是人们使用的记号,抽象意义上的一个符号。

 

字节:计算机中存储数据的单元,一个8位的二进制数,是一个很具体的存储空间。

 

编码:字符转字节的过程。

 

解码:字节转字符的过程。

 

在java中的编码举例:

byte[] bytes = "test".getByte("iso-8859-1");

将"test"字符串按iso-8859-1编码成字节数组,即一个字符编码成一个字节,并且如果有字符不属于iso-8859-1字符集,则无法采用正确的字节来表示,会采用错误的字节来表示。其他编码类似处理。

该例的最终结果是把unicode字符转换成由iso-8859-1编码的字节数组。

 

在java中解码举例:

String test = new String(bytes,"iso-8859-1");

将bytes字节数组按iso-8859-1解码成字符串(由字符组成),即一个字节编码成一个字符,字符的具体内容就是对应的字节在iso-8859-1字符集中的表示。其他编码类似处理

该例的最终结果是把字节数组按iso-8859-1解码转换成unicode字符,要不出现乱码,则必须bytes是由iso-8859-1编码的。

 

当我们要把一个“字节串”转化成“字符串”,而又不知道它是哪一种 ANSI 编码时,先暂时地把“每一个字节”作为“一个字符”进行转化,不会造成信息丢失。然后再使用 bytes = string.getBytes("iso-8859-1") 的方法可恢复到原始的字节串。

分享到:
评论
Global site tag (gtag.js) - Google Analytics