字符:就是人们使用的记号,抽象意义上的一个符号。
字节:计算机中存储数据的单元,一个8位的二进制数,是一个很具体的存储空间。
编码:字符转字节的过程。
解码:字节转字符的过程。
在java中的编码举例:
byte[] bytes = "test".getByte("iso-8859-1");
将"test"字符串按iso-8859-1编码成字节数组,即一个字符编码成一个字节,并且如果有字符不属于iso-8859-1字符集,则无法采用正确的字节来表示,会采用错误的字节来表示。其他编码类似处理。
该例的最终结果是把unicode字符转换成由iso-8859-1编码的字节数组。
在java中解码举例:
String test = new String(bytes,"iso-8859-1");
将bytes字节数组按iso-8859-1解码成字符串(由字符组成),即一个字节编码成一个字符,字符的具体内容就是对应的字节在iso-8859-1字符集中的表示。其他编码类似处理
该例的最终结果是把字节数组按iso-8859-1解码转换成unicode字符,要不出现乱码,则必须bytes是由iso-8859-1编码的。
当我们要把一个“字节串”转化成“字符串”,而又不知道它是哪一种 ANSI 编码时,先暂时地把“每一个字节”作为“一个字符”进行转化,不会造成信息丢失。然后再使用 bytes = string.getBytes("iso-8859-1") 的方法可恢复到原始的字节串。
分享到:
评论