`
wxq594808632
  • 浏览: 262826 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

两种转码方式的区别

    博客分类:
  • java
阅读更多

这是张孝祥老师的java就业培训视频教程里面的一道题目(有所变动):
编写下面的程序代码,分析和观察程序的运行结果:

import java.io.*;
public class TestCodeIO {
       public static void main(String[] args) throws Exception{
             InputStreamReader isr = new InputStreamReader(System.in,"iso8859-1");
             BufferedReader br = new BufferedReader (isr);
             String strLine = br.readLine();
             br.close();
             isr.close();
             System.out.println(strLine);
       }
} 
 


运行程序后,输入“中国”两个字,输出结果为 ???ú
请按照下面两种方法修改上述程序,是输入的中文能够正常输出
1。修改程序中的语句

InputStreamReader isr = new InputStreamReader(System.in,"iso8859-1"); 
 

2。不修改上面的语句,修改下面的语句

System.out.println(strLine); 
 



第一种该法很简单,只要改成下面这样就可以了,这里不详细讨论

InputStreamReader isr = new InputStreamReader(System.in,"gb2312"); 
 



这里我要详细讨论的是第二种该法怎么改

起初我是这样改的
           System.out.println(new String (strLine.getBytes(),"iso8859-1"));
输入“中国”后输出的结果虽然不是上面所述的乱码,但是还是乱码,显然这种该法是不正确的!

这里我要感谢 软件民工   告诉我的正确改法,使我恍然大悟

  System.out.println(new String (strLine.getBytes("iso8859-1"))); 
 


这两种改法究竟有什么区别呢?为了方便大家阅读,我先把正确和错误的改法帖出来:

import java.io.*;
      public class TestCodeIO {
            public static void main(String[] args) throws Exception{
                  InputStreamReader isr = new InputStreamReader(System.in,"iso8859-1");
                        //Create an InputStreamReader that uses the given charset decoder
                  BufferedReader br = new BufferedReader (isr);
                  String strLine = br.readLine();
                  br.close();
                  isr.close();
                  System.out.println(strLine);
                  System.out.println(new String (strLine.getBytes(),"iso8859-1"));//错误改法
                        //Encodes this String (strLine) into a sequence of bytes using the platform’s
                        //default charset(gb2312) then constructs a new String by decoding the
                       //specified array of bytes using the specified charset (iso8859-1)
                       //because this String (strLine) uses the charset decoder "iso8859-1",so it can
                       //only be encoded by "iso8859-1",cann’t be encoded by the platform’s default
                       //charset "gb2312",so this line is wrong.
                 System.out.println(new String (strLine.getBytes("iso8859-1")));//正确改法
                      //Encodes this String (strLine) into a sequence of bytes using the named
                      //charset (iso8859-1),then constructs a new String by decoding the
                      //specified array of bytes using the platform’s default charset (gb2312).
                      //This line is right.
        }
} 
 



上面的英文注释已经说得很清楚了,这里我还是解释一下吧:

首先是错误的改法

System.out.println(new String (strLine.getBytes(),"iso8859-1")); 
 

这句代码是将strLine中的字符串用系统默认的编码方式(这里是gb2312)
转换为字节序列,然后用指定的编码方式(这里是iso8859-1)构造一个新的
String对象
,并打印到屏幕上。
错误在哪里呢?
请注意这一段代码  

 

InputStreamReader isr = new InputStreamReader(System.in,"iso8859-1");
BufferedReader br = new BufferedReader (isr);
String strLine = br.readLine(); 
 


这里strLine存储的内容是用指定的编码方式(iso8859-1)存储的,而转换成字节码
的时候(这句代码strLine.getBytes())却使用了系统默认的gb2312编码,所以当然就
输出乱码了!然后用gb2312编码的字节序列构建新的String对象的时候又使用了
iso8859-1编码,所以输出的乱码和System.out.println(strLine)有所不同。


至于正确的改法就不用详细说明了吧,首先将strLine用iso8859-1编码方式转换成字节
序列,然后用系统默认的编码方式(gb2312)构建新的String对象
,然后打印输出。

分享到:
评论

相关推荐

    ascii编码转码工具

    这类工具通常提供两种操作方式:直接输入转码和文件方式转码。直接输入转码允许用户手动输入ASCII编码的字符串,并将其转换为目标编码(如UTF-8、GBK等)。而文件方式转码则更适用于批量处理,用户可以上传包含ASCII...

    GBK与UTF8转码工具支持文件夹转码

    "GBK与UTF8转码工具"就是针对这两种编码格式而设计的实用工具,它可以快速地帮助用户将文件或文件夹中的文本内容从GBK编码转换为UTF-8编码,或者反向转换。这种转换对于处理跨平台或多语言项目尤其有用,因为不同的...

    七牛云 实时转码demo

    这意味着,如果你的视频存储在这两个区域的七牛云服务器上,你可以享受到高效的转码服务。对于其他地区的视频源,可能需要先进行数据迁移或利用七牛云的数据传输网络(CDN)进行优化。 在转码过程中,七牛云提供了...

    Discuz模板转码专用工具

    这款工具专门针对GKB和utf8两种编码格式进行相互转换,以解决编码不兼容的问题,确保论坛内容的正常显示。 首先,我们需要理解编码的基本概念。在计算机世界里,字符编码是将文字与数字对应起来的方式,如GBK(国标...

    微信小程序转码机器人.zip

    7:自定义水印(可设置为群水印,私聊水印,这两种模式下又分为转码人的用户名和自定义水印,自定义水印主用于引流) 8:群聊和私聊都可以转二维码模式,别人分享给你网址或者直接发你链接即可转二维码,前提是前缀加http...

    unicode 转码器 编码转换

    "Unicode转码器"就是一种工具,用于将数据从一种编码格式转换为Unicode编码,以确保跨平台和跨语言的文本一致性。Unicode是一种国际标准,旨在统一全球所有语言的文字表示,它使用唯一的数字(代码点)来代表每一个...

    阿里云视频转码java代码

    阿里云视频转码服务是基于其强大的媒体处理能力,为开发者和企业提供的一种高效、便捷的视频处理方式。在Java开发环境中,我们可以利用阿里云提供的SDK来实现视频的转码操作。下面将详细介绍如何使用Java代码进行...

    utf-GBK转码工具

    UTF-8和GBK是两种常见的汉字编码标准,它们各自有其特点和适用场景。 UTF-8(Unicode Transformation Format - 8 bit)是一种变长的Unicode编码方式,广泛应用于互联网和现代操作系统中。它以1到4个字节来表示一个...

    gbk转utf、转码工具

    总的来说,GBK和UTF-8编码在不同的应用场景中有各自的优点,而转码工具则是连接这两种编码的重要桥梁。熟练掌握转码方法和工具,对于IT从业人员来说是非常必要的技能,能够帮助我们更高效地处理多语言文本和数据。

    各种字符转码

    在这个场景中,我们有两个文件:`JCharConv.cpp`和`JCharConv.h`,它们很可能是实现字符转码功能的C++源代码文件。 字符转码主要涉及以下几个关键概念: 1. **字符集(Character Set)**:字符集是一系列可被...

    苹果用的转码软件

    标签“转码”进一步确认了这个软件的核心功能,即视频编码与解码的过程,将一种视频编码格式转换为另一种。转码通常涉及视频的编解码器选择、分辨率调整、比特率优化等,以满足特定需求,如降低文件大小、提高播放...

    视频转码.rar

    本压缩包“视频转码.rar”包含了与视频转码相关的两个核心组件:ffmpeg-3.3.9.tar.bz2 和 x264-snapshot-20130131-2245.tar.bz2,这些都是开源工具,用于处理和编码视频流。 首先,我们来了解一下**ffmpeg**。...

    简繁转码软件

    另外,对于学习者来说,通过对比简繁两种字形,可以帮助他们更好地理解和记忆汉字。 总结来说,“简繁转码软件”是信息技术领域中的一个重要工具,它简化了中文字符在简体与繁体之间的转换过程,提高了跨语言交流的...

    转码ogg工具

    这些格式可能由于编码方式、编解码器或容器结构的不同,在某些设备或平台上播放不顺畅,此时就需要转码工具进行转换。转码的过程涉及到视频的解码、重新编码和封装,这个过程可能会对视频质量和文件大小产生影响,...

    转码工具 2个工具

    本资源提供了两个转码工具,帮助用户解决各种文件编码之间的转换问题,如Java文件从UTF-8到GBK的转换。 首先,我们要理解什么是编码。编码是将字符(如文字)转化为二进制数字的过程,常见的编码格式有ASCII、ISO-...

    汉字转码实例

    4. Unicode:通用字符集,包括了全世界几乎所有的文字,其中UTF-8和UTF-16是两种常用的Unicode编码形式,UTF-8适用于网络传输,UTF-16则在内存操作中较常见。 三、汉字转码的实现 1. 转换工具:许多编程语言如...

    URL转码及不能被转码的特殊字符

    URL转码(也称为百分号编码或Percent-Encoding)是将非ASCII字符、保留字符以及一些特殊符号转换为一种适用于URL的标准格式的过程。这一过程对于确保URL能够被正确解析至关重要。 #### 一、URL转码方法 URL转码的...

    2020最新云转码(非授权版)全开源一键安装

    MySQL则是一种流行的关系型数据库管理系统,用于存储和检索数据。 在描述中提到的"PHP5.6转码需要删除禁用函数exec跟shell_exec",这是因为在某些安全设置下,PHP会禁用这两个函数,以防止潜在的命令注入攻击。`...

    HTML 转码

    HTML实体分为命名实体和数字实体两种。命名实体是通过名称来表示特定字符,如"©"代表版权符号。而数字实体则是通过Unicode码点的十进制或十六进制表示,如"™"同样表示版权符号。理解这些实体的使用,...

Global site tag (gtag.js) - Google Analytics