`

Java中文乱码问题解决心得

阅读更多
自从接触Java和就不断与Java的中文乱码问题打交道,现在终于得到了彻底的解决,现将我们的解决心得与大家共享。

一、Java中文问题的由来

Java的内核和class文件是基于unicode的,这使Java程序具有良好的跨平台性,但也带来了一些中文乱码问题的麻烦。原因主要有两方面,Java和JSP文件本身编译时产生的乱码问题和Java程序于其他媒介交互产生的乱码问题。

首先 Java(包括JSP)源文件中很可能包含有中文,而Java和JSP源文件的保存方式是基于字节流的,如果Java和JSP编译成class文件过程中,使用的编码方式与源文件的编码不一致,就会出现乱码。基于这种乱码,建议在Java文件中尽量不要写中文(注释部分不参与编译,写中文没关系),如果必须写的话,尽量手动带参数-ecoding GBK或-ecoding gb2312编译;对于JSP,在文件头加上或基本上就能解决这类乱码问题。

本文要重点讨论的是第二类乱码,即Java程序与其他存储媒介交互时产生的乱码。很多存储媒介,如数据库,文件,流等的存储方式都是基于字节流的,Java程序与这些媒介交互时就会发生字符(char)与字节(byte)之间的转换,具体情况如下:

从页面form提交数据到java程序 byte->char
从java程序到页面显示 char?>byte

从数据库到java程序 byte?>char
从java程序到数据库 char?>byte

从文件到java程序 byte->char
从java程序到文件 char->byte

从流到java程序 byte->char
从java程序到流 char->byte

如果在以上转换过程中使用的编码方式与字节原有的编码不一致,很可能就会出现乱码。

二、解决方法

前面已经提到了Java程序与其他媒介交互时字符和字节的转换过程,如果这些转换过程中容易产生乱码。解决这些乱码问题的关键在于确保转换时使用的编码方式与字节原有的编码方式保持一致,下面分别论述(Java或JSP自身产生的乱码请参看第一部分)。

1、JSP与页面参数之间的乱码
JSP获取页面参数时一般采用系统默认的编码方式,如果页面参数的编码类型和系统默认的编码类型不一致,很可能就会出现乱码。解决这类乱码问题的基本方法是在页面获取参数之前,强制指定request获取参数的编码方式:request.setCharacterEncoding("GBK")或 request.setCharacterEncoding("gb2312")。
如果在JSP将变量输出到页面时出现了乱码,可以通过设置 response.setContentType("text/html;charset=GBK")或 response.setContentType("text/html;charset=gb2312")解决。
如果不想在每个文件里都写这样两句话,更简洁的办法是使用Servlet规范中的过虑器指定编码,过滤器的在web.xml中的典型配置和主要代码如下:
web.xml:


CharacterEncodingFilter
net.vschool.web.CharacterEncodingFilter
encoding GBK



CharacterEncodingFilter
/*


CharacterEncodingFilter.java:

public class CharacterEncodingFilter implements Filter
{

protected String encoding = null;

public void init(FilterConfig filterConfig) throws ServletException
{
this.encoding = filterConfig.getInitParameter("encoding");
}

public void doFilter(ServletRequest request, ServletResponse response, FilterChain chain) throws IOException, ServletException
{
request.setCharacterEncoding(encoding);
response.setContentType("text/html;charset="+encoding);
chain.doFilter(request, response);
}

}


2、 Java与数据库之间的乱码
大部分数据库都支持以unicode编码方式,所以解决Java与数据库之间的乱码问题比较明智的方式是直接使用 unicode编码与数据库交互。很多数据库驱动自动支持unicode,如Microsoft的SQLServer驱动。其他大部分数据库驱动,可以在驱动的url参数中指定,如如mm的mysql驱动:jdbc:mysql://localhost/WEBCLDB?useUnicode=true& amp;characterEncoding=GBK。

3、Java与文件/流之间的乱码
Java读写文件最常用的类是 FileInputStream/FileOutputStream和FileReader/FileWriter。其中FileInputStream 和FileOutputStream是基于字节流的,常用于读写二进制文件。读写字符文件建议使用基于字符的FileReader和 FileWriter,省去了字节与字符之间的转换。但这两个类的构造函数默认使用系统的编码方式,如果文件内容与系统编码方式不一致,可能会出现乱码。在这种情况下,建议使用FileReader和FileWriter的父类:InputStreamReader/OutputStreamWriter,它们也是基于字符的,但在构造函数中可以指定编码类型:InputStreamReader(InputStream in, Charset cs) 和 OutputStreamWriter(OutputStream out, Charset cs)。

4、其他
上面提到的方法应该能解决大部分乱码问题,如果在其他地方还出现乱码,可能需要手动修改代码。解决Java乱码问题的关键在于在字节与字符的转换过程中,你必须知道原来字节或转换后的字节的编码方式,转换时采用的编码必须与这个编码方式保持一致。我们以前使用Resin服务器,使用smartUpload组件上传文件,上传文件同时传递的中文参数获取没有乱码问题。当在Linux中把Resin设置成服务后,上传文件同时的中文参数获取出现了乱码。这个问题困扰了我们很久,后来我们分析smartUpload组件的源文件,因为文件上传采用的是字节流的方式,里面包含的参数名称和值也是字节流的方式传递的。 smartUpload组件读取字节流后再将参数名称和值从字节流中解析出来,问题就出现在smartUpload将字节流转换成字符串时采用了系统默认的编码,而将Resin设置成服务后,系统默认的编码可能发生了改变,因此出现了乱码。后来,我们更改了smartUpload的源文件,增加了一个属性 charset和setCharset(String)方法,将upload()方法中提取参数语句:
String value = new String(m_binArray, m_startData, (m_endData - m_startData) + 1 );
改成了
String value = new String(m_binArray, m_startData, (m_endData - m_startData) + 1, charset );
终于解决了这个乱码问题
分享到:
评论

相关推荐

    JavaJSP中文乱码问题解决心得.doc

    ### Java/JSP中文乱码问题解决心得 #### 一、Java中文问题的由来 Java作为一种广泛使用的编程语言,其核心设计目标之一就是提供良好的跨平台能力。为此,Java采用了Unicode作为其内部处理字符的标准,这使得Java...

    J2EE平台下的乱码问题分析及解决

    此外,解决汉字乱码问题还需要注意如下几点心得: - 对于不同版本的Java,它们的默认编码可能不同,需要根据实际的Java版本进行相应的编码设置。 - 在进行国际化软件开发时,应该避免在系统中使用默认编码,而应该...

    JAVA程序员的心得

    从给定的信息来看,虽然部分内容存在乱码情况,但标题和描述为我们提供了一些关于JAVA程序员心得的关键信息。接下来,我们将围绕这些心得展开讨论,并尝试从中提取出对JAVA程序员有用的知识点。 ### JAVA程序员的...

    Java中的字符编码问题处理心得总结

    总结几点处理Java字符编码问题的心得: 1. **始终坚持使用Unicode编码**:Unicode是跨语言的标准,能处理多种字符集,减少乱码风险。 2. **谨慎使用`String.getBytes()`**:不指定字符集可能导致依赖于JVM的默认...

    【Java+Project】

    这样的社区为技术爱好者提供了一个交流心得、解决问题和寻求合作的平台。参与社区活动不仅能够加快个人学习进度,还有助于建立专业网络,对职业发展大有裨益。 ### 结论 虽然给定的信息片段有限且包含了一些难以...

    javaweb学习心得.doc

    * 学习 Servlet 需要掌握开发环境的配置、Servlet 的访问方式、post 和 get 的区别、处理中文乱码等概念 * 在学习 Servlet 时,需要掌握 Servlet 的生命周期、Session 的使用和管理 六、JSP * JSP 是一种 Java ...

    软件开发实习心得体会参考.pdf

    - 面对出现的bug和问题,学会使用调试工具和日志来定位问题,并提出解决方案。 6. 版本控制与代码管理 - 实习生要学会使用版本控制系统,如Git或SVN,来管理代码的变更和协作。 - 理解分支策略、合并冲突解决...

    JSP初学心得

    - **字符编码转换**:在处理中文等非英文字符时,经常会出现乱码问题。为了解决这个问题,可以采用特定的编码格式进行转换。例如,将字符串从ISO-8859-1编码转换为UTF-8编码: ```java String title = ""; byte[]...

    spring 数据绑定心得,适合新手

    Spring提供了多种方式来解决这个问题,包括在`HttpServletRequest`中设置编码,或者在`WebConfig`中配置全局的字符编码,如`CharacterEncodingFilter`。 在学习过程中,你可能会遇到各种问题,比如绑定失败、空指针...

    weblogic10配置

    本篇文章将深入探讨"weblogic10配置"这一主题,包括WebLogic 9.x与XFire 1.2.6之间的冲突解决心得以及WebLogic服务器上的中文乱码处理方法。 一、WebLogic 9.x与XFire 1.2.6冲突解决 1. **冲突原因**:WebLogic 9....

    eai 开发工作总结

    为解决乱码问题,开发者需要确保在IDE、数据库、文件读写以及网络通信等环节统一使用正确的字符集,例如UTF-8。 7. **Eclipse配置与优化**: - **Eclipse Problem选项**: 这是指Eclipse的错误和警告提示设置,可以...

    ireport参考(收集)

    在处理中文报表时,IReport可能会遇到字符编码或字体兼容性问题,导致中文乱码。为了解决这个问题,需要修改`com.lowagie.text.pdf.DefaultFontMapper`类中的`awtToPdf`方法,具体是在该方法中指定中文使用的字体...

    web实训开发心得.pdf

    此外,过滤器(Filter)用于处理如乱码、URL转义等问题,监听器(Listener)可以用来跟踪和管理应用程序的状态,如在线人数。 分页技术是Web开发中的另一个重要方面,常见的有前端分页、后端分页和数据库分页。每种...

    S2SH框架搭建和心得

    S2SH(Struts2、Spring、Hibernate)是一个经典的Java Web开发框架组合,它整合了三个强大的开源组件,以提供模型-视图-控制器(MVC)架构的解决方案。对于初学者来说,理解并熟练掌握S2SH框架的搭建过程是迈向专业...

    个人信息管理系统答辩.pptx

    "个人信息管理系统答辩" 本资源是一个关于个人...15.心得体会:在编写程序之前分析需求很重要,编写代码时要有细心和耐心,遇到问题可以跟同学进行讨论,多方面的看待问题,加深对问题的理解,同时更快捷的解决问题。

    一个dao模式的实验报告

    实验结束后,周媛娣认识到在进行数据查询时,有效的沟通和调试是解决问题的关键。通过这次实验,她加深了对DAO模式的理解,掌握了如何在实际项目中应用DAO模式进行数据库操作。 5. **总结**: 这个实验是一个很好...

    PHP面试题及答案,另附学习心得

    **解答**: 使用`mb_substr()`函数,它可以正确处理多字节字符,避免截取中文字符串时出现乱码问题。 #### 十一、变量引用与赋值 **题目**: 分析以下代码执行结果。 **代码**: ```php $a = "hello"; $b = &$a; // ...

Global site tag (gtag.js) - Google Analytics