`
aawty
  • 浏览: 32390 次
  • 性别: Icon_minigender_2
  • 来自: 上海
社区版块
存档分类
最新评论

从tomcat乱码问题中学习Java编码

阅读更多

    项目在jetty中运行正常,打包到tomcat中,发现项目有的页面出现乱码。好像之前部署的时候也出现过这个BUG,但是当时不是这个项目,也不是我解决的。刚好趁这次回顾一下以前学习的编码知识。

    关于为什么要编码:计算机中存储信息的最小单元是一个字节,8bit(0~255),人类要表示的符号太多,无法用一个字节完全表示,则有一个新的数据结构Char到byte的编码。

    JAVA中经常遇到几种编码格式的区别:ASCII,ISO-8895-1,GB2312,GBK,UTF-8,UTF-16看作字典,规定了转换规则。

    Java中需要编码的场景:1.I/O操作中存在编码(磁盘和网络I/O),InputStreamReader类是关联字节到字符的桥梁,负责I/O过程中字节到字符的转换,具体转换委托给StreamDecoder解码,其中由用户指定编码格式;2.内存操作中的编码。

    Java中需要编码的数据:用户从浏览器发起一个HTTP请求,存在编码的地方是URL,Cookie,Parameter.服务器端要解析HTTP协议,其中URI.COOKIE.POST表单参数要解码,服务器端可能要读取数据库中的数据——本地或网络中其他地方的文本文件,都存在编码问题。

    通常可以将常见的乱码问题分为JSP页面显示中文乱码、表单提交乱码两类。

    JSP页面中显示中文乱码:在JSP文件中使用page命令指定响应结果的MIME类型,如<%@ page language="java" contentType="text/html;charset=gb2312" %>

    表单提交乱码: 主要是因为服务器处理编码的方式和页面提交方式(post和get)不同。以tomcat为例,tomcat处理提交的参数时默认的是iso-8859-1,使用request.getParameter方法会得到乱码。换句话说:tomcat默认将单字节作为一个字符,但是中文是2个或者3个字节表示一个字符。

    tomcat遇到的常见问题解决方式。

    对于post方式:解决办法是编写一个过滤器统一处理post请求,过滤器在用户提交的数据被处理之前被调用

    对于get方式:这是我所遇到的情况。tomcat对post和get的处理方法不一样,所以过滤器不能解决get的乱码问题,它需要在其他地方设置。解决方法是打开<tomcat_home>\conf目录下server.xml文件,找到对8080端口进行服务的Connector组件的设置部分,给这个组件添加一个属性:URIEncoding="UTF-8"。注意修改后重新启动tomcat才能起作用。

    为什么get方式要这样处理?因为客户端发送过来的请求,tomcat对url编码会判断server.xml中没有设置URIEncoding,如果有设置,则用设置的编码方式,否则用tomcat默认的即iso-8859-1(iso-8859-1)。我遇到的也是因为get中参数提交的时候出现以上情况。

 

参考:深入分析java web技术内幕   第3章 深入分析Java Web中的中文编码问题
          http://nileader.blog.51cto.com/1381108/384353

          http://zhuzhsh.iteye.com/blog/251743

     

   

分享到:
评论

相关推荐

    解决Tomcat中文乱码

    当Tomcat处理这些中文内容时,如果没有正确地转换编码,就会出现乱码问题。 #### 原因分析 1. **默认字符集问题**:Tomcat服务器默认采用ISO-8859-1字符集进行编码解码,该字符集并不支持中文字符。 2. **配置文件...

    如何解决Tomcat下中文乱码问题?

    在IT行业中,尤其是在Java Web开发领域,Tomcat服务器在处理中文字符时经常遇到乱码问题。这主要涉及两个方面:JSP页面显示中文乱码和表单提交乱码。为了解决这些问题,我们需要理解字符编码的基本原理,并采取相应...

    tomcat显示出现中文乱码问题.docx

    在使用Apache Tomcat服务器的过程中,有时会遇到中文乱码的问题,这主要表现为在日志输出、控制台打印或者Web应用中的请求参数、响应内容显示不正常,出现问号或者其他非中文字符。这个问题通常是由于字符编码设置不...

    解决tomcat中文乱码问题

    在Java Web开发中,尤其是在使用Apache Tomcat服务器时,中文乱码问题是开发者常遇到的难题之一。本文将详细解析如何在Tomcat环境中解决中文乱码问题,确保中文字符的正确显示与处理。 #### 一、网页编码设置 首先...

    Tomcat和weblogic中文乱码问题解决方案

    例如,在 Tomcat 或 WebLogic 服务器中,request 和 response 的编码方式可能不同,这将导致中文乱码问题的出现。 解决方案 解决中文乱码问题最好的方法是增加过滤器。关键代码只有三行: ```java response.set...

    java中文乱码之解决URL中文乱码问题的方法

    总之,解决Java中的URL中文乱码问题需要理解URL编码的原理,并在客户端和服务器端采取相应的措施,确保编码和解码的一致性。无论是通过JavaScript编码、Java服务器端解码,还是调整服务器配置,关键在于确保字符集的...

    解决tomcat下中文乱码问题

    在本文中,我们将讨论如何解决 Tomcat 下中文乱码问题。该问题是由于 Tomcat 默认的字符编码设置不正确引起的。我们将通过设置 Connector 元素的 URIEncoding 属性和在过滤器中设置字符编码来解决该问题。 一、...

    Tomcat乱码问题

    ### Tomcat乱码问题及其终极解决方案 在使用Tomcat服务器部署Web应用时,字符编码问题时常困扰着开发者,尤其是在处理中文或特殊字符时,页面显示出现乱码是常见的现象。本文将深入探讨Tomcat乱码问题的原因,并...

    tomcat 下catalina.out 日志乱码问题处理

    标题中的“tomcat下catalina.out日志乱码问题处理”主要涉及的是在Tomcat服务器运行过程中,输出的日志文件`catalina.out`中,中文字符显示为乱码的状况。这通常是由于字符编码不匹配导致的,因为Tomcat在读取或写入...

    解决tomcat中文乱码问题.doc

    对于某些特殊情况,如直接从数据库中读取中文数据时也可能遇到乱码问题。此时可以考虑在处理这些数据之前进行编码转换。 **解决方案**:编写一个辅助类来完成编码转换的工作。例如,可以创建一个名为`CodingConvert...

    java乱码问题解决方法

    Java 乱码问题是 Java 开发中常见的问题之一,解决这个问题需要了解 Java 的编码方式、JSP 中文乱码问题、Tomcat 5.5 中文乱码问题、JDBC ODBC Bridge 的 Bug 及其解决方法、Solaris 下 Servlet 编程的中文问题及...

    java获取乱码问题

    在Java应用开发过程中,字符编码问题一直是困扰开发者的一大难题,尤其是在处理HTTP请求中的中文或特殊字符时,经常会出现乱码现象。本文将详细介绍如何通过修改`server.xml`配置文件来解决Java应用中出现的乱码问题...

    java解决中文乱码问题

    Java 解决中文乱码问题 Java 中文乱码问题是中国程序员无法避免的话题。乱码的出现是由于中文和英文的编码格式不同,解码也是不一样...解决 Java 中文乱码问题的关键是选择合适的编码方式和正确地配置 Tomcat 和 JSP。

    关于tomcat乱码以及tomcat jvm 内存溢出问题的解决方案和理论

    标题中的“关于tomcat乱码以及tomcat jvm 内存溢出问题的解决方案和理论”涉及了两个关键的IT概念:Tomcat服务器的字符编码问题和Java虚拟机(JVM)内存管理的问题。让我们逐一深入探讨这两个主题。 首先,我们来...

    Java中文乱码浅析及解决方案

    为了解决这个问题,我们可以统一Java编译器和源文件编码,例如在IDEA中设置项目编码为UTF-8,并在POM.XML中配置UTF-8编码: ```xml &lt;!-- java 源文件编码 --&gt; &lt;project.build.sourceEncoding&gt;UTF-8 ...

    Java开发乱码问题解决方法汇总

    Java开发中乱码问题是非常常见的问题之一,而解决这些问题需要具备一定的技术知识和经验。在本文中,我们将总结一些常见的Java开发乱码问题解决方法,希望能够为读者提供帮助。 1. 统一项目编码方式 乱码问题的...

    java中MySQL中文乱码问题解决方案

    Java 中 MySQL 中文乱码问题是数据库开发中常见的问题之一,解决这个问题需要对数据库、JSP 和 Tomcat 进行相应的设置。下面我们将详细介绍解决该问题的方案。 数据库编码修改 首先,我们需要修改 MySQL 数据库的...

    java c++ 通信之间的乱码解决方法

    Java和C++之间进行Socket通信时,可能会遇到乱码问题,主要是由于编码格式不一致导致的。Java默认使用UTF-8编码,而C++在Windows XP环境下可能使用GBK编码。解决这个问题的关键在于确保数据在传输过程中保持正确的...

    Java中文乱码问题研究.pdf

    4. 使用Unicode编码:使用Unicode编码可以解决Java Web应用程序中的中文乱码问题。例如,可以使用UTF-8编码来解决中文乱码问题。 5. 设置数据库编码:设置数据库编码也可以解决Java Web应用程序中的中文乱码问题。...

Global site tag (gtag.js) - Google Analytics