项目在jetty中运行正常,打包到tomcat中,发现项目有的页面出现乱码。好像之前部署的时候也出现过这个BUG,但是当时不是这个项目,也不是我解决的。刚好趁这次回顾一下以前学习的编码知识。
关于为什么要编码:计算机中存储信息的最小单元是一个字节,8bit(0~255),人类要表示的符号太多,无法用一个字节完全表示,则有一个新的数据结构Char到byte的编码。
JAVA中经常遇到几种编码格式的区别:ASCII,ISO-8895-1,GB2312,GBK,UTF-8,UTF-16看作字典,规定了转换规则。
Java中需要编码的场景:1.I/O操作中存在编码(磁盘和网络I/O),InputStreamReader类是关联字节到字符的桥梁,负责I/O过程中字节到字符的转换,具体转换委托给StreamDecoder解码,其中由用户指定编码格式;2.内存操作中的编码。
Java中需要编码的数据:用户从浏览器发起一个HTTP请求,存在编码的地方是URL,Cookie,Parameter.服务器端要解析HTTP协议,其中URI.COOKIE.POST表单参数要解码,服务器端可能要读取数据库中的数据——本地或网络中其他地方的文本文件,都存在编码问题。
通常可以将常见的乱码问题分为JSP页面显示中文乱码、表单提交乱码两类。
JSP页面中显示中文乱码:在JSP文件中使用page命令指定响应结果的MIME类型,如<%@ page language="java" contentType="text/html;charset=gb2312" %>
表单提交乱码: 主要是因为服务器处理编码的方式和页面提交方式(post和get)不同。以tomcat为例,tomcat处理提交的参数时默认的是iso-8859-1,使用request.getParameter方法会得到乱码。换句话说:tomcat默认将单字节作为一个字符,但是中文是2个或者3个字节表示一个字符。
tomcat遇到的常见问题解决方式。
对于post方式:解决办法是编写一个过滤器统一处理post请求,过滤器在用户提交的数据被处理之前被调用。
对于get方式:这是我所遇到的情况。tomcat对post和get的处理方法不一样,所以过滤器不能解决get的乱码问题,它需要在其他地方设置。解决方法是打开<tomcat_home>\conf目录下server.xml文件,找到对8080端口进行服务的Connector组件的设置部分,给这个组件添加一个属性:URIEncoding="UTF-8"。注意修改后重新启动tomcat才能起作用。
为什么get方式要这样处理?因为客户端发送过来的请求,tomcat对url编码会判断server.xml中没有设置URIEncoding,如果有设置,则用设置的编码方式,否则用tomcat默认的即iso-8859-1(iso-8859-1)。我遇到的也是因为get中参数提交的时候出现以上情况。
参考:深入分析java web技术内幕 第3章 深入分析Java Web中的中文编码问题
http://nileader.blog.51cto.com/1381108/384353
http://zhuzhsh.iteye.com/blog/251743
相关推荐
当Tomcat处理这些中文内容时,如果没有正确地转换编码,就会出现乱码问题。 #### 原因分析 1. **默认字符集问题**:Tomcat服务器默认采用ISO-8859-1字符集进行编码解码,该字符集并不支持中文字符。 2. **配置文件...
在IT行业中,尤其是在Java Web开发领域,Tomcat服务器在处理中文字符时经常遇到乱码问题。这主要涉及两个方面:JSP页面显示中文乱码和表单提交乱码。为了解决这些问题,我们需要理解字符编码的基本原理,并采取相应...
在使用Apache Tomcat服务器的过程中,有时会遇到中文乱码的问题,这主要表现为在日志输出、控制台打印或者Web应用中的请求参数、响应内容显示不正常,出现问号或者其他非中文字符。这个问题通常是由于字符编码设置不...
在Java Web开发中,尤其是在使用Apache Tomcat服务器时,中文乱码问题是开发者常遇到的难题之一。本文将详细解析如何在Tomcat环境中解决中文乱码问题,确保中文字符的正确显示与处理。 #### 一、网页编码设置 首先...
例如,在 Tomcat 或 WebLogic 服务器中,request 和 response 的编码方式可能不同,这将导致中文乱码问题的出现。 解决方案 解决中文乱码问题最好的方法是增加过滤器。关键代码只有三行: ```java response.set...
总之,解决Java中的URL中文乱码问题需要理解URL编码的原理,并在客户端和服务器端采取相应的措施,确保编码和解码的一致性。无论是通过JavaScript编码、Java服务器端解码,还是调整服务器配置,关键在于确保字符集的...
在本文中,我们将讨论如何解决 Tomcat 下中文乱码问题。该问题是由于 Tomcat 默认的字符编码设置不正确引起的。我们将通过设置 Connector 元素的 URIEncoding 属性和在过滤器中设置字符编码来解决该问题。 一、...
### Tomcat乱码问题及其终极解决方案 在使用Tomcat服务器部署Web应用时,字符编码问题时常困扰着开发者,尤其是在处理中文或特殊字符时,页面显示出现乱码是常见的现象。本文将深入探讨Tomcat乱码问题的原因,并...
标题中的“tomcat下catalina.out日志乱码问题处理”主要涉及的是在Tomcat服务器运行过程中,输出的日志文件`catalina.out`中,中文字符显示为乱码的状况。这通常是由于字符编码不匹配导致的,因为Tomcat在读取或写入...
对于某些特殊情况,如直接从数据库中读取中文数据时也可能遇到乱码问题。此时可以考虑在处理这些数据之前进行编码转换。 **解决方案**:编写一个辅助类来完成编码转换的工作。例如,可以创建一个名为`CodingConvert...
Java 乱码问题是 Java 开发中常见的问题之一,解决这个问题需要了解 Java 的编码方式、JSP 中文乱码问题、Tomcat 5.5 中文乱码问题、JDBC ODBC Bridge 的 Bug 及其解决方法、Solaris 下 Servlet 编程的中文问题及...
在Java应用开发过程中,字符编码问题一直是困扰开发者的一大难题,尤其是在处理HTTP请求中的中文或特殊字符时,经常会出现乱码现象。本文将详细介绍如何通过修改`server.xml`配置文件来解决Java应用中出现的乱码问题...
Java 解决中文乱码问题 Java 中文乱码问题是中国程序员无法避免的话题。乱码的出现是由于中文和英文的编码格式不同,解码也是不一样...解决 Java 中文乱码问题的关键是选择合适的编码方式和正确地配置 Tomcat 和 JSP。
标题中的“关于tomcat乱码以及tomcat jvm 内存溢出问题的解决方案和理论”涉及了两个关键的IT概念:Tomcat服务器的字符编码问题和Java虚拟机(JVM)内存管理的问题。让我们逐一深入探讨这两个主题。 首先,我们来...
为了解决这个问题,我们可以统一Java编译器和源文件编码,例如在IDEA中设置项目编码为UTF-8,并在POM.XML中配置UTF-8编码: ```xml <!-- java 源文件编码 --> <project.build.sourceEncoding>UTF-8 ...
Java开发中乱码问题是非常常见的问题之一,而解决这些问题需要具备一定的技术知识和经验。在本文中,我们将总结一些常见的Java开发乱码问题解决方法,希望能够为读者提供帮助。 1. 统一项目编码方式 乱码问题的...
Java 中 MySQL 中文乱码问题是数据库开发中常见的问题之一,解决这个问题需要对数据库、JSP 和 Tomcat 进行相应的设置。下面我们将详细介绍解决该问题的方案。 数据库编码修改 首先,我们需要修改 MySQL 数据库的...
Java和C++之间进行Socket通信时,可能会遇到乱码问题,主要是由于编码格式不一致导致的。Java默认使用UTF-8编码,而C++在Windows XP环境下可能使用GBK编码。解决这个问题的关键在于确保数据在传输过程中保持正确的...
4. 使用Unicode编码:使用Unicode编码可以解决Java Web应用程序中的中文乱码问题。例如,可以使用UTF-8编码来解决中文乱码问题。 5. 设置数据库编码:设置数据库编码也可以解决Java Web应用程序中的中文乱码问题。...