`

ajax+spring工程,Tomcat5.5 UTF-8 乱码问题解决办法

    博客分类:
  • java
阅读更多
关于java的乱码,一直是双字节字符环境开发者的问题,不同的服务,不同的版本,甚至不同的系统环境,都有很大的影响。
今天说一下,在中文windows下,Tomcat5.5服务下的,UTF-8的乱码解决问题。
首先要需要了解的是web容器默认编码是iso-8859-1,一个汉字占用两个字节,而在utf-8中一个汉字占用三个字节。所以在数据传递过程中,必须手动设定容器编码格式,否则会出现字符位丢失的情况。即3个字节变为两个字节,自然会变成乱码。
其次,Tomcat 5以后,对post和get方法的编码控制分开了,像以前那样,仅仅
request.setCharacterEncoding("utf-8");
response.setCharacterEncoding("utf-8");
不能解决问题了。

明白了这个以后,再来看
第一步,修改tomcat。
找到对应站点的server.xml后,在里面的Connector标签里面添加
useBodyEncodingForURI="true"
这句的话告诉tomcat用页面的编码去处理post,推荐使用。
这块有句更狠的就是
URIEncoding="utf-8"
不过是强制指定编码了,所以一旦有其他编码的页面存在,就会出问题,所以不建议用。
第二步,修改jsp页面头。
我是偷懒,全都加上了
<%@ page language="java" pageEncoding="UTF-8"%>
,然后在html标签的head标签里加上
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
第三步,修改指定编码。
在jsp头部分,任何request和response被使用前,加上
request.setCharacterEncoding("utf-8");
response.setCharacterEncoding("utf-8");

经过以上三步后,post过来的文字就可以正常的用request.getParameter()取得并使用了。

第四步,修改用get方法传出的连接参数。
new String(java.net.URLEncoder.encode("输入文字","UTF-8"));
记得try一下,我是封装的一下用的。

经过以上几步,基本上乱码的问题解决了。


======================================================================
实践步骤:
1.修改server.xml,在里面的Connector标签里面添加
useBodyEncodingForURI="true"
  <!-- Define a non-SSL HTTP/1.1 Connector on port 8080 -->
    <Connector
port="8001"               maxHttpHeaderSize="8192"
               maxThreads="150" minSpareThreads="25" maxSpareThreads="75"
               enableLookups="false" redirectPort="8443" acceptCount="100"
               connectionTimeout="20000" disableUploadTimeout="true" useBodyEncodingForURI="true"/>
    <!-- Note : To disable connection timeouts, set connectionTimeout value



2.修改工程中的web.xml
 
<filter>
        <filter-name>encodingFilter</filter-name>
        <filter-class>org.springframework.web.filter.CharacterEncodingFilter
</filter-class>
        <init-param>
            <param-name>encoding</param-name>
            <param-value>UTF-8</param-value>
        </init-param>
        <init-param>
            <param-name>forceEncoding</param-name>
            <param-value>true</param-value>
        </init-param>
  </filter>  
  <filter-mapping>
    <filter-name>encodingFilter</filter-name>
    <url-pattern>/*</url-pattern>
  </filter-mapping>
  <filter-mapping>
    <filter-name>encodingFilter</filter-name>
    <url-pattern>*.do</url-pattern>
  </filter-mapping>

3.在jsp页面开头使用:
<%@page language="java"  errorPage="/error.jsp" contentType="text/html;charset=UTF-8" pageEncoding="UTF-8"%>

4.OK,这样就能大概能正常向后台传中文了。如果仍然不能,则使用javascript函数encodeURI(str)来转换向后台传递的参数
5.后台向页面传中文参数,是这样:
String Data="数据";
response.setContentType("text/html;charset=UTF-8");
PrintWriter out = response.getWriter();
out.println(Data);



//-------------------------------------------------
关于JSP页面中的pageEncoding和contentType两种属性的区别: pageEncoding是jsp文件本身的编码 contentType的charset是指服务器发送给客户端时的内容编码 JSP要经过两次的“编码”,第一阶段会用pageEncoding,第二阶段会用utf-8至utf-8,第三阶段就是由Tomcat出来的网页,用的是contentType。第一阶段是jsp编译成.java,它会根据pageEncoding的设定读取jsp,结果是由指定的编码方案翻译成统一的UTF-8 JAVA源码(即.java),如果pageEncoding设定错了,或没有设定,出来的就是中文乱码。第二阶段是由JAVAC的JAVA源码至java byteCode的编译,不论JSP编写时候用的是什么编码方案,经过这个阶段的结果全部是UTF-8的encoding的java源码。 JAVAC用UTF-8的encoding读取java源码,编译成UTF-8 encoding的二进制码(即.class),这是JVM对常数字串在二进制码(java encoding)内表达的规范。第三阶段是Tomcat(或其的application container)载入和执行阶段二的来的JAVA二进制码,输出的结果,也就是在客户端见到的,这时隐藏在阶段一和阶段二的参数 contentType就发挥了功效 contentType的設定. pageEncoding 和contentType的预设都是 ISO8859-1. 而随便设定了其中一个, 另一个就跟着一样了(TOMCAT4.1.27是如此). 但这不是绝对的, 这要看各自JSPC的处理方式. 而pageEncoding不等于contentType, 更有利亚洲区的文字 CJKV系JSP网页的开发和展示, (例pageEncoding=GB2312 不等于 contentType=utf-8)。 jsp文件不像.java,.java在被编译器读入的时候默认采用的是操作系统所设定的locale所对应的编码,比如中国大陆就是GBK,台湾就是 BIG5或者MS950。而一般我们不管是在记事本还是在ue中写代码,如果没有经过特别转码的话,写出来的都是本地编码格式的内容。所以编译器采用的方法刚好可以让虚拟机得到正确的资料。但是jsp文件不是这样,它没有这个默认转码过程,但是指定了pageEncoding就可以实现正确转码了。 举个例子: <%@ page contentType="text/html;charset=utf-8" %> 大都会打印出乱码,因为输入的“你好”是gbk的,但是服务器是否正确抓到“你好”不得而知。
//----------------------------------------------------------------



分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics