http的本质还是socket,所以底层传输的还是字节流(不要深究到二进制层面),既然是字节流,那么肯定会涉及到编码和解码.
乱码的原因大家肯定都知道,也很简单,那就是编码和解码的格式不一致
。
既然知道了根源,那么我们是否能从这个角度来解决问题?是的,只要你保证前台编码和后台解码的格式一样的时候,就肯定不会出现乱码了。
下面要用到一些例子,这里先给出程序:
index.jsp:
<%@ page language="java" contentType="text/html; charset=UTF-8"
pageEncoding="UTF-8"%>
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gbk">
<title>Insert title here</title>
<script type="text/javascript">
function loadFunction()
{
var url = "encodingServlet?name=";
url += encodeURI("严");
document.getElementById("name").href = url + "&d=" + new Date();
}
function escapeCode()
{
alert(encodeURI("严"))
}
</script>
</head>
<body onload="loadFunction()">
<a id="name">name</a>
<form action="encodingServlet" method="get">
<input type="text" name="name"/>
<input type="submit" text="submit"/>
</form>
<button onclick="escapeCode()">aaa</button>
<br>
<a href="encodingServlet?name=严">aaaa</a>
</body>
</html>
首先看前台编码的几种情况:
1.首先最常见的就是你在地址栏直接输入一个地址
比如:https://www.google.com/webhp?hl=en&tab=ww#hl=en&tbo=d&output=search&sclient=psy-ab&q=你好&oq=你好
非常不幸,这种情况下你根本无法控制浏览器如何对你输入的内容进行编码。我使用英文版的IE进行测试,它使用的是ISO-8859-1格式,而英文版的FireFox使用的是UTF-8。
这种情况就不讨论了,google也会因为这种原因而导致乱码,不过我相信大家总是会有办法解决的。(怎么解决请教我一下)

2.网页里面的一个超链接
比如:上面index.jsp中的<a href="encodingServlet?name=严">aaaa</a>
那么这个时候前台的编码是以
<%@ page language="java" contentType="text/html; charset=UTF-8"
pageEncoding="UTF-8"%>
里面的pageEncoding决定的
3.FORM表单
无论get方式还是post方式都是以
<%@ page language="java" contentType="text/html; charset=UTF-8"
pageEncoding="UTF-8"%>
里面的charset决定的
4.encodeURI函数
该函数将参数中的字符将转换成UTF-8编码方式的byte数组,并使用十六进制转义序列(%xx)生成替换。
过程用Java模拟如下:
byte[] data1 = "严".getBytes("UTF-8");
String result = "";
for(byte datai : data1)
{
result += "%" + Integer.toHexString(datai >= 0 ? datai : datai + 256);
}
再来看看后台是如何解码的:
我们都是通过request.getParameter("name");这样的语句来得到参数的,
在我们调用这个方法的时候tomcat容器会自动帮我们做一次解码,请看下面的tomcat部分源码(解析参数):
该方法位于:org.apache.catalina.util.RequestUtil
public static void parseParameters(Map map, byte[] data, String encoding)
throws UnsupportedEncodingException {
if (data != null && data.length > 0) {
int ix = 0;
int ox = 0;
String key = null;
String value = null;
while (ix < data.length) {
byte c = data[ix++];
switch ((char) c) {
case '&':
value = new String(data, 0, ox, encoding);
if (key != null) {
putMapEntry(map, key, value);
key = null;
}
ox = 0;
break;
case '=':
if (key == null) {
key = new String(data, 0, ox, encoding);
ox = 0;
} else {
data[ox++] = c;
}
break;
case '+':
data[ox++] = (byte)' ';
break;
case '%':
data[ox++] = (byte)((convertHexDigit(data[ix++]) << 4)
+ convertHexDigit(data[ix++]));
break;
default:
data[ox++] = c;
}
}
//The last value does not end in '&'. So save it now.
if (key != null) {
value = new String(data, 0, ox, encoding);
putMapEntry(map, key, value);
}
}
}
可以看到,这个方法会要求输入编码格式encoding,那么这个参数是怎么得到的呢。
它分为两种情况,如果下面两种情况你都没有设置,就会采用ISO-8859-1的格式来解码:
1.参数位于URL中,也就是通过GET的方式请求,这个encoding请在tomcat的连接器中配置,也就是server.xml中的
<Connector connectionTimeout="20000" port="9180" protocol="HTTP/1.1" redirectPort="8443" URIEncoding="UTF-8"/>
加入了URIEncoding="UTF-8"
2.参数在请求实体中,也就是POST方式,这个时候你可以直接通过request.setCharacterEncoding("UTF-8");的方式设置,当然你可以运用一个过滤器来统一解决。
知道了原因,再去解决乱码一般就不会有什么问题了。
至于有些提出使用前台encodeURI(encodeURI(str))方式去做的,后台手动解码,其实还是由于两端编码和解码不一致造成的,完全不需要这么使用。
分享到:
相关推荐
【描述】:“深入剖析Tomcat,超清版,带标签”这一描述暗示了我们将会深入理解Tomcat服务器的内部工作机制,包括其核心原理、配置优化以及问题排查等方面。"超清版"可能指的是资源的清晰度,意味着提供的资料详尽且...
全书一共被压缩为5个rar,这是第二个!...21.2 中文乱码问题的解决方案 614 21.3 使用过滤器解决中文问题 616 21.4 让tomcat支持中文文件名 620 21.5 国际化与本地化 621 21.5.1 locale 621.. 21.5.2 资源包 623 ...
全书一共被压缩为5个rar,这是第四个!...21.2 中文乱码问题的解决方案 614 21.3 使用过滤器解决中文问题 616 21.4 让tomcat支持中文文件名 620 21.5 国际化与本地化 621 21.5.1 locale 621.. 21.5.2 资源包 623 ...
全书一共被压缩为5个rar,这是第五个!...21.2 中文乱码问题的解决方案 614 21.3 使用过滤器解决中文问题 616 21.4 让tomcat支持中文文件名 620 21.5 国际化与本地化 621 21.5.1 locale 621.. 21.5.2 资源包 623 ...
全书一共被压缩为5个rar,这是第三个!...21.2 中文乱码问题的解决方案 614 21.3 使用过滤器解决中文问题 616 21.4 让tomcat支持中文文件名 620 21.5 国际化与本地化 621 21.5.1 locale 621.. 21.5.2 资源包 623 ...
4.7.3 实例:解决服务端程序读取中文请求消息的乱码问题 4.7.4 实例:用AJAX技术发送和接收中文信息 4.7.5 实例:在请求消息头和响应消息头中转输中文 4.8 小结 第5章 JSP技术 5.1 用MyEclipse编写第一个...
4.7.3 实例:解决服务端程序读取中文请求消息的乱码问题 4.7.4 实例:用AJAX技术发送和接收中文信息 4.7.5 实例:在请求消息头和响应消息头中转输中文 4.8 小结 第5章 JSP技术 5.1 用MyEclipse编写第...