先说疑惑,再转文章
资料显示,pageEncoding指的是jsp本身页面文件的编码。在正常的非jsp开发中,对于一个java类,在编译时默认是不需要指定编译时的字符集的,它默认采用本地操作系统字符集,如GBK,如果你将一个java类改成UTF-8格式的,但在javac时不指定字符集,你会发现运行这个java类时,出来的东西就会有乱码。对于JSP相当于多了一个过程,将jsp转成java的过程,而这个过程是需要人工指定字符集的,而这个字符集就是根据pageEncoding(默认为iso-8859-1)来的,如果a.jsp是UTF-8格式的同时指定pageEncoding为iso-8859-1,那么在生成的java文件中就会有乱码.(照这个理解就算是设成GBK也应该是乱码)
在没有pageEncoding的情况下会根据contentType中的charset来指定转换的字符集
但是我测试出现了一个搞笑的结果:一个utf-8的jsp文件,在没有contentType的情况下将pageEncoding设成GBK或UTF-8在生成的java类中居然都没有乱码,只有为iso-8859-1时才是乱码
对于有contentType且其charset为utf-8的情况下,pageEncoding也只有在iso情况下为乱码,为GBK时java类也不乱码,这个结果真的让我看不明白了??????
转:
在JSP标准的语法中,如果pageEncoding属性存在,那么JSP页面的字符编码方式就由pageEncoding决定,
否则就由contentType属性中的charset决定,如果charset也不存在,JSP页面的字符编码方式就采用默认的ISO-8859-1。
ContentType属性指定了MIME类型和JSP页面回应时的字符编码方式。MIME类型的默认值是“text/html”; 字符编码方式的默认值是“ISO-8859-1”. MIME类型和字符编码方式由分号隔开。
pageEncoding的内容只是用于jsp输出时的编码,不会作为header发出去的。pageEncoding是通知web server jsp的编码。
pageEncoding是jsp文件本身的编码
contentType的charset是指服务器发送给客户端时的内容编码
JSP要经过两次的“编码”,第一阶段会用pageEncoding,第二阶段会用utf-8至utf-8,第三阶段就是由Tomcat出来的网页, 用的是contentType。
第一阶段是jsp编译成.java,它会根据pageEncoding的设定读取jsp,结果是由指定的编码方案翻译成统一的UTF-8 JAVA源码(即.java),如果pageEncoding设定错了,或没有设定,出来的就是中文乱码。
第二阶段是由JAVAC的JAVA源码至java byteCode的编译,不论JSP编写时候用的是什么编码方案,经过这个阶段的结果全部是UTF-8的encoding的java源码。
JAVAC用UTF-8的encoding读取java源码,编译成UTF-8 encoding的二进制码(即.class),这是JVM对常数字串在二进制码(java encoding)内表达的规范。
第三阶段是Tomcat(或其的application container)载入和执行阶段二的来的JAVA二进制码,输出的结果,也就是在客户端见到的,这时隐藏在阶段一和阶段二的参数contentType就发挥了功效
contentType的設定.
pageEncoding 和contentType的预设都是 ISO8859-1. 而随便设定了其中一个, 另一个就跟着一样了(TOMCAT4.1.27是如此). 但这不是绝对的, 这要看各自JSPC的处理方式. 而pageEncoding不等于contentType, 更有利亚洲区的文字 CJKV系JSP网页的开发和展示, (例pageEncoding=GB2312 不等于 contentType=utf-8)。
jsp文件不像.java,.java在被编译器读入的时候默认采用的是操作系统所设定的locale所对应的编码,比如中国大陆就是GBK,台湾就是BIG5或者MS950。而一般我们不管是在记事本还是在ue中写代码,如果没有经过特别转码的话,写出来的都是本地编码格式的内容。所以编译器采用的方法刚好可以让虚拟机得到正确的资料。
但是jsp文件不是这样,它没有这个默认转码过程,但是指定了pageEncoding就可以实现正确转码了。
举个例子:
<%@ page contentType="text/html;charset=utf-8" %>
大都会打印出乱码,因为输入的“你好”是gbk的,但是服务器是否正确抓到“你好”不得而知。
但是如果更改为
<%@ page contentType="text/html;charset=utf-8" pageEncoding="GBK"%>
这样就服务器一定会是正确抓到“你好”了。
分享到:
相关推荐
### PageEncoding与ContentType中Charset的区别 在Web开发中,尤其是使用Java Server Pages(JSP)进行页面渲染时,经常会遇到`pageEncoding`和`contentType`属性,并且它们都涉及到`charset`这一概念。正确理解...
在JSP(Java Server Pages)开发中,pageEncoding和contentType是两个非常重要的属性,它们对于网页的显示和数据处理起着关键作用。理解这两个属性的区别和联系是确保网页内容正确显示和数据安全传输的基础。 首先...
### JSP页面中的pageEncoding与contentType两种属性的区别 在Java Server Pages(JSP)技术中,`pageEncoding`和`contentType`是两个重要的属性,它们分别控制着JSP页面的编码方式以及输出内容的类型。了解这两个...
如果`contentType` 的字符集与实际页面内容的编码不符,那么浏览器在显示页面时也会出现乱码。 JSP页面的编码流程可以分为三个阶段: 1. **JSP编译阶段**:JSP文件按照`pageEncoding`的设置读取和解析,生成UTF-8...
### jsp中charset和pageEncoding知识点详解 #### 一、基本概念 在Web开发中,尤其是在使用JavaServer Pages (JSP) 进行网页开发时,经常会遇到字符集(Charset)与页面编码(Page Encoding)的相关问题。这两个...
解决方法是设置 pageEncoding 和 contentType 的其中一个或者两个为支持中文的编码格式,如 utf-8、gbk、gb2312 等。 在 jsp 页面中,pageEncoding 指的是 jsp 文件本身在本地保存时的编码方式,而 contentType 的 ...
JSP 页面中的字符编码方式与乱码解决方法 在 JSP 中,字符编码方式的设置是非常重要的,因为它直接影响着页面的显示效果。如果不正确地设置字符编码方式,可能会出现乱码问题。下面我们将详细介绍 JSP 中的字符编码...
为了解决这些问题,我们需要深入理解JSP中的`contentType`和`pageEncoding`这两个关键属性。 首先,`contentType`属性是用于定义JSP生成的HTML页面在浏览器中的字符编码。它告诉浏览器如何解析和显示接收到的内容。...
#### 一、charset与pageEncoding的区别及应用场景 在Web开发过程中,尤其是使用JSP技术时,经常会遇到字符编码的问题。本文将深入探讨`charset`与`pageEncoding`的区别,并结合MySQL数据库乱码问题,提供有效的解决...
Javaweb 小练习代码绝对有你想要的,pageEncoding是JSP文件本身的编码;contentType的charset是指服务器发送给客户端时的内容编码。 JSP要经过两次的“编码”,第一阶段会用pageEncoding,第二阶段会用UTF-8至UTF...
在 JSP/Servlet 中主要有四个地方可以设置编码,分别是 pageEncoding、contentType、request.setCharacterEncoding 和 response.setCharacterEncoding。下面我们将详细介绍每一个编码方式的作用和使用场景。 1. ...
- 如果文件有BOM,且其编码方式与 `pageEncoding` 或 `contentType` 不符,会导致读取失败或乱码。 - 若JSP文件未指定任何编码方式,则Web容器会根据BOM来判断文件的实际编码方式。 #### 3. 设置和读取HTTP请求参数...
如果在JSP文件中,pageEncoding和contentType的charset设置不一致,同样会导致乱码。例如,JSP文件以GBK编码,但contentType声明为ISO-8859-1。此时,需要确保所有地方的编码设置统一,通常是将它们都设置为相同的...
jsp编码 jsp乱码解决方案 ...通过设置pageEncoding参数、contentType参数、request.setCharacterEncoding方法和response.setCharacterEncoding方法等,可以解决jsp页面中的乱码问题,提高Web应用程序的用户体验。
具体涉及到了`pageEncoding`, `contentType`, `request.setCharacterEncoding`, `response.setCharacterEncoding`等几个关键概念。 --- ### 正文 在JSP与Servlet的实际开发过程中,中文乱码问题是非常常见的一个...
值得注意的是,`contentType`的设置可以覆盖`pageEncoding`,如果`contentType`中包含了`charset`,那么页面显示的编码就由`contentType`的`charset`决定。如果既没有`pageEncoding`也没有`contentType`的`charset`...
如果`contentType`的charset与`pageEncoding`不一致,应修改使其保持一致,同时`<meta>`标签的charset也应与之对应。 除了上述方法,还可以通过以下途径解决乱码问题: - 在服务器配置文件(如Tomcat的`server.xml...
如果 pageEncoding 属性和 contentType 的 charset 属性不一致,会导致中文乱码。 2. ContentType 属性 contentType 属性决定了浏览器的解码方式,默认为 ISO-8859-1。如果 JSP 页面的编码格式和 contentType 的 ...
6. page 指令的属性:page 指令的属性包括 contentType 和 pageEncoding,contentType 属性用于设置传回网页的文件格式和编码方式,而 pageEncoding 属性用于指定本页面编码的字符集。 7. response 对象的使用:...