`

[转]jsp页面中的pageEncoding和contentType以及html中的meta标签中字符集的设置

阅读更多

一开始对这几个有关字符集设置方面比较困惑,网上查阅了一些资料,最常见的就是我下边原文转载的那一篇《关于JSP页面中的pageEncoding和contentType两种属性的区别》,
但在实际测试中,和其表述的有些出入,特将其记下:
    例如:有这么说的
   ---------------------------------------------------------------------------------------------------------------
   - pageEncoding
   -      在JSP标准的语法中,如果pageEncoding属性存在,那么JSP页面的字符编码方式就由pageEncoding决定,
   - 否则就由contentType属性中的charset决定,如果charset也不存在,JSP页面的字符编码方式就采用默认的ISO-8859-1。
   -
   - ContentType
   -      ContentType属性指定了MIME类型和JSP页面回应时的字符编码方式。MIME类型的默认值是“text/html”; 
   - 字符编码方式的默认值是“ISO-8859-1”. MIME类型和字符编码方式由分号隔开
   -
   - pageEncoding的内容只是用于jsp输出时的编码,不会作为header发出去的。
   -
   - pageEncoding是通知web server jsp的编码。
   ---------------------------------------------------------------------------------------------------------------
   而我测试的结果是:
       如果在jsp页面中,例如设定<%@ page language="java" contentType="text/html;charset=gbk" pageEncoding="gbk"%>
   和<%@ page language="java" contentType="text/html;charset=gbk"%>效果一样,同<%@ page language="java" contentType="text/html;charset=gbk" pageEncoding="utf-8"%>
   效果也一样,所以我推断,在jsp页面中如果设定了contentType="text/html;charset=gbk"则pageEncoding的值不论设不设都不起作用,其值与charset=gbk设定的一样;如果不设定
   charset=gbk,pageEncoding的设定才起作用
       对于本属于html中的<meta http-equiv="Content-Type" content="text/html; charset=utf-8">,在测试中发现,没有起作用,具体他的用法可见博客中转载的一片专门讲解
   <meta标签的文章---html meta标签详解
   另外,为了避免不必要的错误,在书写是应尽量保证这三处有关字符集的设置一致
=========================================================================================================================================================================

转载:《关于JSP页面中的pageEncoding和contentType两种属性的区别》

  pageEncoding是jsp文件本身的编码

  contentType的charset是指服务器发送给客户端时的内容编码

  JSP要经过两次的“编码”,第一阶段会用pageEncoding,第二阶段会用utf-8至utf-8,第三阶段就是由Tomcat出来的网页, 用的是contentType。

  第一阶段是jsp编译成.java,它会根据pageEncoding的设定读取jsp,结果是由指定的编码方案翻译成统一的UTF-8 JAVA源码(即.java),如果pageEncoding设定错了,或没有设定,出来的就是中文乱码。

  第二阶段是由JAVAC的JAVA源码至java byteCode的编译,不论JSP编写时候用的是什么编码方案,经过这个阶段的结果全部是UTF-8的encoding的java源码。

  JAVAC用UTF-8的encoding读取java源码,编译成UTF-8 encoding的二进制码(即.class),这是JVM对常数字串在二进制码(java encoding)内表达的规范。

  第三阶段是Tomcat(或其的application container)载入和执行阶段二的来的JAVA二进制码,输出的结果,也就是在客户端见到的,这时隐藏在阶段一和阶段二的参数contentType就发挥了功效

  contentType的設定.

  pageEncoding 和contentType的预设都是 ISO8859-1. 而随便设定了其中一个, 另一个就跟着一样了(TOMCAT4.1.27是如此). 但这不是绝对的, 这要看各自JSPC的处理方式. 而pageEncoding不等于contentType, 更有利亚洲区的文字 CJKV系JSP网页的开发和展示, (例pageEncoding=GB2312 不等于 contentType=utf-8)。其他的语言也对应不同的charset,比如日文的字符集是“iso-2022-jp ”,韩文的是“ks_c_5601”。Content-Type的Content还可以是:text/xml等文档类型;Charset选项:ISO-8859-1(英文)、BIG5、UTF-8、SHIFT-Jis、Euc、Koi8-2、us-ascii, x-mac-roman, iso-8859-2, x-mac-ce, iso-2022-jp, x-sjis, x-euc-jp,euc-kr, iso-2022-kr, gb2312, gb_2312-80, x-euc-tw,x-cns11643-1,x-cns11643-2等字符集;Content-Language的Content还可以是:EN、FR等语言代码。

    ContentType属性指定了MIME类型和JSP页面回应时的字符编码方式。MIME类型的默认值是“text/html”; 字符编码方式的默认值是“ISO-8859-1”. MIME类型和字符编码方式由分号隔开

    pageEncoding的内容只是用于jsp输出时的编码,不会作为header发出去的。
    pageEncoding   是通知web server jsp的编码。

  jsp文件不像.java,.java在被编译器读入的时候默认采用的是操作系统所设定的locale所对应的编码,比如中国大陆就是GBK,台湾就是BIG5或者MS950。而一般我们不管是在记事本还是在ue中写代码,如果没有经过特别转码的话,写出来的都是本地编码格式的内容。所以编译器采用的方法刚好可以让虚拟机得到正确的资料。

  但是jsp文件不是这样,它没有这个默认转码过程,但是指定了pageEncoding就可以实现正确转码了。

  举个例子:

<%@ page contentType="text/html;charset=utf-8" %>

  大都会打印出乱码,因为输入的“你好”是gbk的,但是服务器是否正确抓到“你好”不得而知。

  但是如果更改为

<%@ page contentType="text/html;charset=utf-8" pageEncoding="GBK"%>

  这样就服务器一定会是正确抓到“你好”了。

分享到:
评论

相关推荐

    PageEncoding&contentType中charset区别

    3. **使用meta标签声明字符集**:除了在JSP页面中通过`contentType`指定字符集外,还可以在HTML头部使用&lt;meta&gt;标签再次声明字符集,增加兼容性。 综上所述,正确理解和使用`pageEncoding`和`contentType`对于确保...

    jsp中charset和pageEncoding

    3. **设置统一的默认编码**:在应用级别或服务器配置中设置统一的字符集和页面编码,这样就不必在每个页面中显式指定。 综上所述,通过正确配置JSP页面中的字符集和页面编码,可以有效地避免乱码问题,提高Web应用...

    怎么解决JSP页面中文问题20100901

    当这两行都存在时,需要保持`pageEncoding`和`contentType`中的字符集一致,以便正确处理中文字符。 2. **统一浏览器的解码设置** 在HTML头部可以通过`&lt;meta http-equiv="Content-Type" content="text/html;...

    jsp页面文档编码问题

    - 使用HTTP头或meta标签在HTML中再次声明字符编码,以确保浏览器在没有`contentType`信息时也能正确解析页面。 总的来说,理解和正确使用`contentType`和`pageEncoding`是解决Java Web开发中乱码问题的关键。通过...

    字符集和乱码解决方案

    charset=UTF-8"&gt;来指定字符集,並在JSP頁面中使用&lt;%@ page pageEncoding=”UTF-8”%&gt;来指定字符集。 3. 在Request中统一字符集,使用request.setCharacterEncoding(“utf-8”)来指定字符集。 4. 在Response中统一...

    JSP中文乱码问题完全解决方案(罗列了在JSP学习中出现的各种乱码问题)

    1. **设置页面编码:** 在`&lt;head&gt;`标签内使用`&lt;meta&gt;`标签指定文档的字符集为GB2312或其他支持中文的编码,例如: ```html &lt;meta http-equiv="Content-Type" content="text/html; charset=gb2312"&gt; ``` 2. **设置...

    jsp 倒计时载入页面

    - 11秒后自动跳转到另一个页面(由`meta`标签设置)。 综上所述,这个示例不仅展示了如何在JSP页面中使用JavaScript来实现倒计时功能,还体现了JSP页面与其他Web技术(如HTML和JavaScript)的结合使用,以增强页面...

    乱码问题解决

    - `contentType`中的`charset`应该与前端页面的`meta`标签中指定的字符集一致。 #### 四、总结 通过上述分析,我们可以看到`charset`与`pageEncoding`在JSP页面中的作用不同,但都与字符编码密切相关。为了有效...

    Jsp页面在URL中传递参数会出现乱码问题解决

    5. **前端处理**:除了服务器端的处理,前端页面也需要设置正确的字符集,例如在HTML的`&lt;meta&gt;`标签中指定`charset`属性。 6. **编码转换**:在某些情况下,可能需要进行编码转换,例如在不同编码格式之间进行数据...

    JSP中文乱码的产生原因及解决方案.docx

    如果JSP页面没有明确指定字符集,比如在`&lt;head&gt;`部分通过`&lt;meta&gt;`标签或在页面指令中定义`contentType`,当页面中存在中文字符且默认的ISO-8859-1字符集无法识别中文时,会出现乱码。此时,只需在JSP文件的开头添加...

    JSP出现中文乱码问题解决方法详解.docx

    确保在`&lt;head&gt;`标签内添加`&lt;meta charset="UTF-8"&gt;`或根据实际编码设置相应的字符集,如`&lt;meta http-equiv="Content-Type" content="text/html; charset=GBK"&gt;`。 2. JSP动态输出中文乱码:在JSP文件顶部声明页面...

    解决JSP中文乱码问题.doc

    - **编码字符集设置不一致**:在JSP文件中可能存在多处设置字符集的地方,如`pageEncoding`属性、`contentType`属性以及HTML头部的`Content-Type`元标签。这些设置需要保持一致,否则会导致乱码。例如,如果`...

    JSP中文乱码解决集锦

    - 在HTML部分,`&lt;meta&gt;`标签也可以设置页面的字符集,如`&lt;meta http-equiv="Content-Type" content="text/html; charset=UTF-8"&gt;`。确保这三个地方的编码保持一致,是避免JSP中文乱码的基本原则。 2. **表单POST...

    jsp eclipse乱码问题

    这里设置了`contentType`和`pageEncoding`属性,分别用于指定HTTP响应的内容类型和JSP页面本身的编码方式。 - 在HTML头部加入`&lt;meta http-equiv="Content-Type" content="text/html; charset=UTF-8"&gt;`。确保客户端...

    JSP乱码处理

    JSP 乱码处理是 Web 开发中常见的问题之一,解决乱码问题需要了解 JSP 页面的编码机制和相关设置。本文将详细介绍 JSP 乱码处理的各种解决方法。 1. PageEncoding 属性 JSP 文件的存储格式是通过 pageEncoding ...

    解决html,servlet,sql,java console中文问题

    - 通过在 `[mysqld]` 和 `[client]` 区域分别设置 `default-character-set=gbk` 来改变数据库服务器和客户端的默认字符集,确保在与数据库交互过程中中文能够被正确处理。 通过以上步骤,可以有效地解决 HTML、...

    jsp中文乱码问题解决方案

    解决JSP中文乱码问题需要关注多个环节,包括JSP页面的编码设置、请求和响应处理、文件操作、数据库操作以及开发工具的配置。只有确保每个环节都正确处理字符编码,才能彻底解决中文乱码的问题。在实际开发中,养成...

    jsp乱码解决

    1. **页面内部编码不一致**:如果JSP页面的声明部分、HTML头部的`meta`标签以及`out.println()`输出流的编码不统一,会导致显示乱码。 ```jsp &lt;%@ page language="java" contentType="text/html; charset=UTF-8...

Global site tag (gtag.js) - Google Analytics