- dikar
- 等级: 初级会员
- 性别:
- 文章: 40
- 积分: 50
- 来自: 杭州
|
xml 代码
- 经常遇到关于JSP页面乱码的问题,在网上也查了相关的帖子,故在此做个关于JSP页面乱码处理的总结,和大家一同分享。
- 首先先介绍几个关于页面编码参数设置的属性。
-
- <META http-equiv=Content-Type content="text/html; charset=gb2312">
- 这句话的意思是你浏览器查看网页的编码方式为中文,类似于浏览器上查看选项的字符编码设置,如果你查看中文的页面,你设置为UTF8查看的话,就会显示为乱码或者说是问号。所以这个属性只是用来设置浏览器显示数据的字符编码。
- 下面我们具体说一下这个属性
- META,网页Html语言里Head区重要标签之一
- HTTP-EQUIV类似于HTTP的头部协议,它回应给浏览器一些有用的信息,以帮助正确和精确地显示网页内容。常用的HTTP-EQUIV类型有:
- Content-Type和Content-Language (显示字符集的设定)
- 说明:设定页面使用的字符集,用以说明主页制作所使用的文字以及语言,浏览器会根据此来调用相应的字符集显示page内容。
- <Meta http-equiv="Content-Type" Content="text/html; Charset=gb2312">
- 该META标签定义了HTML页面所使用的字符集为GB2132,就是国标汉字码。如果将其中的“charset=GB2312”替换成“BIG5”,则该页面所用的字符集就是繁体中文Big5码。当你浏览一些国外的站点时,IE浏览器会提示你要正确显示该页面需要下载xx语支持。这个功能就是通过读取HTML页面META标签的Content-Type属性而得知需要使用哪种字符集显示该页面的。如果系统里没有装相应的字符集,则IE就提示下载。其他的语言也对应不同的charset,比如日文的字符集是“iso-2022-jp ”,韩文的是“ks_c_5601”。Content-Type的Content还可以是:text/xml等文档类型
- Charset选项:ISO-8859-1(英文)、BIG5、UTF-8、SHIFT-Jis、Euc、Koi8-2、us-ascii, x-mac-roman, iso-8859-2, x-mac-ce, iso-2022-jp, x-sjis, x-euc-jp,euc-kr, iso-2022-kr, gb2312, gb_2312-80, x-euc-tw, x-cns11643-1,x-cns11643-2等字符集;Content-Language的Content还可以是:EN、FR等语言代码。
- Note:因为我们的浏览器一般都指定为中文字符编码查看,所以这句就不用加在你的页面当中,你加了也可以更强调也好。
-
- 2。page contentType — 指定的是JSP页最终 Browser(客户端)所见到的网页内容的编码.其实用在容器中就是说把JSP页面输出为HTML页面采用的编码方式。要把这个与第一个属性有所区别。
- 3。page pageEncoding — 指定JSP解码时所用的编码
- 如果你的是 WIN98, 或 ME 的NOTEPAD记事本编写JSP, 就一定是常用的是Big5 或 gb2312, 如果是用 WIN2k winXP的NOTEPAD时, SAVE时就可以选择不同的编,码, 包括 ANSI(BIG5/GB2312)或 UTF-8 或 UNIONCODE(估是 UCS 16).
- 因为 JSP要经过 两次的”编码”,
- 第一阶段会用 pageEncoding, 第二阶段会用 utf-8 至utf-8, 第三阶段就是由TOMCAT出来的网页, 用的是contentType.
- 阶段一是 JSPC的 JSP至JAVA(.java)原码的”翻译”, 它会跟据 pageEncoding 的设定读取JSP. 结果是由指定的pageEncoding(utf-8,Big5,gb2312)的JSP 翻译成统一的utf-8 JAVA原码(.java). 如果pageEncoding设定错了, 或没设定(预设ISO8859-1), 出来的 在这个阶段 就已是中文乱码.
- 阶段二是由 JAVAC的JAVA原码至JAVA BYTECODE的编译. 不论JSP的编写时是用(utf-8,Big5,gb2312),经过阶段一的结果全都是utf-8的ENCODING的JAVA原码.
- JAVAC用 utf-8的ENCODING读取AVA原码, 编译成字符串是 utf-8 ENCODING的二进制码(.class). 这是 JAVA VIRTUAL MACNHINE对常数字符串在 二进制码(JAVA BYTECODE)内表达的规范.阶段三是TOMCAT(或其的application container)加载和执行阶段二得来的JAVA二进制码, 输出的结果( 也就是BROWSER(客户端))
- 见到的. 这时一早隐藏在阶段一和二的参数contentType, 就发挥了功效. (见 阶段一的 ).
- 4。request.setCharacterEncoding("gb2312")指定对请求采用中文编码发送。浏览器默认的是采取UTF8编码方式发送请求,不能识别中文字符。
- 5。response.setContentType(”text/html; charset=gb2312″);设置响应时发送数据的编码方式。
-
- 总结了一大堆,现在来说下怎么解决JSP页面中文问题
- 一般性的解决,只要在每个JSP页面开始处加入下面三行代码即可:
-
- 为了让JSP编译器能正确地解码我们的含有中文字符的JSP文件
- <%@ page pageEncoding="gb2312"%>
-
- 保证JSP向客户端输出时是采用中文编码方式输出
- <%@ page contentType="text/html;charset=GB2312"%>
-
- 为了让JSP能正确获得传入的参数
- <%request.setCharacterEncoding("gb2312");%>
-
- 对于SERVLET只要在最前面加上这句即可:
- 为了让JSP响应按照正确的编码格式
- response.setContentType(”text/html; charset=gb2312″);
声明:ITeye文章版权属于作者,受法律保护。没有作者书面许可不得转载。
|
返回顶楼 |
|
|