`
licg1234
  • 浏览: 49882 次
  • 性别: Icon_minigender_1
  • 来自: 长沙
社区版块
存档分类
最新评论

java web 乱码解决心得

阅读更多

 

关于jsp,ajax乱码问题网上可以搜集到一堆资料,可是大部分都是在讲如何应用。我这里主要说下我个人理解的浏览器端与服务器端乱码问题的根源与原理。

 

   首先,要说明的是服务端(如:tomcat)与浏览器端(如:ie)底层实现都是基于socket通信的(不了解的朋友可以自己去学习下socket  )。那么好的,如果各位自己实现socket通信的话肯定会也会处理这个编码问题。例如,我自己写个socket实现,我规定socket两端都采用"UTF-8"编码,那么两端的消息接收肯定不会出现乱码问题了。好的进一步扩展,如果我socket两端都不限定编码,并且socket客户端访问服务端接收到消息后便暂时关闭。那么各位该如何制定消息接收完毕,消息发出,编码等一系列规则呢(恐怕大家到这里就想到了这不就是http协议吗 )。哦继续,那么现在我们就可以吧浏览器端(如ie)看成一个socket的客户端,服务器端(如tomcat)就是一个socket服务端(大家记好这里 socket客户端就是指 浏览器,socket服务端就是指的  服务器,以后我可要用了啊)。

 

   进入正题,首先说页面显示,浏览器socket客户端接收到服务端的数据内容,那么客户端如何知晓服务端发送的内容需要用什么编码格式展示呢。http协议规定,根据接收到的<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">中的编码格式来显示页面的。,哈哈大家知道了吧,如果你自己写一个http socket客户端那么我们也是一定也是这样那么如果你的页面后台编码不是charset这里规定的格式,那么能不能正常显示到浏览器页面那么只能够听天由命了。注意,这里要说明的是:

 

response.setContentType("text/html;charset=gb2312")是设置页面中为gb2312编码,设置页面静态文字  
response.setContentType指定 HTTP 响应的编码,同时指定了浏览器显示的编码.  
response.setCharacterEncoding设置HTTP 响应的编码,如果之前使用  
response.setContentType设置了编码格式,则使用  
response.setCharacterEncoding指定的编码格式覆盖之前的设置.  
与response.setContentType相同的是,调用此方法,必须在getWriter执行之前或  
者response被提交之前.  
  
另外需要说明的是  
response.setContentType("text/html; charset=UTF-8");与页面中  
<meta http-equiv="Content-Type" content="text/html; charset=GBK">  
作用相同。  
但如果response.setContentType("text/html; charset=UTF-8");与页面中  
<meta http-equiv="Content-Type" content="text/html; charset=GBK">  
中都存在,则以response.setContentType("text/html; charset=UTF-8");为  
主.  
 

 

 

        然后说大家遇到比较多的问题,request.getParameter("")获得的结果为乱码这个问题。服务端根据http协议是通过“URL编码”来获得客户端socket提交的信息的。如果不懂“URL编码”,大家这里http://baike.baidu.com/view/204662.htm ,我这里给大家解释下,

看一个简单页面:

 

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=GBK">
<title>Insert title here</title>
</head>
<body>
<form action="TestPostContent.jsp" method="post">
  <label for="username">username</label><input type="text" name="username" /><br/>
  <label for="password">password</label><input type="text" name="password" /><br/>
  <button type="submit">submit</button>
</form>
</body>
</html> 

 

 那么这个post 方式的 form表单里面的两个值是如何发送到后台的呢,

  需要先将这两个input的值转化为GBK编码(转化为GBK编码的原因过会再说),然后在将结果在进行“URL编码”,

例如我们发送的两个值分别是 username=你好  ,password=你好 .那么最后提交的数据内容就会是

username=%C4%E3%BA%C3&password=%C4%E3%BA%C3。至于具体过程还要大家多多理解下“URL编码”.

 

这里是个重点大家要记清楚:http post提交的表单内容信息通过“URL编码”发送给服务端。

 

    这里说说为什么要用GBK对上面那个表单编码,这里恐怕大家同样也猜到了<meta http-equiv="Content-Type" content="text/html; charset=GBK">,对就是这里,

http协议的规定post提交的内容根据Content-Type的字符编码类型进行编码。

稍微做个总结:post提交的数据编码格式根据Content-Type,编码后在进行“URL编码”,然后发送给服务端.

 

    那么到了这里该说说get方式的提交了,或者说 url地址栏的内容信息提交(不懂这里说的get方式,只能自己补下了)

好的,这里大家可以这么考虑(实际上也是这样),url地址栏的内容是可以手动输入的,那么这里url的编码便于操作系统环境有关系了,例如:中国的xp用户 编码格式为GBK,中国台湾的xp用户 编码格式为BIG5。而浏览器中socket便直接将url地址栏里面的内容提交上去了,什么操作转码啊都没有进行。哦,说到这里,大家恐怕也理解了为什么不同浏览器get提交的编码格式不同(环境不同,默认编码不同)。

 

  OK说说服务端接收信息的方式,即:request.getParameter("").  服务端socket根据http协议(我自己的理解),接收到信息之后,首先进行一次url解码(url编码的反过程)。这个在tomcat解码默认为iso-8859-1.  这里还要说明一点,comcat中 如果设置了request.setCharacterEncoding("utf-8"),那么post提交的数据解码过程便是根据utf-8,但是这个request.setCharacterEncoding("utf-8")并不对get提交的数据内容起作用(为什么,默认如此,我也不知道)。 

 

 

  好的综上所述,做个总结:

     1.客户端浏览器显示页面的编码根据<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">,否则如果没有设置这个地方的编码,便与浏览器有关。

     2.客户端浏览器get提交的数据url中是什么样子,那么后台获得的便是什么样子。例如:浏览器默认环境对url是GBK编码,那么服务器端获得的内容便是GBK编码。

    3.post提交的数据编码格式根据Content-Type,编码后在进行“URL编码”,然后发送给服务端.。同上,如果没有设置这个地方的编码格式,编码格式便与浏览器有关。

 

 

     4.服务端request.getParameter("")接收数据,首先进行一次解码(不管是什么数据类型,都要解码   既:               URLDecoder.decode(url,charset))

     其中如果是get方式提交的数据,这里的charset便是与服务器默认有关了例如:tomcat解码默认为iso-8859-1.

     如果是post方式提交的数据,这里charset的值获得方式为如下两步:

               (1)request.getCharacterEncoding("utf-8"),如果获得的编码格式不为空,好的,解码用这种格式(不走第二步了)如果获得的编码格式为空,好的只能进行第二步了

               (2)   与服务器默认post解码格式    例如:tomcat解码默认为iso-8859-1.

 

 

    5.服务端与客户端分开看,它们各自拥有着自己的编码格式。至于怎么编码,就是我上面做的总结了。

 

     大家在遇到乱码问题是,多多考虑以上几条。

 

 

      另外着重说明:ajax post提交的数据么有进行“URL编码”.(为什么这么实现,我也不清楚 ,我在想如果浏览器进行了url编码,我们做ajax实现不就省事了吗)。这也就是为什么ajax post提交数据时候为什么encodeURI(encodeURI('中文')) 进行两次的原因了(大家自己具体思考下哈。我给大家提个醒,url原始数据old编码一次后,得到的数据假设为 a ,那么 a 全是ascii可以接受的值,在编一次之后得到b,数据b提交到了客户端。那么服务端第一次解析数据b的时候,不管是采用那种URLDecoder.decode(url,charset)编码格式解析,得到的肯定是还是a,因为a是纯ascii编码。好的这时候我们在对a 进行一次解码后那么我们就得到了url原始数据old).

 

 

 

 

 

 

分享到:
评论

相关推荐

    JavaJSP中文乱码问题解决心得.doc

    ### Java/JSP中文乱码问题解决心得 #### 一、Java中文问题的由来 Java作为一种广泛使用的编程语言,其核心设计目标之一就是提供良好的跨平台能力。为此,Java采用了Unicode作为其内部处理字符的标准,这使得Java...

    J2EE平台下的乱码问题分析及解决

    此外,解决汉字乱码问题还需要注意如下几点心得: - 对于不同版本的Java,它们的默认编码可能不同,需要根据实际的Java版本进行相应的编码设置。 - 在进行国际化软件开发时,应该避免在系统中使用默认编码,而应该...

    web实训开发心得.pdf

    Servlet是Java编程语言中的一个接口,用于生成动态Web内容,而JSP则是用于创建动态网页的视图技术。两者共同构成了Web应用的控制层和显示层。 首先,Servlet是基于HTTP协议的,它处理来自客户端(浏览器)的请求并...

    javaweb学习心得.doc

    Java Web 学习心得 Java Web 学习心得是指学习 Java Web 开发相关技术的经验总结,涵盖了 HTML、CSS、JavaScript、XML、DTD/Schema、Java EE 中的 JSP、Servlet、Filter、Listener、JSTL、EL、JQuery、Ajax 等技术...

    web实训开发心得.docx

    过滤器可以用来处理乱码问题,实现URL重写,或者进行权限控制;监听器则可以用于跟踪用户的在线状态或统计网站访问量。 在数据库操作方面,通常会使用JDBC来连接和操作数据库,但随着ORM(对象关系映射)框架如...

    【Java+Project】

    这些项目可能涵盖Web开发、数据库集成、图形用户界面设计等多个方面,帮助学习者将Java技能应用于解决实际问题。 ### .NET框架简介 尽管主要讨论Java,但“.NET”这一标签表明资源可能也涉及微软的.NET框架。.NET...

    Java中的字符编码问题处理心得总结

    总结几点处理Java字符编码问题的心得: 1. **始终坚持使用Unicode编码**:Unicode是跨语言的标准,能处理多种字符集,减少乱码风险。 2. **谨慎使用`String.getBytes()`**:不指定字符集可能导致依赖于JVM的默认...

    jdk+tomcat+jfreechart+sql_server2000安装心得

    5. **解决乱码问题**: - 修改`conf/server.xml`文件中的`&lt;Connector&gt;`标签,添加`URIEncoding="GBK"`参数: ``` ``` #### JFreeChart 配置 1. **部署JFreeChart**: - 将JFreeChart的相关JAR文件(至少5个...

    JSP初学心得

    - **字符编码转换**:在处理中文等非英文字符时,经常会出现乱码问题。为了解决这个问题,可以采用特定的编码格式进行转换。例如,将字符串从ISO-8859-1编码转换为UTF-8编码: ```java String title = ""; byte[]...

    S2SH框架搭建和心得

    S2SH(Struts2、Spring、Hibernate)是一个经典的Java Web开发框架组合,它整合了三个强大的开源组件,以提供模型-视图-控制器(MVC)架构的解决方案。对于初学者来说,理解并熟练掌握S2SH框架的搭建过程是迈向专业...

    一个dao模式的实验报告

    在这个实验报告中,学生周媛娣通过Java Web开发实践,使用DAO模式实现了对数据库的操作,包括增加、查询等基本功能。 1. **DAO模式的理解**: DAO模式的核心思想是创建一个对象(DAO),该对象封装了对数据库的...

    weblogic10配置

    本篇文章将深入探讨"weblogic10配置"这一主题,包括WebLogic 9.x与XFire 1.2.6之间的冲突解决心得以及WebLogic服务器上的中文乱码处理方法。 一、WebLogic 9.x与XFire 1.2.6冲突解决 1. **冲突原因**:WebLogic 9....

    PHP面试题及答案,另附学习心得

    - **PHP与Java的整合**: PHP可以直接创建Java对象进行交互。 #### 五、版本控制工具 **题目**: 常用的版本控制工具有哪些? **解答**: 主要有两种: - **CVS**: 较老的版本控制系统,仍然在一些项目中使用。 - **...

    南理工J2EE实验报告

    - **中文乱码问题**:确保整个开发环境中都使用UTF-8编码,包括服务器设置、数据库设置以及程序中的字符集编码。 - **Servlet配置问题**:确保`web.xml`文件正确配置Servlet的初始化参数及URL映射。 #### 实验...

    Eclipse 安装配置总结.doc

    - **Tomcat**:支持Web应用程序的开发和测试。 - **Spring Tool Suite (STS)**:提供Spring框架相关的功能。 - **Maven Integration for Eclipse**:支持Maven项目管理。 - **JDBC Drivers**:数据库连接支持。 ...

    ireport快速入门指南

    iReport还解决了不少在报表设计中可能遇到的问题,比如中文字体乱码和PDF中无法正常显示的问题、报表分栏显示、去除记录中的null值、实现奇偶行不同背景颜色的交替显示、格式化输出、柱状图的横向显示、主报表和子...

    Oracle EBS 开发笔记

    - **Form乱码解决**:解决字符编码问题导致的乱码现象。 - **利用TEMPLATE.fmb模板来开发Form**:基于模板快速开发Form。 - **注册表单FORM**:将开发的Form注册到EBS系统中。 - **注册请求**:创建并配置请求...

    spring-tool-suite-3.7.0.RELEASE-e4.5-linux-gtk-x86_64.tar.gz

    - **社区资源**:积极利用官方文档、论坛等资源解决问题,也可以参与到社区中分享经验和心得。 #### 6. 更新与维护 由于提供的文件名中包含的是一个较旧的版本(3.7.0.RELEASE),建议定期检查官方发布的最新版本...

    XML轻松学习手册--XML肯定是未来的发展趋势,不论是网页设计师还是网络程序员,都应该及时学习和了解

    我想就我个人学习过程的心得和经验,写一篇比较全面的介绍文章。首先有两点是需要肯定的:  第一:XML肯定是未来的发展趋势,不论是网页设计师还是网络程序员,都应该及时学习和了解,等待只会让你失去机会;  ...

Global site tag (gtag.js) - Google Analytics