`
wezly
  • 浏览: 490577 次
  • 性别: Icon_minigender_1
  • 来自: 长沙
社区版块
存档分类
最新评论

中文乱码问题处理

阅读更多

在开发中,总会碰到各种中文乱码问题,下面稍作总结。

1、数据库的乱码

出现乱码问题,我们第一反应应该是:是否数据库字符编码设置有问题。以mysql为例,装好mysql后进入安装目录,打开my.ini配置文件查看mysql设置的编码。在my.ini中有两处设置字符编码的地方,分别是[mysql]下的default-character-set及[mysqld]下的default-character-set。熟悉linux的朋友都知道以d结尾的表示服务端,如你想那样,[mysql]设置的字符编码是客户端的,[mysqld]设置的字符编码是mysql服务器端的编码。我们的数据就是存储在mysql服务器端的,为了能存下任何字符编码的数据,我们一般设置[mysqld]下的default-character-set=utf8(注意,不是utf-8)。代表客户端的[mysql]下的default-character-set应该怎么设置呢,一般朋友可能也设置成utf8,这可能会出问题的。如果这样设置的话,当我们"运行cmd"打开DOS窗口,通过"mysql -uroot -p123"命令进入mysql的客户端后,我们是不能插入中文的。道理很简单,这是因为我们的操作系统的字符编码是GBK(或GBK兼容),我们在DOS窗口输入的中文(如:insert into test values('中文'))自然也是GBK的,而我们[mysql]设置的却是utf8,因为不兼容所以会出错。当然,如果我们使用相关mysql的GUI客户端工具,进行相关设置,即使[mysql]设置成utf8也没问题。但如果通过DOS窗口登陆mysql客户端时,一般要设置[mysql]下的default-character-set=GBK。

总结:[mysql]下default-character-set=GBK,[mysqld]下default-character-set=utf8

2、使用GET请求的乱码

如果一个请求是GET方式时,比如<a href="url">标签指定的请求如form表单以GET方式提交,我们可以在浏览器地址栏上看到类似http://localhost/proj/a.do?title=%C4%E3%BA%C3 这样的URL。像这样2个(%加上2位16进制数)表示一个中文,这是用ISO8859-1(即lantin1)进行的编码。对于这样用GET请求的URL中的中文字符,我们是不能通过设置request.setCharacterEncoding("UTF-8")来解决的。

解决方法有两种:

第一种方法是用 title = new String(title.getBytes("ISO8859-1"), "UTF-8");  来对每个有中文的请求参数进行解码再编码,这种方法比较繁琐;

第二种方法是修改tomcat的server.xml配置文件,把<Connector port="8080" ...>修改成 <Connector port="8080" ... URLEncoding="UTF-8">,即在<Connector>元素中指定其URLEncoding="UTF-8",其默认值为lantin1。这属性指定了URL的编码,设置成UTF-8后,地址栏上就不会再出现 a.do?title=%C4%E3%BA%C3 之类的内容了,而是 a.do?title=中文 。

这种方法的缺点是,其它项目或该项目其它地方可能会因为修改而引入了新的中文编码问题,比如使用这种方法之后,有些地方使用了第一种方法处理好了的中文将会再次变成乱码。这种方法不常用,可能牵一发而动全身。

3、使用POST请求的乱码

对于form表单以POST提交的请求,可以用request.setCharacterEncoding("UTF-8")来解决。至于为什么这种方法对POST请求有效而对GET请求无效,请参考HTTP协议中GET与POST请求的差别,简单来讲就是GET请求的内容放在请求头里,POST请求是放在请求体来。一般来讲我们可以通过给项目增加一个字符集过滤器来一次性解决POST请求的中文乱码。过滤器里的内容非常简单,就是调用request.setCharacterEncoding(encoding),encoding是我们要设置的字符集。过滤器可以自己编写,也可以使用spring提供的org.springframework.web.filter.CharacterEncodingFilter。


综上所述我们在中文乱码这个问题上,一般的做法如下:

1、编码集用UTF-8而不是GBK

2、给我们的应用加上一个字符集过滤器

3、所有的Form表单都以POST进行提交

4、用链接<a href="a.do?name=中文">进行的提交,最好用new String(title.getBytes("ISO8859-1"), "UTF-8")来解决而不是修改tomcat的配置文件

分享到:
评论

相关推荐

    05 QString字符串处理及中文乱码问题处理.zip

    这篇教程“05 QString字符串处理及中文乱码问题处理”显然会深入探讨如何在Qt应用中有效地管理和解决中文乱码问题。 首先,QString的构造和基本操作是其核心内容。你可以通过各种方式创建一个QString对象,比如直接...

    jsp页面传值中文乱码问题处理.docx

    jsp页面传值中文乱码问题处理 在 JSP 页面中传值时,中文字符可能会出现乱码问题,这是由于字符编码不一致所引起的。下面将详细讲解 JSP 中文乱码种类和解决方案。 JSP 文件中文内容显示乱码 在 JSP 文件中,如果...

    IDEA编辑中文乱码问题处理方法.docx

    IntelliJ IDEA编辑中文乱码问题处理方法 一、问题详情 在使用 IntelliJ IDEA 编辑中文代码时,经常会出现乱码问题,例如新建 JS 代码,编辑好代码之后,重新加载,页面内容显示乱码。这种问题的出现是因为 ...

    中文乱码问题处理方法.docx

    中文乱码问题处理方法 在Web开发中,中文乱码问题是一个常见的问题,特别是在JSP页面、URL传递参数、表单提交、数据库连接等方面。为了解决这些问题,本文总结了几种常见的中文乱码问题处理方法。 1. JSP页面显示...

    解压文件时中文乱码问题处理

    在IT行业中,中文乱码问题是一个常见的困扰,尤其是在处理压缩文件时。本文将详细探讨如何在使用7-Zip软件解压文件时解决中文乱码问题,以及如何在C#编程环境中处理这一问题。 首先,我们需要了解乱码产生的原因。...

    java中文乱码问题处理集锦

    ### Java中文乱码问题处理集锦 #### 一、引言 在Java开发过程中,中文乱码问题是开发者经常遇到的问题之一。特别是在处理不同编码格式的数据时,如从数据库读取数据、读写文件或者在网络传输过程中,很容易出现中文...

    java中文乱码问题处理方案.docx

    这样做可以确保Java系统在处理和显示汉字时不会出现乱码问题。 除了上述的编码设置外,还应该注意以下几点: 1. 检查并设置Java文件的编码:在Eclipse或IntelliJ IDEA等集成开发环境中,应确保新建文件的默认编码...

    中文乱码问题

    表单处理的中文乱码问题 在表单处理中,中文乱码问题可以通过设置请求字符编码来解决。我们可以在 Servlet 中添加以下代码: `request.setCharacterEncoding("UTF-8");` 这将设置请求字符编码为 UTF-8,从而解决...

    中文乱码问题处理.docx

    中文乱码问题在IT行业中是常见的困扰,尤其是在处理Web应用中的数据传递时。问题的核心在于字符编码的不同导致的解析混乱。这里我们详细分析一下解决中文乱码问题的两种方法及其失败原因。 首先,方法1是基于ISO-...

    c#汉字乱码处理

    在C#编程中,处理汉字乱码问题是一个常见的需求,尤其是在读取或写入文本文件时。当在C#控制台应用中遇到汉字输出乱码的情况,这通常是因为编码不匹配所导致的。编码是字符集与二进制数据之间的转换规则,不同的系统...

    彻底解决中文乱码的问题

    在IT行业中,尤其是在Java编程领域,中文乱码问题是一个常见的挑战。这主要涉及到字符编码的处理,涉及到Unicode、GBK、UTF-8等不同编码格式之间的转换和一致性问题。本篇文章将深入探讨这个问题,并提供一种彻底...

    hadoop中文乱码问题

    然而,在处理包含中文字符的数据时,用户可能会遇到中文乱码的问题。这个问题通常出现在数据读取、存储或输出的过程中,对数据分析和应用造成困扰。本篇将深入探讨Hadoop中文乱码问题的原因及解决方案。 首先,我们...

    Lua文件反编译汉字乱码处理

    然而,当处理含有汉字的Lua文件时,反编译过程中可能会出现汉字乱码的问题,这主要与字符编码不匹配有关。本文将详细介绍如何在C#环境下,特别是使用Visual Studio 2013时,解决Lua文件反编译后的汉字乱码问题。 ...

    中文乱码处理问题总结

    ### 中文乱码处理问题总结 #### 一、引言 在进行中文字符处理时,经常会出现乱码问题。这主要是因为不同的系统、程序或组件可能采用不同的编码方式,而这些编码方式之间的转换不当就会导致乱码现象。本文将重点...

    sqlite3 for delphi 解决中文乱码问题

    "sqlite3 for delphi 解决中文乱码问题"这个主题,正是针对这一问题提供了解决方案。这里我们将详细探讨SQLite3在Delphi中的应用,中文乱码的成因,以及如何通过自定义修改来解决这个问题。 首先,SQLite3是一个轻...

    Weblogic中文乱码问题的处理.docx

    【Weblogic中文乱码问题处理】 在Weblogic服务器运行Java应用程序时,中文字符的正确处理是开发者面临的一个常见挑战。由于编码和解码过程中的不匹配,中文字符可能会显示为问号或奇怪的符号,这被称为乱码问题。...

    中文乱码问题整理总结

    ### 中文乱码问题整理总结 #### 一、引言 在软件开发过程中,中文乱码问题时常困扰着开发者。本文旨在通过对字符编码原理及常见编码格式的理解,深入剖析中文乱码产生的根本原因,并提供相应的解决方案。通过日常...

    解决sql anywhere 11 汉字乱码问题

    在开发基于C++ Builder的...通过以上分析和步骤,你应该能够有效地解决SQL Anywhere 11中遇到的汉字乱码问题,确保你的数据库应用能够正确处理中文数据。在实际操作中,如果遇到困难,建议查阅官方文档或寻求社区支持。

    关于处理中文乱码问题 Filter 代码

    在IT行业中,中文乱码问题是一个常见的困扰,尤其是在处理文本数据时。本文将重点解析“关于处理中文乱码问题 Filter 代码”的相关知识点,并结合Java Servlet API进行详细讲解。 首先,我们要理解什么是Filter...

    Navicat for MySql 导入EXCEL中文乱码问题解决

    在使用Navicat for MySQL工具进行数据导入时,经常会出现中文乱码的问题,尤其是在处理Excel文件时更为常见。这种现象不仅影响数据的正确性,还可能导致后续的数据分析和处理出现错误。因此,有效地解决Navicat for ...

Global site tag (gtag.js) - Google Analytics