五、对URL做Encode和Decode
对于request参数的中文乱码问题,个人觉得最好的还是用URLEncode/URLDecode,因为如果你的WEB站点要支持国际化,最好就是保证从IE递送过来的参数永远是正确的UTF-8编码。
在IE端,我们可以用JS脚本来对参数编码:encodeURIComponent(),编码后中文字符便变成了%B4%F3%BC%D2%BA%C3这种形式。在JAVA端,可以用java.net.URLDecoder.decode来解码。不过这里要注意一个问题,就是TOMCAT会自动先对URL 做一次decode,我们可以在TOMCAT的UDecoder类中看到这一点。不过TOMCAT并非使用了URLDecoder.decode,而是自 己编写了一个decode函数。网上有些文章上介绍过一种处理乱码的方法便是在JS中对参数做两次encodeURIComponent,在JAVA中做 一次decode,可以解决一些没有设置URIEncoding时发生的乱码问题。不过个人觉得如果弄懂了整个字符编码转换的过程,基本上是用不到这种方法的。
六、从数据库中读取中文字符数据,在页面上显示为乱码。
对于数据库中读取中文字符出现乱码的问题,本人遇到的还比较少,所以暂时没有总结。如果大家有类似的经验,欢迎补充说明,我一定注明作者身份。
好了,对各种字符乱码问题的分析就总结到这里,相信只要把握“以指定编码读取--转换为UNICODE--以指定编码输入”这基本步骤,初学者也可以很快 分析出字符乱码的根源所在。另外我建议不要随便使用new String(str.getBytes(enc1),enc2)这种方式来强行转码,也不要随便使用网上的字符转码函数,我觉得只会把问题隐藏更深更复杂化。我们应该清晰地分析整个字符流的编解码过程,自然可以找出乱码的根源所在,从而保证整个字符流动中,在内存中的UNICODE始终是正确的。
另外再附上个人总结的乱码分析的一套秘籍!即从乱码的长相来分析是哪种编码转换错误。有人可以闻香识酒,我们也来个看字识码。请看下表:
名称
|
示例
|
特点
|
产生原因
|
古文码
|
鐢辨湀瑕佸ソ濂藉涔犲ぉ澶╁悜涓?
|
大都为不认识的古文,并加杂日韩文
|
以GBK方式读取UTF-8编码的中文
|
口字码
|
����Ҫ�¨²�ѧϰ������
|
大部分字符为小方块
|
以UTF-8的方式读取GBK编码的中文
|
符号码
|
ç±æè¦å¥½å¥½å¦ä¹ 天天åä¸
|
大部分字符为各种符号
|
以ISO8859-1方式读取UTF-8编码的中文
|
拼音码
|
ÓÉÔÂÒªºÃºÃѧϰÌìÌìÏòÉÏ
|
大部分字符为头顶带有各种类似声调符号的字母
|
以ISO8859-1方式读取GBK编码的中文
|
问句码
|
由月要好好学习天天向??
|
字符串长度为偶数时正确,长度为奇数时最后的字符变为问号
|
以GBK方式读取UTF-8编码的中文,然后又用UTF-8的格式再次读取
|
锟拷码
|
锟斤拷锟斤拷要锟矫猴拷学习锟斤拷锟斤拷锟斤拷
|
全中文字符,且大部分字符为“锟斤拷”这几个字符
|
以UTF-8方式读取GBK编码的中文,然后又用GBK的格式再次读取
|
不过个人至今仍然弄不明白的就是问号码的产生原因,问号码即所有字符几乎全部为问号的乱码。问号码的出现有多种情况。我目前能确认的当我们把中文字符强行以ISO8859-1编码写入文件后,字符的高位信息会丢失,从而再次从文件中读出字符时便全部变为问号符。而我在JAVA代码中用UTF-8的方式去读 取GBK编码的字符,出来的也是问号码,而并非口字码,这是我百思不得其解的问题。
分享到:
相关推荐
JAVA 中文字符编码问题详解 在 JAVA 中,中文字符编码问题一直是让人头疼的问题,特别是在 WEB 应用中。网上的分析文章和解决方案都很多,但总是针对某些特定情况的。本文将详细解释 JAVA 中文字符编码问题的根源,...
### Java 字符编码详解 #### 一、Java 字符编码基础概念 在深入探讨 Java 字符编码的问题之前,我们先来了解一下字符编码的基本概念。字符编码是计算机内部表示字符的一种方式,它涉及到如何将人类可读的文字转换...
### Java字符集编码乱码详解 #### 一、编码与乱码基础知识 在计算机科学领域,字符集(Character Set)是指一系列符号和电子通信代码的标准集合。每种字符集都有其特定的应用场景和优势。例如,ASCII(American ...
### Java字符集编码问题详解 #### 一、引言 在Java编程中,字符集编码问题是一个常见且重要的议题。由于不同的系统、平台以及网络环境中可能存在多种字符编码格式,这导致了在处理文本数据时可能会遇到编码不一致...
### Java字符编码问题详解 #### 一、引言 在Java开发过程中,字符编码问题是一个常见且容易引发各种隐藏问题的领域。不正确的字符编码处理可能导致数据丢失、乱码甚至是程序异常。本文将深入探讨Java中的字符编码...
### JAVA程序的编码格式详解 #### 一、引言 编码问题一直是开发人员尤其是Java开发者面临的常见挑战之一。由于Java是一种跨平台的语言,因此在不同的操作系统之间存在编码格式的差异,这导致了在处理文本数据时经常...
### Java字符串编码转换详解 #### 一、Java 字符串编码转换基础 在Java中,字符串的处理是非常常见的操作之一,而字符编码是确保数据正确显示的关键因素。本篇文章将重点介绍Java中字符串编码的转换方法及其在Web...
Java字符编码监听器是Java Web开发中的一个重要概念,主要用于处理HTTP请求和响应中的字符编码问题。在Java Servlet规范中,提供了`SetCharacterEncodingFilter`这样的过滤器,用于确保请求参数和响应内容的正确编码...
此技术主要用于提取汉字的首字母或进行其他基于字符编码的操作。通过以下两个核心方法:`toTureAsciiStr` 和 `nuToTrueAsciiStr`,我们将探讨其实现原理及其应用场景。 #### 核心知识点详解 ##### 1. 字符编码基础...
### Java中文乱码问题详解 #### 一、中文问题的来源与背景 计算机技术发展初期,操作系统主要支持单字节的ASCII字符集。随着全球化进程加快和技术进步,为支持多种语言,尤其是双字节编码的语言(如中文),提出了...
Mysql字符集编码详解 Mysql数据库中的字符集编码问题是许多开发者经常遇到的一个问题,特别是在JAVA项目中。解决这个问题需要从多方面入手,包括服务器、数据库、数据表和连接等四个层次。这篇文章将详细介绍如何...
字符编码是将字符(如字母、数字和符号)与数字或二进制值关联的系统,例如ASCII、Unicode(包括UTF-8、UTF-16等)和GB2312等。Java语言默认使用Unicode作为其内部字符集,这使得Java程序可以处理各种语言的字符。 ...
本文将深入探讨Java中字符编码的相关问题,包括字符的存储格式、编码转换以及Java虚拟机(JVM)对字符的处理方式。 首先,我们要明白Java语言标准规定,Java源代码是使用Unicode编码的,这确保了程序可以处理世界上...
### Java中汉字编码问题详解 在Java开发过程中,汉字编码问题常常给开发者带来困扰,特别是在涉及国际化或多语言环境的应用开发中。本文将详细介绍在Java环境中遇到的汉字编码问题及其解决方案,帮助开发者更好地...
### 常用字符集编码详解 在信息技术领域,字符集编码是数据处理与传输的基础,不同的编码方式决定了计算机如何解读和表示文本信息。本文将深入解析几种常用的字符集编码,包括ASCII、GB2312、GBK、GB18030、Big5...
### 解决字符编码的过滤器知识点详解 #### 一、字符编码基础概念 在深入了解如何通过Struts2框架中的Servlet过滤器解决字符编码问题之前,我们先简要回顾一下字符编码的基本概念。字符编码是将计算机内部二进制...
### JAVA字符编码详解:Unicode, ISO-8859-1, GBK, UTF-8 及其相互转换 #### 一、引言 在Java编程中,字符编码的管理和转换是一项基本而又重要的任务。不同的编码标准适用于不同的场景,而理解和掌握这些编码之间...
处理Java与JSP环境中的中文问题,关键在于理解字符编码原理,正确使用编码转换器,并在读写操作中指定正确的字符集。通过以上讨论,我们可以更有效地避免和解决中文乱码问题,确保中文数据在Web应用中的正确展示和...
Java编码详解涵盖了多个关键概念,包括汉字编码、字符集转换、Unicode以及UTF格式。首先,汉字编码在Java中是一个重要的话题,因为Java程序需要正确处理中文字符。GB2312是中国强制性的汉字编码标准,包含一二级汉字...
编码问题详解主要涵盖编码的基本知识,特别是几种常见的字符集编码,如ISO8859-1、GB2312/GBK、Unicode以及UTF编码,以及它们在Java中的应用。 1. **编码基本知识**: - ISO8859-1是一种单字节编码,适用于英文...