问题描述:我的jsp编码是GBK 后台的web.xlm默认也是GBK,但我想用Ajax的异步提交带中文的数据(我用的是json),这样到后台解析是乱码,存入数据库也是乱码。在网上找了好多方法看到问的很多解决的却很少。
网上大多解决都是用java API自带的String的一个方法,先将字符串转化成字节,然后再转utf-8。告诉大家你看到这个帖子的时候就不用再尝试这种解决办法了,那是个美丽扯。utf-8是一个汉字三个字节,当你是奇数个汉字或汉字与字母数字混合是还是有乱码。
下面是我的解决办法。
1、在jsp中我的数据输入是用textarea装载,用js给这个标签写了一个失去焦点事件
html:
<textarea name="memotemp" rows="4" id="memotemp"></textarea>
<input type="hidden" id="memoval" name = "reason" value=""/>
js:
//textarea 失去焦点事件
$("#memotemp").blur(function(){
var memotemp= $("#memotemp").val();
$("#memoval").val(escape(memotemp));
});
ps: 1.var memotemp= $("#memotemp").val();意思是得到textarea 里的内容。
2.escape(memotemp)意思是memotemp被escape转码(这里不多说escape你可以Google一下)。
3.$("#memoval").val(escape(memotemp));意思是将转码后的内容放入id为
memoval的input里。
实际上这个id为memoval的input内容是 我们要提交给后台的。这个到后台也是一堆类似url里的那些乱码。这时候你可以用一个自己写的java方法将escape转码过的再转回原先的真实的值。这样一来你就避免了Ajax提交过程中默认编码是utf-8而你的程序中都是GBK引起的乱码问题。
下面是java代码,非小弟本人所创在网上找的。
package com.cfcc.cams.aduitmanage.util;
import java.io.UnsupportedEncodingException;
import java.text.SimpleDateFormat;
import java.util.Calendar;
import java.util.Date;
import java.util.Locale;
public class CommonStr {
private final static String[] hex = { "00", "01", "02", "03", "04", "05",
"06", "07", "08", "09", "0a", "0b", "0c", "0d", "0e", "0f", "10",
"11", "12", "13", "14", "15", "16", "17", "18", "19", "1a", "1b",
"1c", "1d", "1e", "1f", "20", "21", "22", "23", "24", "25", "26",
"27", "28", "29", "2a", "2b", "2c", "2d", "2e", "2f", "30", "31",
"32", "33", "34", "35", "36", "37", "38", "39", "3a", "3b", "3c",
"3d", "3e", "3f", "40", "41", "42", "43", "44", "45", "46", "47",
"48", "49", "4a", "4b", "4c", "4d", "4e", "4f", "50", "51", "52",
"53", "54", "55", "56", "57", "58", "59", "5a", "5b", "5c", "5d",
"5e", "5f", "60", "61", "62", "63", "64", "65", "66", "67", "68",
"69", "6a", "6b", "6c", "6d", "6e", "6f", "70", "71", "72", "73",
"74", "75", "76", "77", "78", "79", "7a", "7b", "7c", "7d", "7e",
"7f", "80", "81", "82", "83", "84", "85", "86", "87", "88", "89",
"8a", "8b", "8c", "8d", "8e", "8f", "90", "91", "92", "93", "94",
"95", "96", "97", "98", "99", "9a", "9b", "9c", "9d", "9e", "9f",
"a0", "a1", "a2", "a3", "a4", "a5", "a6", "a7", "a8", "a9", "aa",
"ab", "ac", "ad", "ae", "af", "b0", "b1", "b2", "b3", "b4", "b5",
"b6", "b7", "b8", "b9", "ba", "bb", "bc", "bd", "be", "bf", "c0",
"c1", "c2", "c3", "c4", "c5", "c6", "c7", "c8", "c9", "ca", "cb",
"cc", "cd", "ce", "cf", "d0", "d1", "d2", "d3", "d4", "d5", "d6",
"d7", "d8", "d9", "da", "db", "dc", "dd", "de", "df", "e0", "e1",
"e2", "e3", "e4", "e5", "e6", "e7", "e8", "e9", "ea", "eb", "ec",
"ed", "ee", "ef", "f0", "f1", "f2", "f3", "f4", "f5", "f6", "f7",
"f8", "f9", "fa", "fb", "fc", "fd", "fe", "ff" };
private final static byte[] val = { 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f,
0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f,
0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f,
0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f,
0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x00, 0x01,
0x02, 0x03, 0x04, 0x05, 0x06, 0x07, 0x08, 0x09, 0x3f, 0x3f, 0x3f,
0x3f, 0x3f, 0x3f, 0x3f, 0x0a, 0x0b, 0x0c, 0x0d, 0x0e, 0x0f, 0x3f,
0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f,
0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f,
0x3f, 0x3f, 0x3f, 0x0a, 0x0b, 0x0c, 0x0d, 0x0e, 0x0f, 0x3f, 0x3f,
0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f,
0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f,
0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f,
0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f,
0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f,
0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f,
0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f,
0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f,
0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f,
0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f,
0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f,
0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f,
0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f,
0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f, 0x3f };
public static String unescape(String s) {
StringBuffer sbuf = new StringBuffer();
int i = 0;
int len = s.length();
while (i < len) {
int ch = s.charAt(i);
if (ch == '+') {// + : map to ' '
sbuf.append(' ');
} else if ('A' <= ch && ch <= 'Z') {// 'A'..'Z' : as it was
sbuf.append((char) ch);
} else if ('a' <= ch && ch <= 'z') {// 'a'..'z' : as it was
sbuf.append((char) ch);
} else if ('0' <= ch && ch <= '9') {// '0'..'9' : as it was
sbuf.append((char) ch);
} else if (ch == '-'
|| ch == '_'// unreserved : as it was
|| ch == '.' || ch == '!' || ch == '~' || ch == '*'
|| ch == '\' || ch == '(' || ch == ')') {
sbuf.append((char) ch);
} else if (ch == '%') {
int cint = 0;
if ('u' != s.charAt(i + 1)) { // %XX : map to ascii(XX)
cint = (cint << 4) | val[s.charAt(i + 1)];
cint = (cint << 4) | val[s.charAt(i + 2)];
i += 2;
} else {// %uXXXX : map to unicode(XXXX)
cint = (cint << 4) | val[s.charAt(i + 2)];
cint = (cint << 4) | val[s.charAt(i + 3)];
cint = (cint << 4) | val[s.charAt(i + 4)];
cint = (cint << 4) | val[s.charAt(i + 5)];
i += 5;
}
sbuf.append((char) cint);
}
i++;
}
return sbuf.toString();
}
}
这次你的问题应该可以解决了,我的表达能力不太好, 这套办法解决常用编码问题是绝对可以的。
分享到:
相关推荐
GBK、GB2312和UTF-8是三种常见的字符编码标准,每种都有其特定的应用场景和特点。C#作为.NET框架下的主要编程语言,提供了丰富的类库支持对不同编码格式之间的转换。 1. **GBK编码**:GBK是中国大陆广泛使用的汉字...
在开发的时候经常碰到这样的情况,需要将原本编码格式为GBK的工程改成UTF-8来编码,设置之后,注释全都乱码了,一个一个改太麻烦,有了这个工具只用运行一下main方法,一键搞定 ps:如果是UTF-8转GBK,或是其他编码...
所以,你看到的绝大多数转字符集的程序,都是GBK->UTF-8,GBK->BIG5,这种,必须要你提前知道你的文本是什么编码,否则就会乱码。而且,转过一次的文本,再转一次,也会乱码。 我在对比了诸多字符集探测库之后,...
在网页、编程语言和操作系统中,UTF-8已成为默认的字符编码。 **二、ANSI编码** ANSI编码通常指的是Windows操作系统中的"Windows-1252"编码,这是一种单字节编码标准,最多可以表示256个不同的字符。在早期的...
2. **多字节序列**:UTF-8的多字节字符需要正确地解码成Unicode码点,然后按照GBK的规则重新编码。 3. **不支持的字符**:GBK编码集不包含所有Unicode字符,对于GBK不支持的字符,转换时可能需要替换为问号或其他...
在处理UTF-8和GB2312之间的转码问题时,我们需要确保正确地转换每个字符的编码,以避免乱码情况的发生。转码过程通常包括两个步骤:解码和编码。首先,我们需要将UTF-8编码的字符串解码为Unicode,然后将Unicode转换...
ANSI和UTF-8是两种常见的字符编码标准,它们在处理多语言字符时有着不同的特性。本文将深入探讨如何在VB中将ANSI编码转换为UTF-8编码,以及在实际应用中的网络编程基础知识,特别是利用Winsock控件实现简单的聊天...
不需要关心接受的字符串编码是UTF_8还是GBK,还是ios-8859-1,自动转换为utf-8编码格式,无需判断字符串原有编码,用法://处理编码String newStr = GetEncode.transcode(oldStr);
它能遍历指定目录下的所有文件,包括子目录,将GBK编码的文本文件转换成UTF-8编码,同时保留原有的GBK编码版本,通过添加“bak”后缀作为备份。这样的设计确保了原文件的安全,即使转换出现问题,也能恢复到原始状态...
UTF-8文件格式转换工具是一种实用的软件,主要用于处理不同编码格式之间的转换,尤其是将GBK或GB2312等中文编码格式的文件转化为UTF-8编码格式。在信息技术领域,字符编码是至关重要的,因为它决定了计算机如何理解...
例如,当从一个使用GBK编码的文件读取汉字时,如果误以为是UTF-8编码,可能会出现乱码。此时,利用该工具将GBK编码转换为UTF-8,就可以正确显示内容。同样,从Unicode编码的资源中提取汉字,也可能需要将其转换为...
4. **存储空间**:由于UTF-8的可变长度,对于纯英文或包含少量中文的文本,UTF-8可能会比GBK占用更多空间,反之则可能更少。 5. **处理难度**:GBK处理起来相对简单,而UTF-8由于字节顺序和字节数量的变化,处理起来...
这意味着,即使页面是GBK编码,当通过Ajax提交数据时,数据会被转化为UTF-8编码。在服务器端,需要正确识别并处理这些UTF-8编码的数据,通常是通过HTTP请求头中的`Content-Type`字段来确定编码格式。例如,`Content-...
例如,当你从一个GBK编码的网站复制文本并尝试在UTF-8编码的环境中粘贴时,可能会出现乱码问题,这时就需要进行编码转换。 在编程领域,转换GBK和UTF-8编码通常涉及到以下几个步骤: 1. **读取文件**:首先,你...
原因是因为我们平时用的windows系统内码一般为GBK,而android是utf-8。所以是乱码,为了解决中文标签乱码,可以使用convertZ(在附件中,可以下载)。启动后,可以使用屏幕右上角的第一个按钮,有个ID3标签工具,把...
6. **16进制字符串转换**:16进制字符串可以转换为Unicode或UTF-8字符串,这通常涉及到将每个16进制数字对解析为一个字节,然后组合成字符。对于GBK编码,可能需要先将16进制字符串转换为Unicode,然后再转换为GBK。...
java -jar EncodingTool.jar "要转的文件或者整个文件夹的绝对路径或者相对路径" utf-8 (想转成gbk就写gbk) 比如 java -jar EncodingTool.jar "/code/Hello.java" utf-8 就会在当前目录生成一个新的目录 里面是...
这个程序提供了一个用户界面,用户可以输入GBK编码的乱码字符串,然后通过点击“转换”按钮,程序会将输入的GBK字符串转换为UTF-8格式并显示在下方的输入框中。 实现GBK到UTF-8的转换,通常需要以下步骤: 1. **...
- 反向过程是将 UTF-8 字节序列解析成 GB2312 字符。首先,需要识别出 UTF-8 字节序列中的每个字符,然后根据 UTF-8 到 GB2312 的映射关系还原出对应的 GB2312 字符。这个过程同样涉及到解码和位操作。 5. **在线...
第一次 encodeURI 是将中文数据按照 UTF-8 方式获取字节数组,然后将每个字节转化成对应的 16 进制数。例如,如果输入的中文是“中”,那么第一次 encodeURI 将其变成 [%E4,%B8,%AD]。 第二次 encodeURI 则是将数组...