`

java中utf转为中文

    博客分类:
  • JAVA
阅读更多

最近有同事问http url中或者cookie中被译码的中文怎么被转换回来。

 

我们知道用jdk自带的:native2ascii 可以将中文和unicode来回转的,但是java里怎么搞呢。

 

这里记录下简单的装换方式

 

例如有中文 “测试中文转换”

 

用native2ascii 生成的unicode 如下

 

\u6d4b\u8bd5\u4e2d\u6587\u8f6c\u6362

 

然后这个编码如果再被url encode下就会变为这样

 

%5Cu6d4b%5Cu8bd5%5Cu4e2d%5Cu6587%5Cu8f6c%5Cu6362

 

在java里可以借助一些辅助类 将

%5Cu6d4b%5Cu8bd5%5Cu4e2d%5Cu6587%5Cu8f6c%5Cu6362  还原为 “测试中文转换”

 

或者将 \u6d4b\u8bd5\u4e2d\u6587\u8f6c\u6362 还原为 “测试中文转换”

 

首先java里对应的url encode类是

 

URLEncoder  和 URLDecoder

 

从unicode到 中文可以使用apache下的common-lang里的  StringEscapeUtils.unescapeJava方法。

 

例如需要将url encode后的字符串还原到 中文的话 需要如下的调用

 

        String abc="%5Cu6d4b%5Cu8bd5%5Cu4e2d%5Cu6587%5Cu8f6c%5Cu6362";
	String bbc=URLDecoder.decode(abc);
	System.out.println(bbc);
	
	String cbc= org.apache.commons.lang.StringEscapeUtils.unescapeJava(bbc);
	System.out.println(cbc);
 
分享到:
评论

相关推荐

    java 中文字转为英文

    java 中文字转为英文java 中文字转为英文java 中文字转为英文

    Java避免UTF-8的csv文件打开中文出现乱码的方法

    在Java中,避免UTF-8的csv文件打开中文出现乱码的方法是非常重要的。csv文件是 comma separated values 的缩写,常用于数据交换和导入导出操作。然而,在Java中读取和写入csv文件时,中文字符如果不正确地处理,可能...

    Java解决UTF-8的BOM问题

    本文将详细探讨Java中如何处理UTF-8的BOM问题。 首先,我们需要理解什么是BOM。BOM是Unicode编码中的一个特殊字符,它的Unicode码点是`U+FEFF`,在UTF-8编码中,BOM的字节序列是`EF BB BF`。BOM的主要作用是在数据...

    java文件编码GBK转utf8完美解决方案

    idea、Eclipse等项目导入.java文件中文乱码完美解决方案:文件夹下所有GBK编码的.java一键转为utf-8,操作方式:将GBK2UTF8.jar文件考到需要转码项目目录,在当前位置运行控制台,输入命令java -jar GBK2UTF8.jar,...

    java 中文Unicode转换

    本文将深入探讨如何在Java中进行中文字符到Unicode编码的转换,以及如何从Unicode编码还原为中文字符。 首先,我们来了解Unicode的基本概念。Unicode是一个国际标准,它为每个字符分配了一个唯一的数字,这个数字被...

    java中文乱码之解决URL中文乱码问题的方法

    在Java开发中,遇到中文乱码问题是一种常见的挑战,特别是在处理URL时。URL中文乱码问题主要是由于URL编码和解码过程中的不一致导致的。下面将详细介绍如何解决这个问题,并探讨几种常用的方法。 首先,我们需要...

    JAVA文件编码格式转换:UTF-8转为GB2312

    能够集成到Source Insight中,解决JAVA文件乱码问题

    JAVA中汉字字符转化为英文字符

    ### JAVA中汉字字符转化为英文字符 #### 知识点概览 本文将详细介绍如何在Java中实现汉字到英文字符的转换。此技术主要用于提取汉字的首字母或进行其他基于字符编码的操作。通过以下两个核心方法:`toTureAsciiStr`...

    将字符串从常用编码转为utf-8编码(java)

    Java字符串编码查询及转换,可将常用的一些编码格式转换成utf-8

    .java文件中GBK编码转UTF-8编码

    在eclispe的项目中,有存在项目字符集和工作空间字符集不匹配,该jar只能将项目文件中的.java结尾的文件转为utf8编码,并且源文件必须为gbk编码的,否则乱码

    java 编码 UTF-8、ISO-8859-1、GBK

    例如,如果数据库是UTF-8,JSP是GBK,可以使用 `new String(rs.getBytes(1),"UTF-8")` 将数据库中的UTF-8字节流转换为GBK字符串。反之,如果JSP是UTF-8,数据库是GBK,需要先将GBK字符串转换为字节流,然后再次转换...

    Java Class Utf8 Translator 翻译工具

    Java Class Utf8 Translator 是一款专为Java开发者设计的翻译工具,主要用于处理Java字节码类文件中的UTF-8编码字符,帮助用户将类文件中的非ASCII字符转换为可读的汉字或其他语言,以便进行汉化或本地化工作。...

    批量将Java源代码文件的编码从GBK转为UTF-8

    老项目采用GBK编码格式,而新项目采用的UTF-8编码格式,如果直接把Java源代码复制到Eclipse中所有的中文信息会出现乱码。所以写了个小的方法类,将java文件的编码格式从GBK转UTF-8

    Java源码编码转换器 GBK TO UTF8 UTF8 To GBK(无源码)

    Java源码编码转换器是一款实用工具,主要用于将Java源代码文件从GBK编码转换为UTF-8编码,或者从UTF-8编码转换为GBK编码。在软件开发过程中,尤其是在处理中文字符时,编码问题是一个常见的挑战。GBK是中文环境下...

    Java 程序转码(UTF-8)

    - **`utToGBK`方法**:该方法尝试将输入字符串`sms`从UTF-8编码转换为GBK编码。这里有一个逻辑错误,即方法名和注释暗示了从UTF-8到GBK的转换,但实际上代码实现的是从UTF-8到URL编码的转换。正确的实现应该是: ``...

    java utf8 to gb2312

    在实际应用中,有时我们需要将 UTF-8 编码的字符串转换为 GB2312 编码。 #### 二、基础知识 1. **UTF-8**:一种支持多种语言的 Unicode 编码方式,能够表示世界上几乎所有的字符。它采用变长编码,最多用四个字节...

    java中文繁体转中文简体

    在这个例子中,我们首先创建了一个`OpenCc4j`对象,指定配置类型为`SimplifiedChineseToTraditionalChinese`,然后将繁体文本转换为简体文本。这只是一个基本的用法,实际应用中可能需要处理更复杂的情况,比如文件...

    java实现十六进制字符unicode与中英文转换示例

    在Java中,`String`类的构造函数`new String(byte[], charsetName)`用于将字节数组按照指定的字符集转换为字符串。例如,`new String(bs, "utf-8")`将字节数组`bs`解码为UTF-8编码的字符串。`substring`方法用于从...

    java 中文转换拼音

    在Java编程语言中,中文字符转换为拼音是一个常见的需求,特别是在处理中文文本的搜索、语音合成或者数据分析等场景。这个给定的压缩包文件“languageConvert”可能包含了一个实现此功能的Java程序,使得开发者能够...

    JAVA反编译文件解决中文乱码

    - 将源代码转换为UTF-8编码,然后再进行反编译。可以使用工具如Notepad++或Eclipse来批量转换编码。 2. **修改JD-GUI源代码** 对于有编程基础的开发者,可以尝试修改JD-GUI的源代码,使其支持自定义编码。找到JD-...

Global site tag (gtag.js) - Google Analytics