`
chen_yongkai
  • 浏览: 61952 次
  • 性别: Icon_minigender_1
  • 来自: 福州
文章分类
社区版块
存档分类
最新评论

JAVA实现GBK转码为UTF-8

 
阅读更多
public static String getUTF8StringFromGBKString(String gbkStr) {
		try {
			return new String(getUTF8BytesFromGBKString(gbkStr), "UTF-8");
		} catch (UnsupportedEncodingException e) {
			throw new InternalError();
		}
	}


	public static byte[] getUTF8BytesFromGBKString(String gbkStr) {
		int n = gbkStr.length();
		byte[] utfBytes = new byte[3 * n];
		int k = 0;
		for (int i = 0; i < n; i++) {
			int m = gbkStr.charAt(i);
			if (m < 128 && m >= 0) {
				utfBytes[k++] = (byte) m;
				continue;
			}
			utfBytes[k++] = (byte) (0xe0 | (m >> 12));
			utfBytes[k++] = (byte) (0x80 | ((m >> 6) & 0x3f));
			utfBytes[k++] = (byte) (0x80 | (m & 0x3f));
		}
		if (k < utfBytes.length) {
			byte[] tmp = new byte[k];
			System.arraycopy(utfBytes, 0, tmp, 0, k);
			return tmp;
		}
		return utfBytes;
	}
分享到:
评论

相关推荐

    Java 程序转码(UTF-8)

    ### Java程序转码(UTF-8):详细解析与实现 #### 一、引言 在处理文本数据时,字符编码是一项重要的技术基础。不同系统、不同语言环境下的字符编码可能不一致,这就需要进行字符编码转换以确保数据正确显示和处理...

    批量将Java源代码文件的编码从GBK转为UTF-8

    老项目采用GBK编码格式,而新项目采用的UTF-8编码格式,如果直接把Java源代码复制到Eclipse中所有的中文信息会出现乱码。所以写了个小的方法类,将java文件的编码格式从GBK转UTF-8

    简单的UTF-8与GBK之间相互转码工具

    这个名为`encoding_p.java`的Java源代码文件,应该包含了一个简单的类或函数,用于实现文件从GBK到UTF-8,以及从UTF-8到GBK的转换。在Java中,我们可以使用`java.nio.charset`包中的`Charset`和`CharsetDecoder`、`...

    java文件编码GBK转utf8完美解决方案

    idea、Eclipse等项目导入.java文件中文乱码完美解决方案:文件夹下所有GBK编码的.java一键转为utf-8,操作方式:将GBK2UTF8.jar文件考到需要转码项目目录,在当前位置运行控制台,输入命令java -jar GBK2UTF8.jar,...

    linux和mac转码脚本gbk转utf-8

    可以将你输入的路径下的,java进行转码,转为utf-8,使用方法:输入要转码的路径,输入保存在哪里的路径 ,即可

    关于JAVA字符编码:Unicode,ISO-8859-1,GBK,UTF-8编码及相互转换

    ### 关于JAVA字符编码:Unicode, ISO-8859-1, GBK, UTF-8 编码及相互转换 在Java开发过程中,字符编码是处理文本数据的基础,不同的编码方式会影响数据的存储、传输以及显示。本文将详细介绍几种常见的字符编码...

    Java本地编码文件转UTF-8文件

    把含有本地编码的文件转成utf-8的,经常用于java文件的转码. 把编码gbk的java文件批量转成utf-8编码的文件.

    GBK乱码数据转UTF-8

    由于程序缓存问题,导致数据库原存utf-8格式的数据,现在存...需要将数据恢复,所以需要转码,现在将乱码数据导出存入Excel文件,通过java代码转换成utf-8格式的数据后打印update更新SQL语句进行输出到一个文件中保存。

    使用eclipse插件批量将Java源代码文件的编码从GBK(或其他编码)转为UTF-8

    当一个工程项目从GBK编码或其它非UTF-8编码格式需要转换为UTF-8时,开发者可能会遇到中英文乱码问题。Eclipse作为流行的Java集成开发环境,提供了便捷的插件来解决这类问题。 在Eclipse中进行批量转码通常涉及以下...

    java读写excel包括utf8转码为可识别汉字gbk

    java读写excel包括utf8转码为可识别汉字gbk,jxl方式读取excel,生成一个新的excel

    GBK、UTF-8编码转换工具

    本程序的目的是为了把文件编码格式统一。如果文件内容编码不同,则也不能保正...缺点:比如iso-8859-1的内容转换成utf-8。则可能失败。。 优点:java文件,txt/xml/dat文件。只要都是能识别的内容,即转换成功就更大。

    Java gbk转utf-8

    在Java开发过程中,字符编码问题时常困扰着开发者,尤其是在处理多源文件时,例如GBK编码的文件需要转换为UTF-8编码。这篇文章将详细介绍如何在Java环境下进行GBK到UTF-8的转换,主要包括文件转码、环境配置以及相关...

    txt乱码解决处理文本文件转码编码csv器gbk互转utf-8自动批量工具html,js,css,md,json,log,py

    一键自动实现gbk、utf-8互转,不需要任何设置 也支持指定编码方式后,一键转码 强制模式:不支持转码的字符可跳过(目前处理方式是替换成”?”),强制完成转码 支持批量转码 多线程高性能:批量处理方式是多线程...

    Delphi中UTF-8,Unicode格式转换

    delphi7调用delphi2009生成的dll文件会出现乱码问题。是unicode的原因 终于找到了UTF-8、Unicode格式转换函数

    gbk至utf-8转码工具

    windows下的java项目放到linux下会有中文乱码的现象,因为windows下的编码为GBK,而linux下是utf8的,将项目下的java文件全部转成utf8. 用法: ./gbktoutf8.sh 项目源码所在目录的绝对路径

    java 解决异常 2 字节的 UTF-8 序列的字节2 无效的问题

    3. **转码**:可以尝试将文件内容从其他编码转换为UTF-8,例如使用Java的`java.nio.charset.Charset`类的`newDecoder()`和`newEncoder()`方法。 4. **修正XML内容**:检查XML文件中的特殊字符,确保它们符合UTF-8...

    utf8 转为 gbk 编码

    可以帮助你把中文转换成UTF-8编码形式,UTF-8编码与中文互转,同时也支持把UTF-8编码过的字符还原成中文,将字符串转换为UTF-8形式,解决在网络传输过程中出现的字符乱码,同时可跨平台使用。

    Android UTF-8转码实例详解

    这篇“Android UTF-8转码实例详解”将深入探讨如何在Android环境中进行UTF-8编码和解码。 首先,了解UTF-8编码的基本原理。UTF-8是一种变长编码,它根据字符的Unicode码点长度使用1到4个字节。ASCII字符(如英文...

Global site tag (gtag.js) - Google Analytics