`

java批量将GBK项目源码转成utf-8

阅读更多

今天从git上下载的一个项目是GBK编码的,然后本地项目一般是utf-8编码的,于是写了一小段程序将GBK项目转成utf-8项目。

需要apache 的commons-io-2.5.jar

代码如下:

package com.usench;

import java.io.File;
import java.io.IOException;
import java.util.Collection;
import java.util.Properties;

import org.apache.commons.io.FileUtils;

/**
 * @ClassName: GbkFileToUtf8Batch
 * @Description: 批量将GBK文件转存为utf8编码保存
 * @date 2016年5月19日 下午5:24:48
 * @author wmj911
 *
 */
public class GbkFileToUtf8Batch {

    public static void main(String[] args) throws IOException {
        Properties prop = new Properties();
        prop.load(GbkFileToUtf8Batch.class.getClassLoader().getResourceAsStream("param.properties"));
       
        //GBK编码格式源码路径
        String srcDirPath = prop.getProperty("gbkDirPath");
        //转为UTF-8编码格式源码路径
        String utf8DirPath = prop.getProperty("utf8DirPath");
       
        System.out.println("srcDirPath="+srcDirPath+",utf8DirPath="+utf8DirPath);
               
        //获取所有java文件
        Collection<File> javaGbkFileCol =  FileUtils.listFiles(new File(srcDirPath), new String[]{"java"}, true);
               
        for (File javaGbkFile : javaGbkFileCol) {
              //UTF8格式文件路径
              String utf8FilePath = utf8DirPath+javaGbkFile.getAbsolutePath().substring(srcDirPath.length());
               //使用GBK读取数据,然后用UTF-8写入数据
              FileUtils.writeLines(new File(utf8FilePath), "UTF-8", FileUtils.readLines(javaGbkFile, "GBK"));       
        }
       
        System.out.println("批量编码完成.....");
    }
}

分享到:
评论

相关推荐

    java将gbk文件批量转换成UTF-8

    在开发的时候经常碰到这样的情况,需要将原本编码格式为GBK的工程改成UTF-8来编码,设置之后,注释全都乱码了,一个一个改太麻烦,...ps:如果是UTF-8转GBK,或是其他编码格式转换都是可以的,改改源码里面的设置就OK了

    Python-convert2utf将目录下的全部源文件转成UTF8编码

    标题"Python-convert2utf将目录下的全部源文件转成UTF8编码"指的是使用Python编写的一个脚本或工具,该工具能够遍历指定目录,检测并转换其中的GB、GBK以及其他非UTF-8编码的文本文件和源代码文件,统一转换为UTF-8...

    eclipse中class乱码GBK-UTF-8转换工具

    3. **源码转换**:如果源代码已经存在乱码,可能需要借助外部工具将GBK编码的文件转换为UTF-8。有很多在线或桌面工具可以完成这个任务,例如Notepad++、Sublime Text等,它们都支持批量转换编码。 4. **类文件转换*...

    批量转化文件编码工具(附Java源码)

    例如,如果你有一个使用GBK编码的旧数据库文件,但你的新系统只支持UTF-8,那么这个工具就能快速将GBK编码的文件转换为UTF-8,确保数据的正确显示。 在Java中实现批量文件转码涉及到以下关键技术: 1. **IO流**:...

    文件内容替换与文件编码格式转换java源码

    本主题聚焦于如何使用Java源码实现这一功能,尤其是针对Eclipse开发环境中从GBK编码转换到UTF-8编码的过程。下面我们将深入探讨相关的知识点。 首先,我们需要了解编码的基本概念。GBK是中国大陆使用的汉字编码标准...

    JAVA反编译文件解决中文乱码

    首先,理解问题的根源:Java源代码默认采用UTF-8编码,但某些情况下,源代码可能使用了其他编码方式,如GBK。当这些源代码被编译成字节码后,再用不支持原始编码的反编译工具打开,就会出现乱码。 1. **设置JD-GUI...

    android项目编码转换

    本主题将详细介绍如何将一个使用其他编码方式的Android项目转换为UTF-8编码,以确保代码的正确显示和处理。 首先,我们看到压缩包中包含了一个名为"Android项目编码的批量修改.docx"的文档。这个文档很可能是详细的...

    批量转换字符集的小工具

    例如,从GBK(中国的简体中文编码)转换为UTF-8(国际通用的多语言编码)。 描述中提到的博客链接指向了一个名为“xujun2008”的作者在ITEYE(一个知名的中国IT技术社区)上发表的文章。根据博客文章,我们可以推测...

    java源文件编码转换工具加源码(自动检测源文件编码类型)

    因此,将GBK编码的源文件转换为UTF-8,可以使得代码更具有兼容性和可读性。 该工具的核心功能包括: 1. **自动检测编码**:通过分析文件内容,识别出源文件的原始编码格式。这通常涉及到查找特定编码特征的字节...

    源码批量转码工具

    在编程工作中,不同的项目可能采用不同的字符编码格式,如ASCII、UTF-8、GBK等,这可能导致在不同环境或平台间交换代码时出现乱码问题。该工具提供了一个方便快捷的解决方案,帮助用户一次性处理大量源码文件的编码...

    ueditor1_4_3_3-gbk-jsp.zip

    charset=UTF-8" language="java" %&gt; &lt;script src="js/ueditor.all.js"&gt;&lt;/script&gt; &lt;div id="myEditor"&gt;&lt;/div&gt; var editor = UE.getEditor('myEditor', { initialFrameWidth: 800, // 设置初始宽度 ...

    ueditor1_2_5_1-gbk-jsp

    - 处理用户提交的编辑内容,注意转换编码为服务器端可识别的形式,如UTF-8。 5. **功能特性** - 支持多种语言:除了中文,还支持其他多国语言,满足全球化需求。 - 图片上传:内置图片上传功能,支持批量上传,...

    简繁体及编码转换(源码)

    - **Unicode**:为了解决不同语言字符集的冲突,Unicode被设计出来,它是一个包含全世界大部分语言字符的统一编码标准,分为UTF-8、UTF-16等不同的实现方式。 - **GBK/GB2312**:中国国家标准的中文编码,包含了大...

    word源码java-practice:这个项目是记录自己平常的一些练习

    将批量将GBK编码文件转化为UTF-8的文件的小练习 练习6 PhP语言将word转为html文件 练习7 spring cloud 学习项目 练习8 spring boot的自动注解,@Enable*,自己定制 练习9 angular入门例子 练习10 spring security和...

    工程编码格式转换

    这段配置会将`src`目录下的所有`.java`文件复制到`target`目录,并将其编码转换为UTF-8。 总之,工程编码格式转换是一个涉及源代码管理和工具应用的关键环节。通过理解各种编码标准,使用适当的工具,如Ant,以及...

    源代码中文乱码==转换为UTF8

    描述中提到,使用特定工具可以批量地将GBK编码的源代码转换成UTF8编码,以解决乱码问题。 GBK和UTF8是两种常见的字符编码标准: 1. **GBK编码**:GBK是中国大陆广泛使用的汉字编码标准,它是GB2312的扩展,支持更...

    xmljava系统源码-FilesCodingConvert:批量文件编码格式转换工具

    如果需要导入别人的UTF-8编码的文件我会更改Eclipse的 Preferece选项,调节阅读编写模式为UTF-8。在AS中这个做法是失败的,Gradle编译时会提示编码格式与IDE的不同,可能会导致严重问题。然后调节IDE编码非常头疼。...

    文件编码

    常见的编码格式有ASCII、Unicode(包括UTF-8、UTF-16等)以及GBK等。ASCII编码是早期最简单的编码方式,只能表示128个基本的英文字符。随着全球化的推进,Unicode编码应运而生,它能容纳世界上几乎所有的语言字符。...

    com.lifesting.tool.encoding_1.0.0.jar及源码

    开发者可能遇到的问题是,项目中包含了多种编码格式的文件,如GBK、UTF-8等,这会导致在不同的系统或编辑器中打开时出现乱码。通过这个插件,开发者可以方便地将整个项目或选定的文件统一转换为指定的编码格式,确保...

    深入分析 Java I/O 的工作机制(转载)

    Java I/O系统广泛涉及字符编码,如ASCII、UTF-8、GBK等。Charset类提供了字符集的相关操作,InputStreamReader和OutputStreamWriter在创建时需要指定字符集。 总的来说,Java I/O机制是一个复杂但强大的体系,涵盖...

Global site tag (gtag.js) - Google Analytics