`

java练手全程录4-处理工具类代码实现

 
阅读更多

2012-2-7

 

继续昨天的日志。贴出工具类的代码实现。

 

工具类名定义为UtilFile

再定义四个方法

public static void changeChineseToHexInFile(String filePath, SwitchHexAndChineseView frame) throws IOException

public static boolean changeChineseToHexInString(StringBuilder input)

public static void changeHexToChineseInFile(String filePath, SwitchHexAndChineseView frame) throws IOException

public static boolean changeHexToStringInString(StringBuilder input)

 

方法说明

changeChineseToHexInFile 是用来对文件进行中文转unicode处理,至少要传一个文件名或路径。

对于第二个参数的说明,至于后面的frame是一个swing的jframe对象,这是为了做GUI界面而后加入的,为的就是如果传入的是路径,则对路径内部的文件处理时,处理一个文件后就在GUI界面里写出一个操作提示。

这里有多种方案如:

1.就是我当前使用的,在工具类中传入一个GUI对象,就可以在工具类中对GUI进行操作。因为这里的工具类是前几天写好的,不想大改,只要加入一个新参数就能GUI的项目中马上起作用。

2.方法参数这里只传一个文件名而不是路径,这样就可以在GUI的方法体中调用工具类对单个文件进行处理,处理完后再在GUI方法体内进行GUI操作。

 

changeChineseToHexInString 是用来对字符串进行中文转unicode处理,传入的是一个字符串。

changeHexToChineseInFile和changeHexToStringInString 是反过来的

 

 

方法实现

 

 public static void changeHexToChineseInFile(String filePath, final SwitchHexAndChineseView frame) throws IOException {
        final File file = new File(filePath);
        //*** 如果是文件夹则查其子文件夹中的文件
        if (file.isDirectory()) {
            //使用文件过滤器来过滤文件,只取子文件夹中的.java/.properties或路径
            File[] files = file.listFiles(new FileFilter() {
                public boolean accept(File pathname) {
                    return pathname.isDirectory() || pathname.getName().endsWith(".java") || pathname.getName().endsWith(".properties");
                }
            });
            //对字文件夹中的内容进行递归调用
            for (File f : files) {
                changeHexToChineseInFile(f.getAbsolutePath(), frame);
            }
        } else {
            //如果是文件,则以固定的utf8编码读取文件
            FileInputStream fr = new FileInputStream(file);
            InputStreamReader is = new InputStreamReader(fr, "utf8");
            char[] cc = new char[(int) file.length()];
            int readnum = is.read(cc);
            StringBuilder sb = new StringBuilder(readnum);
            sb.append(cc, 0, readnum);

            //对字符串进行转换处理,如果文件里没有要转换的字符则就不必对原文件进行覆盖
            boolean isChange = changeHexToStringInString(sb);
            fr.close();

            if (isChange) {
                //如果有转换,则以固定的utf8码对原文件进行覆盖
                OutputStreamWriter osw = new OutputStreamWriter(new FileOutputStream(file), "utf8");
                osw.write(sb.toString().trim());
                osw.close();

                //每处理完一个文件,则在awt线程中对GUI界面进行操作,在窗口中输出处理过的文件绝对路径全名
                SwingUtilities.invokeLater(new Runnable() {
                    public void run() {
                        frame.setResultView(file.getAbsolutePath() + "\n");
                    }
                });
            }
        }
    }

 

 

 public static void changeChineseToHexInFile(String filePath, final SwitchHexAndChineseView frame) throws IOException {
        final File file = new File(filePath);
        //*** 如果是文件夹则查其子文件夹中的文件
        if (file.isDirectory()) {
            File[] files = file.listFiles(new FileFilter() {
                public boolean accept(File pathname) {
                    return pathname.isDirectory() || pathname.getName().endsWith(".java") || pathname.getName().endsWith(".properties");
                }
            });
            //对子文件进行递归调用
            for (File f : files) {
                changeChineseToHexInFile(f.getAbsolutePath(), frame);
            }
        } else {
            //以固定utf8读取文件内容
            FileInputStream fr = new FileInputStream(file);
            InputStreamReader is = new InputStreamReader(fr, "utf8");
            char[] cc = new char[(int) file.length()];
            int readnum = is.read(cc);
            StringBuilder sb = new StringBuilder(readnum);
            sb.append(cc, 0, readnum);

            //处理内容
            boolean isChange = changeChineseToHexInString(sb);
            fr.close();

            if (isChange) {
                //覆盖原文件
                OutputStreamWriter osw = new OutputStreamWriter(new FileOutputStream(file), "utf8");
                osw.write(sb.toString().trim());
                osw.close();
                
                //在awt线程中操作GUI
                SwingUtilities.invokeLater(new Runnable() {
                    public void run() {
                        frame.setResultView(file.getAbsolutePath() + "\n");
                    }
                });
            }
        }
    }

 可以看到这两个方法大部分代码都相同,还可以再重构。如再分一个方法要加emun参数,这两个方法分别再调第三个方法。这里时间不多就不在gui的工具类里做了,但我会在自己的实现工具类里再优化的。

 

 

 public static boolean changeChineseToHexInString(StringBuilder input) {
        char each = '\u0000';
        boolean isChange = false;
        int inputLength = input.length();
        //定义一个临时变量
        StringBuilder sb = new StringBuilder(inputLength);
        for (int i = 0; i < inputLength; i++) {
            each = input.charAt(i);
            if (String.valueOf(each).matches("[^\\u0000-\\u00FF]")) {
                isChange = true;
                //将中文转成16进制
                sb.append("\\u").append(Integer.toHexString(each));
            } else {
                sb.append(each);
            }
        }
        if (isChange) {
            //如果有变化,就将原内容替换
            input.replace(0, inputLength, sb.toString());
        }
        return isChange;
    }

 参数使用StringBuilder是考虑性能问题,且这是个对象引用,可以直接对对象进行操作。引用中间变量sb是为了解决在循环中的正则长度匹配问题。如果不使用中间变量,而直接使用参数在循环体中进行replace替换,那么每替换一次则字符的总长度会加5,因为16进制是6位字符,而中文只是一个字符。对于正则来说在循环时如果长度发生变化则可能会抛出异常。

 

 public static boolean changeHexToStringInString(StringBuilder input) {
        boolean isChange = false;
        //使用正则找出\u0000这种格式,且不能是\\u0000这各格式的
        Matcher matcher = Pattern.compile("((?<!\\\\)\\\\u([0-9A-Fa-f]{4}))", Pattern.MULTILINE | Pattern.UNICODE_CASE).matcher(input);
        while (matcher.find()) {
            isChange = true;
            //每找到一处,就从找到的下标开始进行替换
            input.replace(matcher.start(), matcher.end(), String.valueOf((char) Integer.parseInt(matcher.group(2), 16)));
            //替换后字符长度发生了变量,则要相应的更改正则的匹配范围,否则会出错
            matcher.region(matcher.start() - (matcher.end() - matcher.start()), input.length());
        }
        return isChange;
    }

 这里的stringbuilder就更重要了,如果你只使用string则每次replace都会创建一个新对象,因为string是不变长度的,你改了字符,长度变了,那它就会创建新string对象对于性能来说是影响很大的

 

主要代码就是这么多,GUI代码太多了,就不贴了,直接上传成品,为了方便使用,我直接把GUI打包成了exe。运行环境是要jre1.6及以上的。小工具一个,没时间去做更好的用户体验,凑合着用吧

 

  • 大小: 23.6 KB
分享到:
评论

相关推荐

    Java 所有字符串转UTF-8 万能工具类-GetEncode.java

    不需要关心接受的字符串编码是UTF_8还是GBK,还是ios-8859-1,自动转换为utf-8编码格式,无需判断字符串原有编码,用法://处理编码String newStr = GetEncode.transcode(oldStr);

    java图片处理工具类JAR包 java-image-scalingjar

    java图片处理工具类JAR包 java-image-scalingjar

    JS实现AES-GCM加密,java实现AES-GCM解密。.md

    在工作中会经常遇到密码加密,URL传参要进行加密,在此我参照一个例子将用java实现的AES加解密程序用实例写出。JS实现AES-GCM加密,java实现AES-GCM解密

    jedisUtil工具类java

    jedis的工具类,java代码写的,非常全面,jedis的工具类,java代码写的,非常全面jedis的工具类,java代码写的,非常全面jedis的工具类,java代码写的,非常全面jedis的工具类,java代码写的,非常全面jedis的工具类...

    Java项目开发全程实录-源代码

    Java项目开发全程实录-源代码是一份涵盖了Java编程语言在实际项目开发中的全面实践案例。这份源代码集合为开发者提供了宝贵的参考资料,帮助他们深入理解Java编程思想、设计模式以及项目构建过程。以下是对这份资源...

    easypoi导出工具类-代码含java代码、jar包以及pom依赖

    easypoi实现上百万大数据导出excel工具,需要引入3.0.1版本easypoi相关依赖即可,该工具类也提供自定义动态标题,动态填充数据实现导出数据功能(但此功能最大导出为6w,导出大数据请用工具中的另一个方法,亲测有效...

    完整版modbus+tcp+ java开发代码

    这个“完整版modbus+tcp+java开发代码”是用于在Java环境中实现Modbus TCP通信的一个资源,非常适合那些需要在Java应用中集成Modbus功能的开发者。 Modbus TCP是Modbus协议的网络版本,它在原始的串行Modbus协议...

    java2python--java代码转python工具

    Java到Python的转换工具,如标题“java2python”所示,是编程领域中的一种实用技术,旨在帮助开发者将已有的Java代码转换为Python语言。这种转换对于那些熟悉Java但希望进入Python生态系统,或者想要利用Python特定...

    完整的java文件读写工具类

    本篇将详细讲解标题为"完整的java文件读写工具类"所涉及的核心知识点,以及如何实现描述中提到的文件与目录管理功能。 1. **Java IO基础**: Java IO是Java标准库中的核心部分,提供了处理输入/输出流的类。在`...

    mysql-connector-java-5.1.40.zip和mysql-connector-java-5.1.10.jar

    在实际开发中,你可以将`mysql-connector-java-5.1.10.jar`添加到项目的类路径(classpath)中,或者在Maven或Gradle等构建工具的依赖管理中指定对应的版本,以确保Java应用能够找到并使用这个驱动。 总结,`mysql-...

    JAVA wav转PCM Utils代码工具类

    总结来说,`JAVA wav转PCM Utils代码工具类`是Java开发者处理音频数据时的一个实用工具,它简化了音频格式转换的过程,方便在音频处理项目中集成和使用。通过理解和运用这个工具,开发者可以更好地控制和处理音频...

    java开发,30个常用工具类总结,全部来自项目实践中用到的工具类

    在Java开发中,工具类是程序员经常会用到的代码模块,它们封装了各种常见的操作,提高了代码的可重用性和可维护性。以下是对标题和描述中提到的几个常用工具类的详细说明: 1. **DateUtils**: `java.util.Date` 和 ...

    java源码包---java 源码 大量 实例

    util实现Java图片水印添加功能,有添加图片水印和文字水印,可以设置水印位置,透明度、设置对线段锯齿状边缘处理、水印图片的路径,水印一般格式是gif,png,这种图片可以设置透明度、水印旋转等,可以参考代码加以...

    jsch.jar--一个java实现的运行linux下面ssh和scp命令的工具

    ant运行scp以及sshexec任务所必须的jar包,这是optional的,所以ant默认不会有的,需要自己加上

    备忘录日程管理java代码

    总的来说,"备忘录日程管理java代码"项目涵盖了Java编程、GUI设计、事件处理、日期时间操作、数据存储、测试和项目管理等多个方面,是一个综合性的Java应用开发案例。通过学习和实践这样的项目,开发者可以提升自己...

    java美元兑人民币汇率的工具类

    人民币兑美元汇率的java工具类,人民币兑美元汇率的java工具类人民币兑美元汇率的java工具类

    java中ping命令ping工具类(循环ping)

    java中ping命令ping工具类(循环ping) java ping ip ping命令 ping工具类 支持linux和windows等所有平台 Ping是Windows下的一个命令 在Unix和Linux下也有这个命令。 ping也属于一个通信协议,是TCP/IP协议的一部分 ...

    java utils 工具类

    JavaUtils工具类是Java开发中常见的一类辅助代码集合,它们通常封装了各种常用操作,以简化编程工作。这些工具类可以提供静态方法,处理数组、字符串、日期、集合等多种对象,提高代码的可读性和复用性。在这个场景...

    Java反编译工具jd-gui

    JD-GUI是使用C++开发的一款Java反编译工具,它是一个独立图形界面的Java源代码“.class”文件反编译工具。 JD-GUI是使用C++开发的一款Java反编译工具,它是一个独立图形界面的Java源代码“.class”文件反编译工具。

Global site tag (gtag.js) - Google Analytics