- 浏览: 691247 次
- 性别:
- 来自: 合肥
-
文章分类
最新评论
-
di1984HIT:
学习了,学习了!
Tomcat的URL中文乱码解决以及传输优化 -
arottenapple:
...
我的二十一天CoreJava 学习笔记 -
黯淡流觞:
...
我的二十一天CoreJava 学习笔记 -
onlyOneToOne:
wsc830719 写道@RequestMapping(val ...
spring mvc3中 ResponseBody中文乱码 -
waj_615:
但是打印订单不是简单的string 啊
用java实现打印功能
2012-2-7
继续昨天的日志。贴出工具类的代码实现。
工具类名定义为UtilFile
再定义四个方法
public static void changeChineseToHexInFile(String filePath, SwitchHexAndChineseView frame) throws IOException
public static boolean changeChineseToHexInString(StringBuilder input)
public static void changeHexToChineseInFile(String filePath, SwitchHexAndChineseView frame) throws IOException
public static boolean changeHexToStringInString(StringBuilder input)
方法说明
changeChineseToHexInFile 是用来对文件进行中文转unicode处理,至少要传一个文件名或路径。
对于第二个参数的说明,至于后面的frame是一个swing的jframe对象,这是为了做GUI界面而后加入的,为的就是如果传入的是路径,则对路径内部的文件处理时,处理一个文件后就在GUI界面里写出一个操作提示。
这里有多种方案如:
1.就是我当前使用的,在工具类中传入一个GUI对象,就可以在工具类中对GUI进行操作。因为这里的工具类是前几天写好的,不想大改,只要加入一个新参数就能GUI的项目中马上起作用。
2.方法参数这里只传一个文件名而不是路径,这样就可以在GUI的方法体中调用工具类对单个文件进行处理,处理完后再在GUI方法体内进行GUI操作。
changeChineseToHexInString 是用来对字符串进行中文转unicode处理,传入的是一个字符串。
changeHexToChineseInFile和changeHexToStringInString 是反过来的
方法实现
public static void changeHexToChineseInFile(String filePath, final SwitchHexAndChineseView frame) throws IOException { final File file = new File(filePath); //*** 如果是文件夹则查其子文件夹中的文件 if (file.isDirectory()) { //使用文件过滤器来过滤文件,只取子文件夹中的.java/.properties或路径 File[] files = file.listFiles(new FileFilter() { public boolean accept(File pathname) { return pathname.isDirectory() || pathname.getName().endsWith(".java") || pathname.getName().endsWith(".properties"); } }); //对字文件夹中的内容进行递归调用 for (File f : files) { changeHexToChineseInFile(f.getAbsolutePath(), frame); } } else { //如果是文件,则以固定的utf8编码读取文件 FileInputStream fr = new FileInputStream(file); InputStreamReader is = new InputStreamReader(fr, "utf8"); char[] cc = new char[(int) file.length()]; int readnum = is.read(cc); StringBuilder sb = new StringBuilder(readnum); sb.append(cc, 0, readnum); //对字符串进行转换处理,如果文件里没有要转换的字符则就不必对原文件进行覆盖 boolean isChange = changeHexToStringInString(sb); fr.close(); if (isChange) { //如果有转换,则以固定的utf8码对原文件进行覆盖 OutputStreamWriter osw = new OutputStreamWriter(new FileOutputStream(file), "utf8"); osw.write(sb.toString().trim()); osw.close(); //每处理完一个文件,则在awt线程中对GUI界面进行操作,在窗口中输出处理过的文件绝对路径全名 SwingUtilities.invokeLater(new Runnable() { public void run() { frame.setResultView(file.getAbsolutePath() + "\n"); } }); } } }
public static void changeChineseToHexInFile(String filePath, final SwitchHexAndChineseView frame) throws IOException { final File file = new File(filePath); //*** 如果是文件夹则查其子文件夹中的文件 if (file.isDirectory()) { File[] files = file.listFiles(new FileFilter() { public boolean accept(File pathname) { return pathname.isDirectory() || pathname.getName().endsWith(".java") || pathname.getName().endsWith(".properties"); } }); //对子文件进行递归调用 for (File f : files) { changeChineseToHexInFile(f.getAbsolutePath(), frame); } } else { //以固定utf8读取文件内容 FileInputStream fr = new FileInputStream(file); InputStreamReader is = new InputStreamReader(fr, "utf8"); char[] cc = new char[(int) file.length()]; int readnum = is.read(cc); StringBuilder sb = new StringBuilder(readnum); sb.append(cc, 0, readnum); //处理内容 boolean isChange = changeChineseToHexInString(sb); fr.close(); if (isChange) { //覆盖原文件 OutputStreamWriter osw = new OutputStreamWriter(new FileOutputStream(file), "utf8"); osw.write(sb.toString().trim()); osw.close(); //在awt线程中操作GUI SwingUtilities.invokeLater(new Runnable() { public void run() { frame.setResultView(file.getAbsolutePath() + "\n"); } }); } } }
可以看到这两个方法大部分代码都相同,还可以再重构。如再分一个方法要加emun参数,这两个方法分别再调第三个方法。这里时间不多就不在gui的工具类里做了,但我会在自己的实现工具类里再优化的。
public static boolean changeChineseToHexInString(StringBuilder input) { char each = '\u0000'; boolean isChange = false; int inputLength = input.length(); //定义一个临时变量 StringBuilder sb = new StringBuilder(inputLength); for (int i = 0; i < inputLength; i++) { each = input.charAt(i); if (String.valueOf(each).matches("[^\\u0000-\\u00FF]")) { isChange = true; //将中文转成16进制 sb.append("\\u").append(Integer.toHexString(each)); } else { sb.append(each); } } if (isChange) { //如果有变化,就将原内容替换 input.replace(0, inputLength, sb.toString()); } return isChange; }
参数使用StringBuilder是考虑性能问题,且这是个对象引用,可以直接对对象进行操作。引用中间变量sb是为了解决在循环中的正则长度匹配问题。如果不使用中间变量,而直接使用参数在循环体中进行replace替换,那么每替换一次则字符的总长度会加5,因为16进制是6位字符,而中文只是一个字符。对于正则来说在循环时如果长度发生变化则可能会抛出异常。
public static boolean changeHexToStringInString(StringBuilder input) { boolean isChange = false; //使用正则找出\u0000这种格式,且不能是\\u0000这各格式的 Matcher matcher = Pattern.compile("((?<!\\\\)\\\\u([0-9A-Fa-f]{4}))", Pattern.MULTILINE | Pattern.UNICODE_CASE).matcher(input); while (matcher.find()) { isChange = true; //每找到一处,就从找到的下标开始进行替换 input.replace(matcher.start(), matcher.end(), String.valueOf((char) Integer.parseInt(matcher.group(2), 16))); //替换后字符长度发生了变量,则要相应的更改正则的匹配范围,否则会出错 matcher.region(matcher.start() - (matcher.end() - matcher.start()), input.length()); } return isChange; }
这里的stringbuilder就更重要了,如果你只使用string则每次replace都会创建一个新对象,因为string是不变长度的,你改了字符,长度变了,那它就会创建新string对象对于性能来说是影响很大的
主要代码就是这么多,GUI代码太多了,就不贴了,直接上传成品,为了方便使用,我直接把GUI打包成了exe。运行环境是要jre1.6及以上的。小工具一个,没时间去做更好的用户体验,凑合着用吧
发表评论
-
学习计划表[最新更新2012-04-16]
2012-04-13 11:34 1581内容 重要 备注 进度 爱 ... -
java练手全程录5-对JPA的研究[最新更新2012-2-5]
2012-02-15 17:46 10142012-2-13至2012-2-15日 ... -
java练手全程录3-处理代码中文工具类
2012-02-06 19:18 10282012-2-4 和 2012-2-6 号两天空闲时间 ... -
java练手全程录2-静态页面制作
2012-02-04 16:28 10662012-2-3日 做出了网站的静态页面,首页、列表页 ... -
java练手全程录1-练手方案
2012-02-04 16:10 1106技术学了不少了,我也不是那个刚出道时剑指四方,谁与争锋的刚猛的 ... -
睡觉的隐性影响
2011-08-30 11:59 945“饥来餐饭倦时 ... -
着手准备着技术转型
2011-07-08 20:56 959最近很少写技术文型章 ... -
规划我的30年后
2011-07-06 18:33 1044做为一个程序员,每天研究的不仅仅是技术,还有自己的人生。。。 ... -
重新定位合适我的操作系统
2011-07-05 19:14 1339夏天已至,我的电脑又 ... -
在JAVA周边转了一圈,现在回来了
2011-07-04 18:20 1214好像差不多有一个月的 ... -
最近喜欢上了做脑图,以后就用脑图来发文章
2011-05-25 17:53 1552写的不少的字,没保存一下子全没了。-_-! 别 ... -
我的二十一天CoreJava 学习笔记
2011-05-16 17:10 17255前言 :最近在网上收了个做JAVA 的徒 ... -
打造能度量的真实进度
2011-04-18 15:30 1051在做项目时,会常常要报告进度。经常的,我们会写出工 ... -
团队开会的艺术之怎么开
2011-04-11 17:27 1961开会,对于我们程序员来说,也是司空见惯了,然而每次开会过后,你 ... -
项目开发过程的三重境界
2011-04-11 00:14 1153国学大师王国维在《人间词话》中有写到古今成功者三重境界,第一重 ... -
如何在重复性工作中提升自我
2011-04-09 18:55 4699最近感觉项目组的战友们都有点麻木性的疲惫了,都有点了颓废的 ... -
团队交流艺术-对事不对人
2011-04-07 18:35 1104下班了,匆匆的写上几 ... -
[一切从模仿开始]我要创造轮子
2011-03-24 18:37 1434干IT的都听过或看过一句话,别发明重复轮子。可我现在却想说,一 ... -
成功开发程序员的目标之一:灭了测试
2011-03-21 19:18 1371与不少的朋友在一起聊天时,经常会聊到开发和测试的关系。 ... -
JAVA程序员不一定非得要会SSH
2011-03-20 01:06 4827SSH框架架构对于国内来说是大行其道。国内一大半的软件 ...
相关推荐
不需要关心接受的字符串编码是UTF_8还是GBK,还是ios-8859-1,自动转换为utf-8编码格式,无需判断字符串原有编码,用法://处理编码String newStr = GetEncode.transcode(oldStr);
班级回忆录-班级回忆录系统-班级回忆录系统源码-班级回忆录管理系统-班级回忆录管理系统java代码-班级回忆录系统设计与实现-基于springboot的班级回忆录系统-基于Web的班级回忆录系统设计与实现-班级回忆录网站-班级...
编程训练-编程训练系统-编程训练系统源码-编程训练管理系统-编程训练管理系统java代码-编程训练系统设计与实现-基于springboot的编程训练系统-基于Web的编程训练系统设计与实现-编程训练网站-编程训练网站代码-编程...
JavaUtils工具类是Java开发中常见的一类代码资源,它们提供了许多便利的静态方法,用于简化常见的编程任务。在这个压缩包文件"javaUtils"中,我们可以期待找到一系列实用的工具类,比如正则表达式处理工具和Base64...
班级回忆录-班级回忆录系统-班级回忆录系统源码-班级回忆录管理系统-班级回忆录管理系统java代码-班级回忆录系统设计与实现-基于springboot的班级回忆录系统-基于Web的班级回忆录系统设计与实现-班级回忆录网站-班级...