- 浏览: 457731 次
- 性别:
- 来自: 杭州
-
最新评论
-
小灯笼:
Netty源码剖析视频教程网盘地址:https://pan.b ...
Netty -
ainaruto10:
Java NIO -
ainaruto10:
mark以后仔细看
Netty -
kongdong88:
Netty简单应用与线上服 ...
Netty -
13592539017:
13592539017 写道nich002 写道广告狗滚出IT ...
Netty
昨天把提取搞定了,替换的代码也写好了,只是没有完全调试成功,原因是Map中的key 是 String,而我用的是 StringBuilder,没有显示的转换为String,这作为一个Map的key,是不会报错的,虽然已经范型过了,这可能也是java的容器类与范型结合,还没解决的问题吧。
现在把所有代码全部贴出来,如有朋友遇到同类问题,可以作为参考。
注:需要jxl的jar包,我的jdk是1.6的,1.5的应该也行跑
自己写的工具类:
package com.hc; import java.io.BufferedReader; import java.io.BufferedWriter; import java.io.File; import java.io.FileFilter; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStreamReader; import java.io.OutputStreamWriter; import java.io.UnsupportedEncodingException; import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.List; import java.util.Map; import jxl.Sheet; import jxl.Workbook; public class Util { // 判断一个unicode码是不是中文 public static boolean isChinese(int charInt) { if (charInt > 19967 && charInt < 40870) { return true; } else { return false; } } // 字节流转换成字符流,同时转换编码 public static BufferedReader changeEncoding(File file) throws FileNotFoundException, UnsupportedEncodingException { FileInputStream fin = new FileInputStream(file); InputStreamReader in = new InputStreamReader(fin, "gb2312"); BufferedReader br = new BufferedReader(in); return br; } // 得到该文件夹,及其所有子文件夹下的所有目标文件 public static List<File> getAllFiles(File file) { List<File> valueFiles = new ArrayList<File>(); File[] fs = file.listFiles(); for (int i = 0; i < fs.length; i++) { if (fs[i].isDirectory()) { // 递归得到每个子文件夹下的目标文件 valueFiles.addAll(getAllFiles(fs[i])); } } // 把file文件夹下的目标文件放进去 valueFiles.addAll(Arrays.asList(getFiles(file))); return valueFiles; } // 得到一个文件夹下的目标文件,不包括子文件夹 private static File[] getFiles(File file) { // 图个方便,用匿名类了 FileFilter filter = new FileFilter() { String regex = "\\w*\\.jsp"; public boolean accept(File pathname) { return pathname.getName().matches(regex);// 文件后缀为.jsp } }; File[] fs = file.listFiles(filter); return fs; } // 提取某一文件中的所有中文 public static List<String> getChinese(File file) { try { List<String> valueList = new ArrayList<String>(); BufferedReader charArrayReader = Util.changeEncoding(file); int i = -1; StringBuilder sBuilder = new StringBuilder(); do { i = charArrayReader.read(); // System.out.print((char)i); // 如果是中文 if (Util.isChinese(i)) { sBuilder.append((char) i); } // 如果不是中 文 else { // 如果是中文 后的第一个 if (sBuilder.length() > 0) { // 把中文加进去 valueList.add(sBuilder.toString()); // 清除Builder里面的中文 sBuilder.delete(0, sBuilder.length()); } // 如果不是中文的结束,什么都不用做 } } while (i != -1); System.out.println(valueList.size()); return valueList; } catch (Exception e) { // 不做异常处理 return null; } } // 把excel里面的中英文读进来,维护成一个map public static Map<String, String> getMap() { try { File file = new File("E:/FirstWork/中文.xls"); // 怀疑编码有问题,写的调试代码,实事上,没有用到 // InputStream inputStream = new FileInputStream(file); // WorkbookSettings workbookSettings = new WorkbookSettings(); // workbookSettings.setEncoding("utf-8"); Workbook workbook = Workbook.getWorkbook(file); Sheet sheet = workbook.getSheet(0); Map<String, String> map = new HashMap<String, String>(); for (int i = 0; i < sheet.getRows(); i++) { // System.out.println(sheet.getCell(0, // i).getContents()+" "+sheet.getCell(1, i).getContents()); // new String(sheet.getCell(0, // i).getContents().getBytes("UTF-8"),"gb2312") // map.put(new String(sheet.getCell(0, // i).getContents().getBytes("utf-16le"),"gb2312"), new // String(sheet.getCell(0, // i).getContents().getBytes("UTF-8"),"gb2312")); map.put(sheet.getCell(0, i).getContents(), sheet.getCell(1, i) .getContents()); } return map; } catch (Exception e) { e.printStackTrace(); // 不做异常处理了。。。 return null; } } // 修改一个文件中的中文 public static void editFile(File file, Map<String, String> map) { try { BufferedReader charArrayReader = Util.changeEncoding(file); int i = -1; StringBuilder newFileString = new StringBuilder(); StringBuilder changeWord = new StringBuilder(); do { i = charArrayReader.read(); // System.out.print((char)i); // 如果是中文 if (Util.isChinese(i)) { changeWord.append((char) i); } // 如果不是中 文 else { // 如果是中文 后的第一个 if (changeWord.length() > 0) { // 把中文加进去 // System.out.println(changeWord+" "+map.get(changeWord.toString())); // 特别注意:key 是String,StringBuilder 要显示的转为String // ,不会自动调用toString方法的。 // 这是我直到最后才怀疑的地方 newFileString.append(map.get(changeWord.toString())); // 清除changeWordBuilder里面的中文 changeWord.delete(0, changeWord.length()); } // 如果不是中文的结束,什么都不用做 // 把非中文放进去 newFileString.append((char) i); } } while (i != -1); Util.writeBack(file, newFileString.toString()); } catch (Exception e) { // 不做异常处理 e.printStackTrace(); } } private static void writeBack(File file, String string) throws IOException { // 字节流 FileOutputStream fout = new FileOutputStream(file); // 字符流 OutputStreamWriter out = new OutputStreamWriter(fout, "gb2312"); BufferedWriter bw = new BufferedWriter(out); bw.write(string); bw.flush(); bw.close(); } }
下面就是调用了:
package com.hc; import java.io.File; import java.util.ArrayList; import java.util.List; import java.util.Map; public class Test { // // 取JSP页面中所有的中文 // public static void main(String[] args) { // // 该文件夹下的所有目标文件 // File file = new File("E:/FirstWork/rgsZS/webcontext/"); // // // 得到所有目标文件 // List<File> fileList = Util.getAllFiles(file); // System.out.println("共有JSP文件:" + fileList.size() + "个"); // // // 提取所有文件中的中文 // List<String> strList = new ArrayList<String>(); // for (File file2 : fileList) { // strList.addAll(Util.getChinese(file2)); // } // // // 把提取出来的中文打出来 // for (String string : strList) { // System.out.println(string); // } // // } // 从excel读出中文和对应的英文,并写入所有的JSP文件 public static void main(String[] args) { Map<String, String> map = Util.getMap(); System.out.println(map.size()); System.out.println(map.keySet()); // 该文件夹下的所有目标文件 File file = new File("E:/FirstWork/rgsZS/webcontext/"); // 得到所有目标文件 List<File> fileList = Util.getAllFiles(file); System.out.println("共有JSP文件:" + fileList.size() + "个"); // 修改所有文件中的中文 for (File file2 : fileList) { Util.editFile(file2, map); } } }
发表评论
-
linshi
2015-03-09 09:50 2public static List<X509 ... -
根据复合主键删除表中重复数据
2014-11-19 09:52 1417一个数据库表中,开始可能随便放了一些数据,之后把多个字段定为 ... -
jstatd的配置
2014-01-08 12:01 2110为了在本机上方便用jvisualvm看linux机器上JVM ... -
IDEA常用插件
2013-03-12 10:12 2003IDEA每次升级,插件要重装,每装一次,这些插件都要重新装过 ... -
Sybase分页查询
2012-06-08 13:02 17051Sybase的分页,可以说, ... -
ClearCase 常用命令总结
2012-06-08 10:45 6602图形化操作,也基本够用了,但很多操作,还是命令方便。 这 ... -
jgoodies FormLayout Demo
2011-07-13 17:11 4991以前看过一点jgoodies的布局,没有深入研究。这几天画界 ... -
Access 数据 导入mysql
2011-06-21 17:39 2051刚完成了一件事,虽然不难,觉得挺好玩,在这里写写。。。 ... -
[转]IntelliJ IDEA 快捷键
2011-05-03 22:17 1028本文内容,转自:h ... -
HelloWorld 之Junit 单元测试
2011-04-23 21:47 1762想重构,就要有单元测试。没有单元测试,还真不敢随便重构 ... -
Oracle客户端 绿色 安装
2011-04-22 10:38 3908很久没用Oracle了,快一年了吧!没动不代表真的就全忘了, ... -
Archlinux + Xfce4 USB 自动挂载 问题解决
2011-04-09 23:50 7799现在用U盘少了,偶尔挂载个东西,就手动mount一下来 ... -
从HTTP服务器上下载文件
2011-03-30 18:48 1804从Http服务器上下载个文件到本地。写了一点点代码,认为是能 ... -
Eclipse link resource Link文件 文件夹
2011-03-15 15:04 10566Eclipse 的link功能,做的挺好,挺实用。一直在用, ... -
网页倒计时
2010-06-03 11:33 1421刚才看setTimeout,就顺便做了个网页上的倒计时,弄来玩 ... -
SNMP 电子书 下载
2010-05-13 16:34 6219最近在看SNMP方面的资料,发现这方面的资料好少好少,网 ... -
软件测试十大公理
2010-04-20 10:39 1569今天在群里面聊天,一个网友贴出来的软件测试十 ... -
ECMA-262-3 中文 版 下载
2010-04-11 09:55 5816这里下载的是ECMA-262标准 的第三版 的中文 ... -
内心独白
2010-04-05 20:39 1261左手代码右手诗, 人情冷暖两不知。 天下酱油随手打 ... -
Eclipse 包视图折叠
2010-04-04 21:50 7970在Eclipse中,如果包多了,包名前面又完全一样, ...
相关推荐
值得一提的是,文本批量替换助手V1.0 的主文件名为"文本批量替换",用户只需执行这个程序,即可启动文本批量替换助手。绿色版软件的一个显著优势是它不带额外的注册信息或依赖项,这意味着它可以在任何一台安装了...
MyEclipse是一款强大的集成开发环境(IDE),专为Java、Web和企业级应用程序开发而设计。它是基于Eclipse平台的扩展,提供了更多的功能和服务,包括对Java EE、Spring、Hibernate等框架的良好支持。本资源是...
**jQuery Uploadify** 是一个基于jQuery的文件上传插件,它允许用户在Web应用程序中实现异步、批量或单个文件上传功能。该插件以其易用性、自定义性和高性能而受到开发者们的欢迎。在描述中提到,可能有些初学者在...
功能: 将文件(.java/.jsp/.html/.htm)中的空白行去掉 使用方法: 将deleteBlank.exe 文件放到要更新的文件夹中,双击即可 1.0.2 修改了空白格只有空格... 1.0.3 修改文件中有汉字时,处理后,汉字部分变为乱码的问题
- **Alt+F7**:查找整个工程中使用地某一个类、方法或者变量的位置。按F3可以选择找到的位置。 - **Ctrl+I**:实现方法。用于实现接口或抽象类中的方法。 - **Ctrl+Shift+U**:大小写转换。快速改变选定文本的大小写...
2. **关键词搜索**:用户只需输入要查找的关键字,工具便会快速扫描指定的文件夹,找出包含该关键字的所有文件和行。这对于定位代码问题、查找特定功能实现或进行代码审查尤其有用。 3. **高级搜索选项**:除了基本...
根据提供的文件信息,这里将详细解释与"MyElipse的所有快捷方式"相关的知识点,包括但不限于快捷键的功能、使用场景以及在开发中的实际应用。 ### MyEclipse简介 MyEclipse是基于Eclipse平台的一个插件,它为Java...
- **数据库服务器**:MySQL 8.0 是一款开源的关系型数据库管理系统,因其稳定性、速度和可靠性被广泛使用。 ### 知识点三:数据库设计 #### 数据库表设计 - **表结构**:设计了包含 `itemId`、`itemTitle`、`item...