用Java的I/O批量替换某一文件夹下（包括其子文件夹）所有JSP文件中的中文为英文

lippeng

浏览: 456833 次
性别:
来自: 杭州

最近访客更多访客>>

huangyongxing310

ritchie27

lansuiyun

李小妖

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

CornField

Java JSP Excel JDK

昨天把提取搞定了，替换的代码也写好了，只是没有完全调试成功，原因是Map中的key 是 String，而我用的是 StringBuilder，没有显示的转换为String，这作为一个Map的key，是不会报错的，虽然已经范型过了，这可能也是java的容器类与范型结合，还没解决的问题吧。

现在把所有代码全部贴出来，如有朋友遇到同类问题，可以作为参考。

注：需要jxl的jar包，我的jdk是1.6的，1.5的应该也行跑

自己写的工具类：

package com.hc;

import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileFilter;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.OutputStreamWriter;
import java.io.UnsupportedEncodingException;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.HashMap;
import java.util.List;
import java.util.Map;

import jxl.Sheet;
import jxl.Workbook;

public class Util {

	// 判断一个unicode码是不是中文
	public static boolean isChinese(int charInt) {
		if (charInt > 19967 && charInt < 40870) {
			return true;
		} else {
			return false;
		}
	}

	// 字节流转换成字符流，同时转换编码
	public static BufferedReader changeEncoding(File file)
			throws FileNotFoundException, UnsupportedEncodingException {
		FileInputStream fin = new FileInputStream(file);
		InputStreamReader in = new InputStreamReader(fin, "gb2312");
		BufferedReader br = new BufferedReader(in);
		return br;
	}

	// 得到该文件夹，及其所有子文件夹下的所有目标文件
	public static List<File> getAllFiles(File file) {
		List<File> valueFiles = new ArrayList<File>();
		File[] fs = file.listFiles();
		for (int i = 0; i < fs.length; i++) {
			if (fs[i].isDirectory()) {
				// 递归得到每个子文件夹下的目标文件
				valueFiles.addAll(getAllFiles(fs[i]));
			}
		}
		// 把file文件夹下的目标文件放进去
		valueFiles.addAll(Arrays.asList(getFiles(file)));
		return valueFiles;
	}

	// 得到一个文件夹下的目标文件，不包括子文件夹
	private static File[] getFiles(File file) {
		// 图个方便，用匿名类了
		FileFilter filter = new FileFilter() {
			String regex = "\\w*\\.jsp";

			public boolean accept(File pathname) {
				return pathname.getName().matches(regex);// 文件后缀为.jsp
			}
		};
		File[] fs = file.listFiles(filter);
		return fs;
	}

	// 提取某一文件中的所有中文
	public static List<String> getChinese(File file) {
		try {
			List<String> valueList = new ArrayList<String>();
			BufferedReader charArrayReader = Util.changeEncoding(file);
			int i = -1;
			StringBuilder sBuilder = new StringBuilder();
			do {
				i = charArrayReader.read();
				// System.out.print((char)i);

				// 如果是中文
				if (Util.isChinese(i)) {
					sBuilder.append((char) i);
				}
				// 如果不是中 文
				else {
					// 如果是中文 后的第一个
					if (sBuilder.length() > 0) {
						// 把中文加进去
						valueList.add(sBuilder.toString());

						// 清除Builder里面的中文
						sBuilder.delete(0, sBuilder.length());
					}
					// 如果不是中文的结束，什么都不用做
				}
			} while (i != -1);
			System.out.println(valueList.size());
			return valueList;
		} catch (Exception e) {
			// 不做异常处理
			return null;
		}

	}

	// 把excel里面的中英文读进来，维护成一个map
	public static Map<String, String> getMap() {
		try {
			File file = new File("E:/FirstWork/中文.xls");
			// 怀疑编码有问题，写的调试代码，实事上，没有用到
			// InputStream inputStream = new FileInputStream(file);
			// WorkbookSettings workbookSettings = new WorkbookSettings();
			// workbookSettings.setEncoding("utf-8");
			Workbook workbook = Workbook.getWorkbook(file);
			Sheet sheet = workbook.getSheet(0);
			Map<String, String> map = new HashMap<String, String>();
			for (int i = 0; i < sheet.getRows(); i++) {
				// System.out.println(sheet.getCell(0,
				// i).getContents()+" "+sheet.getCell(1, i).getContents());
				// new String(sheet.getCell(0,
				// i).getContents().getBytes("UTF-8"),"gb2312")
				// map.put(new String(sheet.getCell(0,
				// i).getContents().getBytes("utf-16le"),"gb2312"), new
				// String(sheet.getCell(0,
				// i).getContents().getBytes("UTF-8"),"gb2312"));
				map.put(sheet.getCell(0, i).getContents(), sheet.getCell(1, i)
						.getContents());
			}
			return map;
		} catch (Exception e) {
			e.printStackTrace();
			// 不做异常处理了。。。
			return null;
		}

	}

	// 修改一个文件中的中文
	public static void editFile(File file, Map<String, String> map) {
		try {
			BufferedReader charArrayReader = Util.changeEncoding(file);
			int i = -1;
			StringBuilder newFileString = new StringBuilder();
			StringBuilder changeWord = new StringBuilder();
			do {
				i = charArrayReader.read();
				// System.out.print((char)i);

				// 如果是中文
				if (Util.isChinese(i)) {
					changeWord.append((char) i);
				}
				// 如果不是中 文
				else {
					// 如果是中文 后的第一个
					if (changeWord.length() > 0) {
						// 把中文加进去
						// System.out.println(changeWord+" "+map.get(changeWord.toString()));

						// 特别注意：key 是String，StringBuilder 要显示的转为String
						// ，不会自动调用toString方法的。
						// 这是我直到最后才怀疑的地方
						newFileString.append(map.get(changeWord.toString()));
						// 清除changeWordBuilder里面的中文
						changeWord.delete(0, changeWord.length());
					}
					// 如果不是中文的结束，什么都不用做
					// 把非中文放进去
					newFileString.append((char) i);
				}
			} while (i != -1);
			Util.writeBack(file, newFileString.toString());
		} catch (Exception e) {
			// 不做异常处理
			e.printStackTrace();
		}

	}

	private static void writeBack(File file, String string) throws IOException {
		// 字节流
		FileOutputStream fout = new FileOutputStream(file);
		// 字符流
		OutputStreamWriter out = new OutputStreamWriter(fout, "gb2312");
		BufferedWriter bw = new BufferedWriter(out);
		bw.write(string);
		bw.flush();
		bw.close();

	}

}

下面就是调用了：

package com.hc;

import java.io.File;
import java.util.ArrayList;
import java.util.List;
import java.util.Map;

public class Test {

	// // 取JSP页面中所有的中文
	// public static void main(String[] args) {
	// // 该文件夹下的所有目标文件
	// File file = new File("E:/FirstWork/rgsZS/webcontext/");
	//
	// // 得到所有目标文件
	// List<File> fileList = Util.getAllFiles(file);
	// System.out.println("共有JSP文件：" + fileList.size() + "个");
	//
	// // 提取所有文件中的中文
	// List<String> strList = new ArrayList<String>();
	// for (File file2 : fileList) {
	// strList.addAll(Util.getChinese(file2));
	// }
	//
	// // 把提取出来的中文打出来
	// for (String string : strList) {
	// System.out.println(string);
	// }
	//
	// }

	// 从excel读出中文和对应的英文，并写入所有的JSP文件
	public static void main(String[] args) {
		Map<String, String> map = Util.getMap();
		System.out.println(map.size());
		System.out.println(map.keySet());

		// 该文件夹下的所有目标文件
		File file = new File("E:/FirstWork/rgsZS/webcontext/");

		// 得到所有目标文件
		List<File> fileList = Util.getAllFiles(file);
		System.out.println("共有JSP文件：" + fileList.size() + "个");

		// 修改所有文件中的中文
		for (File file2 : fileList) {
			Util.editFile(file2, map);
		}

	}

}

0
顶

0
踩

分享到：

Servlet路径问题 | 用Java的I/O批量提取某一文件夹下（包括其 ...

2009-12-04 09:26
浏览 2809
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

用Java的I/O批量替换某一文件夹下（包括其子文件夹）所有JSP文件中的中文为英文

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

用Java的I/O批量替换某一文件夹下（包括其子文件夹）所有JSP文件中的中文为英文

评论

发表评论

相关推荐

linshi

根据复合主键删除表中重复数据

jstatd的配置

IDEA常用插件

Sybase分页查询

ClearCase 常用命令总结

jgoodies FormLayout Demo

Access 数据 导入mysql

［转］IntelliJ IDEA 快捷键

ＨelloWorld 之Junit 单元测试

Oracle客户端 绿色 安装

Archlinux + Xfce4 USB 自动挂载 问题解决

从HTTP服务器上下载文件

Eclipse link resource Link文件 文件夹

网页倒计时

SNMP 电子书 下载

软件测试十大公理

ECMA-262-3 中文 版 下载

内心独白

Eclipse 包视图折叠

最近访客更多访客>>

Access 数据导入mysql

ＨelloWorld 之Junit 单元测试　

Oracle客户端绿色安装

Archlinux + Xfce4 USB 自动挂载　问题解决

Eclipse link resource Link文件文件夹

SNMP 电子书下载

ECMA-262-3 中文版下载