`

使用lucene导出修改后的java代码及编译后的class文件

阅读更多

package cn.com.songjy.demo.lucene;

import java.io.File;
import java.io.FileReader;
import java.io.IOException;
import java.text.SimpleDateFormat;
import java.util.ArrayList;
import java.util.Date;
import java.util.List;

import org.apache.commons.io.FileUtils;
import org.apache.lucene.analysis.WhitespaceAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.index.CorruptIndexException;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.queryParser.ParseException;
import org.apache.lucene.queryParser.QueryParser;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.store.LockObtainFailedException;
import org.apache.lucene.util.Version;

public class ExportCode {

	private String PATH_INDEX = "lucene\\index";// 索引保存路径
	private List<File> listCode = new ArrayList<File>();
	private static List<String> code_path_java = new ArrayList<String>();
	private static String src_dir_java = "E:\\Workspaces\\java\\srt\\meg\\vasserver_jiangsu_yd\\src";//java文件目录
	private static String src_dir_class = "E:\\Workspaces\\java\\srt\\meg\\vasserver_jiangsu_yd\\bin";//class文件目录
	private String export_path = "E:\\Workspaces\\java\\srt\\MyUpload\\";//导出文件的保存路径

	/**
	 * 01_lucenc简介和创建索引初步
	 */
	public void index() {
		// 1、创建
		// Directory directory = new RAMDirectory();//索引建立在内存中
		Directory directory = null;
		try {
			directory = FSDirectory.open(new File(PATH_INDEX));// 索引建立在硬盘中
		} catch (IOException e) {
			e.printStackTrace();
		}
		// 2、创建IndexWriter
		IndexWriterConfig indexWriterConfig = new IndexWriterConfig(
				Version.LUCENE_35, new WhitespaceAnalyzer(Version.LUCENE_35));//因为要搜索字符【2013-04-19】,必须使用WhitespaceAnalyzer分词器
		IndexWriter writer = null;
		try {
			writer = new IndexWriter(directory, indexWriterConfig);
			// 删除已存在索引
			writer.deleteAll();
			// 3、创建Document
			Document doc = null;
			// 4、为Document添加Filed
			// File f = new File(PATH_FILE);
			try {
				list_java_list(src_dir_java, "java", "2013-04-19 00:00:00");
			} catch (java.text.ParseException e) {
				e.printStackTrace();
			}
			for (File file : listCode) {
				doc = new Document();
				doc.add(new Field("content", new FileReader(file)));
				doc.add(new Field("filename", file.getName(), Field.Store.YES,
						Field.Index.NOT_ANALYZED));
				doc.add(new Field("path", file.getAbsolutePath(),
						Field.Store.YES, Field.Index.NOT_ANALYZED));
				// 5、通过IndexWriter添加文档到索引中
				writer.addDocument(doc);
			}
		} catch (CorruptIndexException e) {
			e.printStackTrace();
		} catch (LockObtainFailedException e) {
			e.printStackTrace();
		} catch (IOException e) {
			e.printStackTrace();
		} finally {
			if (null != writer) {
				try {
					writer.close();
				} catch (CorruptIndexException e) {
					e.printStackTrace();
				} catch (IOException e) {
					e.printStackTrace();
				}
			}
		}
	}

	/**
	 * 02_lucene简介和搜索初步
	 * 
	 * @throws IOException
	 * @throws ParseException
	 */
	public void searcher() throws IOException, ParseException {
		// 1、创建Directory
		Directory directory = FSDirectory.open(new File(PATH_INDEX));// 索引建立在硬盘中
		// 2、创建IndexReader
		IndexReader reader = IndexReader.open(directory);
		// 3、根据IndexReader创建IndexSearcher
		IndexSearcher searcher = new IndexSearcher(reader);
		// 4、创建搜索的Query,创建parser来确定要搜索问价内容,第二个参数表示要搜索的域
		QueryParser parser = new QueryParser(Version.LUCENE_35, "content",
				new WhitespaceAnalyzer(Version.LUCENE_35));
		// 创建Query,表示要搜索域为content中包含字符串“2013-04-19”的文档
		Query query = parser.parse("2013-04-19");// 必须使用WhitespaceAnalyzer分词器
		// 5、根据searcher搜索并返回TopDocs
		TopDocs tds = searcher.search(query, 100);// 只显示100条记录
		// 6、根据TopDocs获取ScoreDoc对象
		ScoreDoc[] sds = tds.scoreDocs;
		for (ScoreDoc sd : sds) {
			// 7、根据searcher和ScoreDoc对象获取具体的Dicument对象
			Document d = searcher.doc(sd.doc);
			// 8、根据Document对象获取需要的值
			System.out.println(d.get("filename") + "[" + d.get("path") + "]");
			code_path_java.add(d.get("path"));
		}
		reader.close();
	}

	/**
	 * 递归列出【dir】目录及子目录下的所有文件
	 * 
	 * @param dir
	 *            -需要列出文件的目录,不可为null且长度必须大于0
	 * @param suffix
	 *            -列出后缀名为【suffix】的文件,如java、xml、txt,可为null
	 * @param lastModified列出最后修改
	 *            (创建)时间大于【lastModified】的文件,可为null
	 * @return List<File>
	 * @throws ParseException
	 * @throws java.text.ParseException
	 */
	public List<File> list_java_list(String dir, String suffix,
			String lastModified) throws java.text.ParseException {

		if (null != dir && dir.trim().length() > 0) {

			File file0 = new File(dir.trim());

			if (true == file0.isDirectory()) {
				File[] listFiles = file0.listFiles();

				if (null != listFiles && listFiles.length > 0) {
					String regex = "\\d{4}-\\d{2}-\\d(2) \\d{2}:\\d{2}:\\d(2)";
					SimpleDateFormat simpleDateFormat = new SimpleDateFormat(
							"yyyy-MM-dd HH:mm:ss");
					Date old = null;
					if (null != lastModified && lastModified.matches(regex))
						old = simpleDateFormat.parse(lastModified);
					for (File file : listFiles) {
						if (true == file.isFile()) {
							if (null == suffix && null == old) {
								listCode.add(file);
							} else if (null == suffix && null != old) {
								if (file.lastModified() > old.getTime())
									listCode.add(file);
							} else if (null != suffix
									&& suffix.trim().length() > 0
									&& null == old) {
								if (file.getName().endsWith(suffix.trim()))
									listCode.add(file);
							} else if (null != suffix
									&& suffix.trim().length() > 0
									&& null != old) {
								if (file.lastModified() > old.getTime()
										&& file.getName().endsWith(
												suffix.trim()))
									listCode.add(file);
							} else {
								listCode.add(file);
							}
						} else {
							list_java_list(file.getAbsolutePath(), suffix,
									lastModified);
						}
					}

				}
			}
		}

		return listCode;
	}

	/**
	 * 拷贝文件到指定目录
	 * songjy
	 * @param file_path -需拷贝的目标文件(java文件)
	 * @throws IOException
	 */
	public void copy_file(List<String> file_path) throws IOException {
		String currentDate = new SimpleDateFormat("yyyyMMdd")
				.format(new Date());
		String export_path_java = export_path + "java\\" + currentDate;
		String export_path_class = export_path + "class\\" + currentDate;
		for (String java_path : file_path) {
			File srcFile = new File(java_path);
			String[] java_path_split = java_path.split("src");
			String package_name = java_path.split("src")[java_path_split.length - 1];
			package_name = package_name.substring(0, package_name.length()
					- srcFile.getName().length());
			File dest_dir_java = new File(export_path_java + package_name);
			FileUtils.copyFileToDirectory(srcFile, dest_dir_java);// 拷贝java文件

			String class_path = src_dir_class + package_name
					+ srcFile.getName().replaceAll("\\.java", "\\.class");
			srcFile = new File(class_path);
			dest_dir_java = new File(export_path_class + package_name);
			FileUtils.copyFileToDirectory(srcFile, dest_dir_java);// 拷贝class文件
		}
	}

	public static void main(String[] args) throws IOException, ParseException,
			java.text.ParseException {
		
		ExportCode exportCode = new ExportCode();
		SimpleDateFormat simpleDateFormat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss SSS");

		System.out.println("建立索引开始!"
				+ simpleDateFormat.format(new Date()));
		exportCode.index();
		System.out.println("建立索引完成,搜索代码开始!"
				+ simpleDateFormat.format(new Date()));

		exportCode.searcher();
		System.out.println("搜索代码完成,文件拷贝开始!"
				+ simpleDateFormat.format(new Date()));

		exportCode.copy_file(code_path_java);
		System.out.println("文件拷贝完成!"
				+ simpleDateFormat.format(new Date()));
	}
}
分享到:
评论

相关推荐

    Lucene.Net2.3源码,最新版

    在 .NET 中,包通常是一组相关功能的集合,这个文件可能用于组织和导出 Lucene.Net 的不同组件。 7. **Lucene.Net-2.3.1-VS2005.csproj** 这是 Visual Studio 2005 项目的配置文件,包含了构建 Lucene.Net 2.3.1 ...

    java开源包5

    你定义的Java源代码的语法规则,直接,没有必要专门编写和维护,外部语法文件。同时保持蒸提供全面的支持,无缝集成的IDE(语法着色,代码导航,重构等)的语法和操作代码完全分离。最大限度地减少时间和费用开发...

    java开源包8

    你定义的Java源代码的语法规则,直接,没有必要专门编写和维护,外部语法文件。同时保持蒸提供全面的支持,无缝集成的IDE(语法着色,代码导航,重构等)的语法和操作代码完全分离。最大限度地减少时间和费用开发...

    java开源包10

    你定义的Java源代码的语法规则,直接,没有必要专门编写和维护,外部语法文件。同时保持蒸提供全面的支持,无缝集成的IDE(语法着色,代码导航,重构等)的语法和操作代码完全分离。最大限度地减少时间和费用开发...

    java开源包4

    你定义的Java源代码的语法规则,直接,没有必要专门编写和维护,外部语法文件。同时保持蒸提供全面的支持,无缝集成的IDE(语法着色,代码导航,重构等)的语法和操作代码完全分离。最大限度地减少时间和费用开发...

    java开源包6

    你定义的Java源代码的语法规则,直接,没有必要专门编写和维护,外部语法文件。同时保持蒸提供全面的支持,无缝集成的IDE(语法着色,代码导航,重构等)的语法和操作代码完全分离。最大限度地减少时间和费用开发...

    java开源包9

    你定义的Java源代码的语法规则,直接,没有必要专门编写和维护,外部语法文件。同时保持蒸提供全面的支持,无缝集成的IDE(语法着色,代码导航,重构等)的语法和操作代码完全分离。最大限度地减少时间和费用开发...

    java开源包101

    你定义的Java源代码的语法规则,直接,没有必要专门编写和维护,外部语法文件。同时保持蒸提供全面的支持,无缝集成的IDE(语法着色,代码导航,重构等)的语法和操作代码完全分离。最大限度地减少时间和费用开发...

    java开源包1

    你定义的Java源代码的语法规则,直接,没有必要专门编写和维护,外部语法文件。同时保持蒸提供全面的支持,无缝集成的IDE(语法着色,代码导航,重构等)的语法和操作代码完全分离。最大限度地减少时间和费用开发...

    java开源包3

    你定义的Java源代码的语法规则,直接,没有必要专门编写和维护,外部语法文件。同时保持蒸提供全面的支持,无缝集成的IDE(语法着色,代码导航,重构等)的语法和操作代码完全分离。最大限度地减少时间和费用开发...

    Java资源包01

    你定义的Java源代码的语法规则,直接,没有必要专门编写和维护,外部语法文件。同时保持蒸提供全面的支持,无缝集成的IDE(语法着色,代码导航,重构等)的语法和操作代码完全分离。最大限度地减少时间和费用开发...

    java开源包2

    你定义的Java源代码的语法规则,直接,没有必要专门编写和维护,外部语法文件。同时保持蒸提供全面的支持,无缝集成的IDE(语法着色,代码导航,重构等)的语法和操作代码完全分离。最大限度地减少时间和费用开发...

    java开源包11

    你定义的Java源代码的语法规则,直接,没有必要专门编写和维护,外部语法文件。同时保持蒸提供全面的支持,无缝集成的IDE(语法着色,代码导航,重构等)的语法和操作代码完全分离。最大限度地减少时间和费用开发...

    java开源包7

    你定义的Java源代码的语法规则,直接,没有必要专门编写和维护,外部语法文件。同时保持蒸提供全面的支持,无缝集成的IDE(语法着色,代码导航,重构等)的语法和操作代码完全分离。最大限度地减少时间和费用开发...

Global site tag (gtag.js) - Google Analytics