`

java 文件统计 工具类

    博客分类:
  • J2SE
阅读更多

import java.io.File;
import java.io.FileWriter;
import java.io.IOException;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.Date;
import java.util.Iterator;
import java.util.List;
import java.util.TreeMap;

/**
 * list the files in a folder,and statistic files by type
 * 
 * @author eric
 * @date 2011-2-14 下午05:12:18
 */
public class FileStatistic {
	/**
	 * list & statistic files in folder
	 * 
	 * @param folderPath path of folder to statistic
	 * @param outputPath path of result file
	 * @throws IOException
	 */
	public static void statisticFile(String folderPath, String outputPath) throws IOException {
		File folder = new File(folderPath); // folder to statistic
		File outputFile = new File(outputPath); // output file
		if (!outputFile.exists()) { // create output file if not exists
			outputFile.createNewFile();
		}
		FileWriter fw = new FileWriter(outputFile);

		if (!folder.exists()) { // folder not exists
			fw.write("folder not exists!");
			fw.flush();
			return;
		} else {
			fw.write("'" + folderPath + "' statistic result - " + new Date() + "\n");
		}

		List<String> filenameList = new ArrayList<String>();
		TreeMap<String, Integer> typecountMap = new TreeMap<String, Integer>();

		List<File> fList = getFilesRecursive(folder);
		String keyFolder = "folder"; // key for folder
		typecountMap.put(keyFolder, 0);
		for (int i = 0; i < fList.size(); i++) {
			File _file = fList.get(i);
			String _filename = _file.getName();
			filenameList.add(_filename); // store filename

			if (_file.isDirectory()) { // folder
				typecountMap.put(keyFolder, typecountMap.get(keyFolder) + 1);
			} else { // file
				String suf = getSuf(_filename);
				// statistic file type
				if (typecountMap.get(suf) == null) {
					typecountMap.put(suf, 1);
				} else {
					typecountMap.put(suf, typecountMap.get(suf) + 1);
				}
			}
		}

		fw.append("\nfile list:\n");
		for (Iterator<String> it = filenameList.iterator(); it.hasNext();) {
			fw.append("\t" + it.next() + "\n");
		}

		fw.append("\nfile type static:\n");
		for (Iterator<String> it = typecountMap.keySet().iterator(); it.hasNext();) {
			String _key = (String) it.next();
			fw.append("\t" + _key + "\t\t" + typecountMap.get(_key) + "\n");
		}

		fw.flush();
		fw.close();
	}

	/**
	 * get suffix of filename
	 * 
	 * @param filename
	 * @return
	 */
	public static String getSuf(String filename) {
		int lastIndex = filename.lastIndexOf(".");
		if (lastIndex < 0) {
			return "";
		} else {
			return filename.substring(lastIndex);
		}
	}

	/**
	 * 获得 某目录下所有的子文件列表
	 * 
	 * @param root
	 * @return
	 */
	private static List<File> getFilesRecursive(File root) {
		List<File> fileList = new ArrayList<File>();
		List<File> tmpFolderList = Arrays.asList(root);
		while (!tmpFolderList.isEmpty()) {
			tmpFolderList = getFilesRecursiveInner(fileList, tmpFolderList);
		}
		return fileList;
	}

	/**
	 * 获得 将指定目录list 下 直接 子目录/文件 放入 list,并将 直接子目录 放入 另一个 list 返回
	 * 
	 * @param fileList
	 * @param folderList
	 * @return
	 */
	private static List<File> getFilesRecursiveInner(List<File> fileList, List<File> folderList) {
		List<File> subFolderList = new ArrayList<File>();
		for (Iterator<File> it = folderList.iterator(); it.hasNext();) {
			File _folder = (File) it.next();
			File[] _files = _folder.listFiles();
			if (_files != null) {
				for (int i = 0; i < _files.length; i++) {
					File _file = _files[i];
					fileList.add(_file);
					if (_file.isDirectory()) {
						subFolderList.add(_file);
					}
				}
			}
		}
		return subFolderList;
	}

	public static void main(String[] args) throws IOException {
		statisticFile("/usr/lib", "/home/eric/filestatistic.txt");
	}
}
 
分享到:
评论

相关推荐

    java代码统计工具

    在这个场景中,我们关注的是一个名为"java代码统计工具"的应用,它专门用于统计.java文件中的代码行数和注释行数。这个工具包含了三个关键文件:`java代码统计工具.exe`是可执行程序,用户可以直接运行来执行统计;`...

    java验证文件真实格式和编码格式工具类

    这个主题主要涉及两个核心工具类:`VerifyFileType.java` 和 `VerifyFileEncoder.java`,它们分别用于验证文件的类型和编码。接下来,我们将详细讨论这两个方面。 ### 文件类型验证 `VerifyFileType.java` 类很...

    Java代码统计工具

    Java代码统计工具是一款高效实用的软件,专门针对Java和JSP编程语言的代码进行分析与统计。这款工具在开发和维护过程中起到了重要作用,因为它能够帮助程序员了解项目代码的规模、复杂性和质量,从而进行更有效的...

    java常用开发工具类大全

    - 提供了一系列数学计算和统计分析的工具类,如矩阵运算、概率分布等。 这些工具类库极大地提高了开发效率,减少了代码重复,并且在处理复杂问题时提供了强大的支持。"java常用开发工具类大全"很可能包含以上提到...

    java常用工具类汇总

    - 数学工具类可能包含一些高级的数学计算,如统计、几何、矩阵运算、随机数生成等。`MathUtils`类可能提供了Java标准库`Math`类没有的数学函数,如幂运算、取余、高精度计算等。 - 可能还包括线性代数运算,如向量...

    50个左右的JAVA工具类,相对比较全

    5. **IO工具类**:Java的java.io包基础功能,以及Apache Commons IO提供了更多高级操作,如文件复制、读写、流操作等。 6. **网络通信工具类**:如Apache HttpClient用于HTTP请求,或者OkHttp等,简化了网络请求的...

    JAVA代码统计工具,可以按人统计,很不错

    Java代码统计工具是一种用于分析和量化Java源代码的软件,主要功能是对代码量进行统计,以便于项目管理和团队协作。这种工具通常可以帮助开发者、项目经理和质量保证人员了解项目的规模、复杂性和开发进度。它们能够...

    java代码统计工具及完整代码参考.pdf

    Java代码统计工具是一种小型应用程序,用于计算特定目录下Java源代码的总行数、注释行数和空格行数。这个程序设计为在Windows 7和XP操作系统上运行,但在其他非Windows环境下可能需要对代码进行修改才能正常工作。...

    java操作es工具类整理.rar

    EsClientTest.java文件可能包含了这些功能的实现,通过运行和调试这个测试类,你可以学习并理解如何在Java应用中有效地操作Elasticsearch。注意,实际使用时,需要根据实际的集群配置和业务需求进行相应的调整。

    java检测编码工具类

    Java编码检测工具类是Java开发中非常实用的一个组件,它能够帮助开发者准确地识别和处理各种文件的编码格式。在处理跨平台或者不同系统间的数据交换时,编码问题常常成为困扰,因为不同的操作系统和程序可能使用不同...

    java常用工具类整理

    "java常用工具类整理"这个主题涵盖了Java开发中常用的工具类,这些类在日常编程中非常实用,能大大提高开发效率。这里我们将深入探讨一些常见的Java工具类,并结合`com-jarvis-base`这个文件名,推测这是一个基础...

    Java后端常用工具类

    本主题聚焦于"Java后端常用工具类",涵盖了多个方面,包括依赖管理、日志记录、数据库配置、文件操作以及Spring框架的配置。 首先,`POM依赖.txt`文件通常包含了项目的Maven或Gradle构建系统的依赖信息。对于Java...

    java 大文件ip 统计

    综上所述,Java大文件IP统计涉及的主要知识点有:Java文件I/O,流式处理,IP地址的处理与比较,数据结构(如HashMap和TreeMap)的选择,以及可能的并发和分布式计算。通过这些技术,我们可以高效地处理大文件中的IP...

    28个java常用的工具类源码

    在Java编程中,工具类(Utility Class)是包含各种静态方法的类,这些方法提供了方便的功能,例如字符串处理、集合操作、数学计算等。这里提到的"28个java常用的工具类源码"包含了Java开发中经常用到的一些实用工具...

    获取编码格式的工具类

    本文将详细探讨“获取编码格式的工具类”这一主题,它旨在帮助开发者处理不同编码格式的文本文件,如UTF-8和GBK等。 首先,我们要了解编码格式的基本概念。常见的字符编码有ASCII、GB2312、GBK、BIG5以及Unicode...

    Elasticsearch的JAVA操作工具类,包括增删改查的封装

    本文将详细介绍如何构建一个封装了基本增删改查功能的Elasticsearch Java工具类。 首先,我们需要引入Elasticsearch的Java客户端依赖。在Maven项目中,可以在pom.xml文件中添加以下依赖: ```xml &lt;groupId&gt;org....

    java统计单个文件行数

    此外,如果需要统计大量文件的行数,可以考虑使用多线程或者异步处理来提升效率,但这会引入更多的并发控制问题,比如使用`java.util.concurrent`包中的工具。 总的来说,统计文件行数是Java开发中基础但实用的操作...

    代码行统计工具java源码

    《代码行统计工具Java源码解析》 在软件开发中,代码行数(Lines of Code,简称LOC)常被用作衡量项目规模和工作量的一个参考指标。代码行统计工具可以帮助开发者快速了解项目的整体结构,便于管理和优化。本文将...

Global site tag (gtag.js) - Google Analytics