`
武瑞华
  • 浏览: 10970 次
  • 性别: Icon_minigender_1
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

在Java里处理文件的技巧

阅读更多

从URL转换为File的方法:

 

1. 先判断URL是否是 file: 开头的

 

2. 用 new File(url.toURI());  来转换为File

 

注意,因为url当有空格时,会被转义为%20,所以要转换为URL,再转为File。另外要注意处理这个转义时不能使用URLDecoder。

 

参考:http://stackoverflow.com/a/17870390

 

 

 

写这篇Blog,主要是因为看到太多的凌乱的,不安全的处理文件的代码了。甚至可以说每个项目都会有人喜欢写自己的一些FileUitl。。

 

下面介绍一些利用JDK7标准库来灵活处理文件的方法。

 

实用的工具类,Path,Paths,Files,FileSystem 

 

有一些很灵活的处理方法: 

 

[java] view plain copy在CODE上查看代码片派生到我的代码片
  1. //得到一个Path对象  
  2. Path path = Paths.get("/test/a.txt");  
  3. //Path转换File  
  4. File file = path.toFile();  
  5.   
  6. Files.readAllBytes(path);  
  7. Files.deleteIfExists(path);  
  8. Files.size(path);  

 

正确拼接路径不要手动拼接路径

 

不好的代码: 

 

[java] view plain copy在CODE上查看代码片派生到我的代码片
  1. String game = "foo";  
  2. File file = new File("~/test/" + game + ".txt");  

即使是要手动拼接路径,请使用下面两个平台无关的变量: 

[java] view plain copy在CODE上查看代码片派生到我的代码片
  1. System.out.println(File.pathSeparator);  
  2. System.out.println(File.separator);  

正确简洁的方法是使用Paths类: 

[java] view plain copy在CODE上查看代码片派生到我的代码片
  1. Path path = Paths.get("~/test/""foo""bar""a.txt");  
  2. System.out.println(path);  
  3. //  ~/test/foo/bar/a.txt  

 

读取文件的所有内容,文件的所有行

 

读取文件所有内容前,先判断文件大小,防止OOM。 

 

[java] view plain copy在CODE上查看代码片派生到我的代码片
  1. public static byte[] readAllBytes(String fileName, long maxSize) throws IOException {  
  2.     Path path = Paths.get(fileName);  
  3.     long size = Files.size(path);  
  4.     if (size > maxSize) {  
  5.         throw new IOException("file: " + path + ", size:" + size + "> " + maxSize);  
  6.     }  
  7.     return Files.readAllBytes(path);  
  8. }  
  9.   
  10. public static List<String> readAlllines(String fileName, Charset charset, long maxSize) throws IOException {  
  11.     Path path = Paths.get(fileName);  
  12.     long size = Files.size(path);  
  13.     if (size > maxSize) {  
  14.         throw new IOException("file: " + path + ", size:" + size + "> " + maxSize);  
  15.     }  
  16.     return Files.readAllLines(path, charset);  
  17. }  

 

利用JDK7的特性,auto close,远离一堆的catch, close

 

[java] view plain copy在CODE上查看代码片派生到我的代码片
  1. Path path = Paths.get("~/test/""foo""bar""a.txt");  
  2. try (InputStream in = Files.newInputStream(path)) {  
  3.     // process  
  4.     //in.read();  
  5. }  

 

历遍目录

 

DK7新特性,FileVisitor 

 

[java] view plain copy在CODE上查看代码片派生到我的代码片
  1. public class MyFileVisitor extends SimpleFileVisitor<Path>{  
  2.     @Override  
  3.     public FileVisitResult visitFile(Path file, BasicFileAttributes attrs) throws IOException {  
  4.         System.out.println(file);  
  5.         return FileVisitResult.CONTINUE;  
  6.     }  
  7.       
  8.     public static void main(String[] args) throws IOException {  
  9.         Path path = Paths.get("/home/user/test");  
  10.         Files.walkFileTree(path, new MyFileVisitor());  
  11.     }  
  12. }  

 

判断文件是否在父路径下

 

网上流传一种递归判断parent的方式,http://stackoverflow.com/questions/18227634/check-if-file-is-in-subdirectory

 

但是查阅jdk代码后,发现getParent()函数是通过处理文件名得到的。所以直接比较文件前缀即可。 

请务必注意,file.getCanonicalPath()函数

 

[java] view plain copy在CODE上查看代码片派生到我的代码片
  1. public static boolean isSubFile(File parent, File child) throws IOException {  
  2.     return child.getCanonicalPath().startsWith(parent.getCanonicalPath());  
  3. }  
  4.   
  5.   
  6. public static boolean isSubFile(String parent, String child) throws IOException {  
  7.     return isSubFile(new File(parent), new File(child));  
  8. }  

 

监视文件改变

 

JDK7新特性,但是API比较难用。TODO 

 

淘宝有个diamond的配置管理项目,是利用定时器不断去读取来文件是否改变的。

 

JDK7则是利用了linux的inotify机制。

 

Web服务器防止非法的文件路径访问

 

字符截断攻击和文件历遍漏洞原理:在文件名中插入%00的URL编码,web服务器会把%00后面的内容抛弃。 

 

例如这样的URL:http://www.test.com/../../../../etc/passwd%00.gif

 

防范方法

 

  • 写入文件前,判断文件是否在父路径下,参考上面的函数。 
  • 利用Java的安全机制 

 

[java] view plain copy在CODE上查看代码片派生到我的代码片
  1. // All files in /img/java can be read  
  2. grant codeBase "file:/home/programpath/" {  
  3.   permission java.io.FilePermission "/img/java""read";  
  4. };  

Tomcat的设置 
http://tomcat.apache.org/tomcat-7.0-doc/security-manager-howto.html

  • 静态资源不要自己手写代码去读取,尽量使用Web服务器或者Web框架的本身的静态资源映射功能。

 

比如Tomcat的默认自带的DefaultServlet:

 

[html] view plain copy在CODE上查看代码片派生到我的代码片
  1. <servlet-mapping>  
  2.     <servlet-name>default</servlet-name>  
  3.     <url-pattern>/static/*</url-pattern>  
  4. </servlet-mapping>  

Spring mvc可以配置

[html] view plain copy在CODE上查看代码片派生到我的代码片
  1. <mvc:resources mapping="/resources/**" location="/public-resources/"/>  

或者使用spring mvc里的DefaultServletHttpRequestHandler。这个默认优先级是最低的,也就是最后没人处理的URL会交给WebServer本身的default servlet去处理。比如Tomcat的就是上面所说的。

[html] view plain copy在CODE上查看代码片派生到我的代码片
  1. <mvc:default-servlet-handler/>  

个人推荐使用DefaultServletHttpRequestHandler,因为Web容器的文件访问功能要比Spring mvc自身的要强大。比如Tomcat的DefaultServlet支持Etag,断点续传,缓存等。

参考:

 

http://docs.spring.io/spring/docs/current/spring-framework-reference/html/mvc.html

http://svn.apache.org/repos/asf/tomcat/trunk/java/org/apache/catalina/servlets/DefaultServlet.java

 

分享到:
评论

相关推荐

    在Java里处理文件的技巧Java开发Java经验技巧共5

    在Java编程语言中,处理文件是一项基础且重要的任务。无论是读取、写入、移动、复制还是删除文件,Java都提供了丰富的API来支持这些操作。本篇内容将深入探讨Java中处理文件的一些关键技巧和最佳实践,以帮助开发者...

    java 解析 chm 文件

    Java解析CHM文件是将Microsoft的 Compiled HTML Help (CHM) 文件转换...这个过程可能涉及到对CHM结构的理解、使用特定库的API,以及处理文件I/O和异常的技巧。对于需要处理CHM文件的Java开发者来说,这些知识是必备的。

    JAVA 哈工大JAVA实验 文件切割合并处理

    在JAVA编程语言中,文件切割和合并是常见的文件操作任务,尤其在大数据处理、网络传输或者存储优化等场景中有着广泛的...通过这个实验,学生将能够熟练运用JAVA处理文件,为未来从事相关领域的开发工作打下坚实的基础。

    Java 遍历文件夹内文件

    在Java编程中,遍历文件夹内的文件是一项常见的任务,特别是在处理文件系统操作时。这个话题涉及到了Java的I/O(输入/输出)流、文件系统API和递归概念。以下是对这一主题的详细讲解: 首先,Java提供了一个强大的`...

    Java读取资源文件时内容过长与换行的处理

    ### Java读取资源文件时内容过长与换行的处理 在Java开发过程中,经常会遇到需要读取资源文件的情况,比如配置文件、属性文件等。这些文件中的内容有时会非常长,或者为了提高可读性,需要进行换行处理。本文将详细...

    python/java处理文件遍历

    本文将深入探讨这两个编程语言如何处理文件遍历,并结合提供的标签“源码”和“工具”,分享一些实用的技巧和示例。 首先,让我们从Python开始。在Python中,文件遍历主要依赖于`os`和`os.path`这两个内置模块。`os...

    Java特效处理技巧

    ### Java特效处理技巧详解 #### 一、Java特效概述 Java特效主要指通过Java语言为网页增添动态效果的技术。这些特效通常包括但不限于图片变换、文字动画、3D效果等,可以显著提升网页的视觉吸引力和用户体验。Java...

    Java实现多个wav文件合成一个的方法示例

    在上面的代码中,我们实现了wav文件的合成,但是我们也可以使用Java中的音频处理类库,例如JAudioTagger和JavaSound,来实现更多的音频处理操作。 本文介绍了Java实现多个wav文件合成一个的方法,涉及java文件流...

    深入理解java异常处理机制Java开发Java经验技巧共

    这篇19页的PDF文档《深入理解java异常处理机制Java开发Java经验技巧共》可能涵盖了Java异常处理的基本概念、最佳实践以及高级用法。在Java中,异常处理通过五个关键字来实现:try、catch、finally、throw和throws。 ...

    java 二进制文件的读写操作

    在Java中,进行二进制文件的读写操作是非常常见的需求,尤其是在处理非文本类型的文件(如图片、音频或视频等)时。本文将详细介绍如何使用`FileInputStream`和`FileOutputStream`类来实现二进制文件的读写,并提供...

    java实现wav文件转成mp3文件

    Java实现将WAV文件转换为MP3文件是一个常见的音频处理任务,主要涉及到音频编码和解码的知识。在本文中,我们将深入探讨这个过程,并提供一些关键的编程概念和技术。 首先,WAV和MP3是两种不同的音频文件格式。WAV...

    java创建TXT文件并进行读、写操作(代码)

    通过上述讲解和代码示例,我们可以看到Java提供了丰富的API来处理文件的创建、读取、写入和修改。掌握这些基本的文件操作技巧对于任何Java开发者来说都是非常重要的。希望本文能帮助你在实际项目中更加熟练地使用...

    java解析资源文件

    本教程将深入讲解如何在Java中处理资源文件,以及使用jbom解析工具的相关知识。 首先,理解资源文件的定位。在Java应用中,资源文件通常位于`src/main/resources`目录下(对于Maven或Gradle项目)。这些文件会被...

    java 导入Excel 文件,支持xls、xlsx、csv格式

    综上所述,Java导入Excel文件涉及的关键技术包括Apache POI库的使用,对HSSF和XSSF的理解,以及对CSV文件处理的技巧。通过熟练掌握这些知识,你可以编写出高效且健壮的文件导入程序,满足各种需求。

    Java模拟DOS文件系统

    6. 文件复制:将源文件的内容复制到目标文件,可能需要处理文件重名的情况。 7. 文件查找:根据文件名在文件系统中搜索指定文件。 8. 文件编辑:读取文件内容,允许用户修改,然后保存更改。 `FileModel.java`文件...

    java操作压缩文件和解压文件实例代码(经测试)

    4. **路径和文件名处理**:在使用上述API时,必须正确处理文件路径和名称。在`CompressBook.java`中,可能需要设置输入文件和输出文件的路径,这通常涉及到Java的`java.io.File`类。确保路径是绝对的或相对于工作...

    java读取txt文件代码

    通过理解基本的读取流程和进阶的数据处理技巧,可以更高效地处理各种文本文件,从而在实际项目中发挥重要作用。此外,良好的编码习惯,如异常处理和资源管理,也是编写健壮代码不可或缺的一部分。

    java解压zip压缩文件

    在Java编程环境中,解压ZIP压缩文件是一项常见的任务,它涉及到文件I/O操作以及对...`UnZip.java`和`UnZip2.java`文件可能是这种功能的具体实现,通过阅读它们的源代码,可以深入了解Java解压ZIP文件的各种策略和技巧。

    java关于文件的操作

    本教程将深入探讨如何在Java中处理文件,特别是在将文本文件用作数据存储时进行查询和更新的基本方法。 首先,我们要了解Java中的`java.io`包,这个包提供了大量用于进行文件操作的类。例如,`File`类用于表示文件...

    java 开发的文件系统

    在Java编程语言中,开发一个Linux文件系统的模拟器是一项复杂而有趣的任务,它涉及到对操作系统内核级概念的理解以及Java I/O流、多线程、类库和设计模式的熟练运用。以下是一些核心知识点: 1. **Java I/O流**: ...

Global site tag (gtag.js) - Google Analytics