`

根据文件头数据判断文件类型

 
阅读更多
package com.campus.utils;

import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.util.HashMap;
import java.util.Iterator;
import java.util.Map;

public class FileType {

	public final static Map<String, String> FILE_TYPE_MAP = new HashMap<String, String>();

	private FileType() {
	}

	static {
		getAllFileType(); // 初始化文件类型信息
	}

	/**   
     * Discription:[getAllFileType,常见文件头信息] 
     */     
    private static void getAllFileType(){     
        FILE_TYPE_MAP.put("ffd8ffe000104a464946", "jpg"); //JPEG (jpg)     
        FILE_TYPE_MAP.put("89504e470d0a1a0a0000", "png"); //PNG (png)     
        FILE_TYPE_MAP.put("47494638396126026f01", "gif"); //GIF (gif)     
        FILE_TYPE_MAP.put("49492a00227105008037", "tif"); //TIFF (tif)     
        FILE_TYPE_MAP.put("424d228c010000000000", "bmp"); //16色位图(bmp)     
        FILE_TYPE_MAP.put("424d8240090000000000", "bmp"); //24位位图(bmp)     
        FILE_TYPE_MAP.put("424d8e1b030000000000", "bmp"); //256色位图(bmp)     
        FILE_TYPE_MAP.put("41433130313500000000", "dwg"); //CAD (dwg)     
        FILE_TYPE_MAP.put("3c21444f435459504520", "html"); //HTML (html)
        FILE_TYPE_MAP.put("3c21646f637479706520", "htm"); //HTM (htm)
        FILE_TYPE_MAP.put("48544d4c207b0d0a0942", "css"); //css
        FILE_TYPE_MAP.put("696b2e71623d696b2e71", "js"); //js
        FILE_TYPE_MAP.put("7b5c727466315c616e73", "rtf"); //Rich Text Format (rtf)     
        FILE_TYPE_MAP.put("38425053000100000000", "psd"); //Photoshop (psd)     
        FILE_TYPE_MAP.put("46726f6d3a203d3f6762", "eml"); //Email [Outlook Express 6] (eml)       
        FILE_TYPE_MAP.put("d0cf11e0a1b11ae10000", "doc"); //MS Excel 注意:word、msi 和 excel的文件头一样     
        FILE_TYPE_MAP.put("d0cf11e0a1b11ae10000", "vsd"); //Visio 绘图     
        FILE_TYPE_MAP.put("5374616E64617264204A", "mdb"); //MS Access (mdb)      
        FILE_TYPE_MAP.put("252150532D41646F6265", "ps");     
        FILE_TYPE_MAP.put("255044462d312e350d0a", "pdf"); //Adobe Acrobat (pdf)   
        FILE_TYPE_MAP.put("2e524d46000000120001", "rmvb"); //rmvb/rm相同  
        FILE_TYPE_MAP.put("464c5601050000000900", "flv"); //flv与f4v相同  
        FILE_TYPE_MAP.put("00000020667479706d70", "mp4"); 
        FILE_TYPE_MAP.put("49443303000000002176", "mp3"); 
        FILE_TYPE_MAP.put("000001ba210001000180", "mpg"); //     
        FILE_TYPE_MAP.put("3026b2758e66cf11a6d9", "wmv"); //wmv与asf相同    
        FILE_TYPE_MAP.put("52494646e27807005741", "wav"); //Wave (wav)  
        FILE_TYPE_MAP.put("52494646d07d60074156", "avi");  
        FILE_TYPE_MAP.put("4d546864000000060001", "mid"); //MIDI (mid)   
        FILE_TYPE_MAP.put("504b0304140000000800", "zip");    
        FILE_TYPE_MAP.put("526172211a0700cf9073", "rar");   
        FILE_TYPE_MAP.put("235468697320636f6e66", "ini");   
        FILE_TYPE_MAP.put("504b03040a0000000000", "jar"); 
        FILE_TYPE_MAP.put("4d5a9000030000000400", "exe");//可执行文件
        FILE_TYPE_MAP.put("3c25402070616765206c", "jsp");//jsp文件
        FILE_TYPE_MAP.put("4d616e69666573742d56", "mf");//MF文件
        FILE_TYPE_MAP.put("3c3f786d6c2076657273", "xml");//xml文件
        FILE_TYPE_MAP.put("494e5345525420494e54", "sql");//xml文件
        FILE_TYPE_MAP.put("7061636b616765207765", "java");//java文件
        FILE_TYPE_MAP.put("406563686f206f66660d", "bat");//bat文件
        FILE_TYPE_MAP.put("1f8b0800000000000000", "gz");//gz文件
        FILE_TYPE_MAP.put("6c6f67346a2e726f6f74", "properties");//bat文件
        FILE_TYPE_MAP.put("cafebabe0000002e0041", "class");//bat文件
        FILE_TYPE_MAP.put("49545346030000006000", "chm");//bat文件
        FILE_TYPE_MAP.put("04000000010000001300", "mxp");//bat文件
        FILE_TYPE_MAP.put("504b0304140006000800", "docx");//docx文件
        FILE_TYPE_MAP.put("d0cf11e0a1b11ae10000", "wps");//WPS文字wps、表格et、演示dps都是一样的
        FILE_TYPE_MAP.put("6431303a637265617465", "torrent");
        
          
        FILE_TYPE_MAP.put("6D6F6F76", "mov"); //Quicktime (mov)  
        FILE_TYPE_MAP.put("FF575043", "wpd"); //WordPerfect (wpd)   
        FILE_TYPE_MAP.put("CFAD12FEC5FD746F", "dbx"); //Outlook Express (dbx)     
        FILE_TYPE_MAP.put("2142444E", "pst"); //Outlook (pst)      
        FILE_TYPE_MAP.put("AC9EBD8F", "qdf"); //Quicken (qdf)     
        FILE_TYPE_MAP.put("E3828596", "pwl"); //Windows Password (pwl)         
        FILE_TYPE_MAP.put("2E7261FD", "ram"); //Real Audio (ram)     
    }
    
    /**
     * 得到上传文件的文件头
     * @param src
     * @return
     */
    public static String bytesToHexString(byte[] src) {
        StringBuilder stringBuilder = new StringBuilder();
        if (src == null || src.length <= 0) {
            return null;
        }
        for (int i = 0; i < src.length; i++) {
            int v = src[i] & 0xFF;
            String hv = Integer.toHexString(v);
            if (hv.length() < 2) {
                stringBuilder.append(0);
            }
            stringBuilder.append(hv);
        }
        return stringBuilder.toString();
    }
    
    /**
     * 根据制定文件的文件头判断其文件类型
     * @param filePaht
     * @return
     */
    public static String getFileType(String filePaht){
        String res = null;
        try {
            FileInputStream is = new FileInputStream(filePaht);
            byte[] b = new byte[10];
            is.read(b, 0, b.length);
            is.close();
            String fileCode = bytesToHexString(b);    
            
            System.out.println(fileCode);
            
            
            Iterator<String> keyIter = FILE_TYPE_MAP.keySet().iterator();
            while(keyIter.hasNext()){
                String key = keyIter.next();
                if(key.toLowerCase().startsWith(fileCode.toLowerCase()) || fileCode.toLowerCase().startsWith(key.toLowerCase())){
                    res = FILE_TYPE_MAP.get(key);
                    break;
                }
            }
        } catch (FileNotFoundException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }
        return res;
    }
    
    
    
    public static void main(String[] args) {
    	String fileType = FileType.getFileType("D:/test/test1.mp4");
    	
    	System.out.println(fileType);
	}
}

 

 

来源:http://www.cnblogs.com/mq0036/p/3912355.html

分享到:
评论

相关推荐

    根据文件头信息判断文件类型

    文件头信息是判断文件类型的一种常见方法,这涉及到计算机数据存储和处理的基础。这篇博客"根据文件头信息判断文件类型"(链接:https://lstoryc.iteye.com/blog/1997076)可能深入探讨了这个主题。下面我们将详细...

    根据头信息判断文件类型

    根据头信息判断文件类型是计算机科学中的一个常见技术,它基于这样一个事实:大多数文件格式在开始部分都会包含一些特定的字节序列,这些序列被称为“魔术数字”或“文件签名”,用于标识文件的类型。这种方法在很多...

    python通过文件头判断文件类型

    ### Python通过文件头判断文件类型 #### 背景与目的 在开发涉及文件上传功能的应用时,确保用户上传的文件类型符合预期是非常重要的。这不仅有助于提高应用的安全性,还可以减少因错误文件类型导致的问题。例如,在...

    VC通过文件头格式,判断文件的真实格式

    文件头(file header),通常是指文件最开始的一段特殊数据,用来标识文件的类型、版本以及其他元信息。对于不同的文件格式,其文件头也各不相同。通过识别这些特定的文件头,可以准确地判断出文件的实际类型,这...

    java实现上传文件类型检测过程解析

    读取文件的二进制数据并将其转换为十六进制时,同类型文件的文件头数据是相同的,即使改变了其后缀,这个数据也不会改变。 在 Java 中,可以使用 FileInputStream 读取文件的二进制数据,并将其转换为十六进制字符...

    通过查看二进制文件判断文件类型

    在编程中,例如在C#中,我们可以使用`System.IO.BinaryReader`类来读取二进制文件的字节,然后对比已知的文件头签名来判断文件类型。例如,以下代码片段展示了如何读取文件头并比较JPEG签名: ```csharp using ...

    Android中Java根据文件头获取文件类型的方法

    为了提高识别的准确性,我们可以依据文件头信息来判断文件类型。文件头通常包含特定的字节序列,这些序列是文件格式的标识符。 本文将详细介绍一种在Android中使用Java根据文件头获取文件类型的实现方法。这个方法...

    复合文档文件头

    文件头包含了大量关于文档的元数据,下面将详细解析文件头中的各个字段: 1. **复合文档文件标识** (`00-07`): - 这是一段固定长度的字符串,用以标识复合文档的类型。通常情况下,该字段的内容为`DOCF11E0A1B11...

    判断几种图片文件头的c++代码

    3. 对读取到的数据进行比较,检查是否匹配GIF、BMP或JPEG的文件头特征。 4. 如果找到匹配项,输出对应的文件类型;如果没有找到,可能需要进一步扫描或者报告未知类型。 代码可能会如下所示: ```cpp #include #...

    js判断图片真实性(非判断文件后缀)

    大部分图片格式如JPEG、PNG、GIF等,其二进制数据的头部具有特定的固定字节序列,这些序列称为文件头。通过读取并比较这些文件头,我们可以有效地辨别文件是否为真正的图片。 例如,PNG图片的文件头是"\x89PNG\x0D\...

    文件类型识别软件

    TrIDNet是一款强大的文件鉴定器,它可以识别数千种不同的文件格式,通过比较文件头的16进制数据与已知的文件类型模板进行匹配。用户只需运行TrIDNet,选择待识别的文件,程序就会返回最可能的文件类型和相应的置信度...

    用C#开发的获取真实文件类型的代码

    每个文件格式都有其特定的文件头,通过读取并分析这些信息,我们可以判断文件的类型。C#提供了IO流和字节读取功能来实现这一过程。 2. **C#的FileStream类** `FileStream`是C#中用于读写文件的核心类,它继承自`...

    java如何实现判断文件的真实类型

    判断文件真实类型的应用场景非常广泛,例如,在文件上传时,服务器端可以根据文件头信息来判断文件的真实类型,以防止用户上传伪造文件。在文件下载时,也可以根据文件头信息来判断文件的真实类型,以确保下载的文件...

    TrIDNet判断文件类型

    如果这两种方法都无法确定,还可以尝试读取文件的头部信息,比如查看文件头的前几个字节是否与已知的文件类型头信息相匹配。 在提供的压缩包文件中,“如何判断文件类型.pdf”和“Java判断文件类型.pdf”很可能是...

    文件头获取图片格式和尺寸

    文件头是文件开头的一段数据,它包含了文件类型的重要标识。例如,JPEG文件通常以“FF D8”开始,PNG以“89 50 4E 47 0D 0A 1A 0A”开头,BMP则以“42 4D”为起始标志。这些独特的二进制序列可以帮助我们识别图片的...

    VC实现常见文件类型的判断

    在处理大量文件类型时,可以创建一个映射表,将扩展名或文件头标识符映射到相应的文件类型,然后在判断时查找这个映射表。 最后,需要注意的是,某些文件类型如ZIP或RAR是压缩格式,它们包含多个文件。在这种情况下...

    判断文件是文本文件还是二进制文件

    总之,判断文件是文本文件还是二进制文件是一个重要的任务,通常可以通过检查文件中的字节模式、文件头签名或者使用专门的库函数来实现。在这个过程中,理解ASCII编码和二进制数据的基本特性是非常关键的。在实际...

    根据文件特征码进行文件类型检查--VB.NET源码

    4. **确定文件类型**:如果找到匹配的特征码,根据匹配的键(即文件类型)返回结果。如果没有任何匹配,可能需要依赖文件扩展名或其他方法进行判断。 下面是一个简单的VB.NET示例代码片段,演示了如何实现这个功能...

    java程序判断文件编码的类型

    ### Java程序判断文件编码的类型 #### 知识点概览 本文档旨在教导读者如何通过Java编程语言来判断文件...通过以上方法,我们可以有效地判断文件的编码类型,并据此进行相应的编码转换操作,以确保文本数据的正确处理。

Global site tag (gtag.js) - Google Analytics