package com.campus.utils; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.IOException; import java.util.HashMap; import java.util.Iterator; import java.util.Map; public class FileType { public final static Map<String, String> FILE_TYPE_MAP = new HashMap<String, String>(); private FileType() { } static { getAllFileType(); // 初始化文件类型信息 } /** * Discription:[getAllFileType,常见文件头信息] */ private static void getAllFileType(){ FILE_TYPE_MAP.put("ffd8ffe000104a464946", "jpg"); //JPEG (jpg) FILE_TYPE_MAP.put("89504e470d0a1a0a0000", "png"); //PNG (png) FILE_TYPE_MAP.put("47494638396126026f01", "gif"); //GIF (gif) FILE_TYPE_MAP.put("49492a00227105008037", "tif"); //TIFF (tif) FILE_TYPE_MAP.put("424d228c010000000000", "bmp"); //16色位图(bmp) FILE_TYPE_MAP.put("424d8240090000000000", "bmp"); //24位位图(bmp) FILE_TYPE_MAP.put("424d8e1b030000000000", "bmp"); //256色位图(bmp) FILE_TYPE_MAP.put("41433130313500000000", "dwg"); //CAD (dwg) FILE_TYPE_MAP.put("3c21444f435459504520", "html"); //HTML (html) FILE_TYPE_MAP.put("3c21646f637479706520", "htm"); //HTM (htm) FILE_TYPE_MAP.put("48544d4c207b0d0a0942", "css"); //css FILE_TYPE_MAP.put("696b2e71623d696b2e71", "js"); //js FILE_TYPE_MAP.put("7b5c727466315c616e73", "rtf"); //Rich Text Format (rtf) FILE_TYPE_MAP.put("38425053000100000000", "psd"); //Photoshop (psd) FILE_TYPE_MAP.put("46726f6d3a203d3f6762", "eml"); //Email [Outlook Express 6] (eml) FILE_TYPE_MAP.put("d0cf11e0a1b11ae10000", "doc"); //MS Excel 注意:word、msi 和 excel的文件头一样 FILE_TYPE_MAP.put("d0cf11e0a1b11ae10000", "vsd"); //Visio 绘图 FILE_TYPE_MAP.put("5374616E64617264204A", "mdb"); //MS Access (mdb) FILE_TYPE_MAP.put("252150532D41646F6265", "ps"); FILE_TYPE_MAP.put("255044462d312e350d0a", "pdf"); //Adobe Acrobat (pdf) FILE_TYPE_MAP.put("2e524d46000000120001", "rmvb"); //rmvb/rm相同 FILE_TYPE_MAP.put("464c5601050000000900", "flv"); //flv与f4v相同 FILE_TYPE_MAP.put("00000020667479706d70", "mp4"); FILE_TYPE_MAP.put("49443303000000002176", "mp3"); FILE_TYPE_MAP.put("000001ba210001000180", "mpg"); // FILE_TYPE_MAP.put("3026b2758e66cf11a6d9", "wmv"); //wmv与asf相同 FILE_TYPE_MAP.put("52494646e27807005741", "wav"); //Wave (wav) FILE_TYPE_MAP.put("52494646d07d60074156", "avi"); FILE_TYPE_MAP.put("4d546864000000060001", "mid"); //MIDI (mid) FILE_TYPE_MAP.put("504b0304140000000800", "zip"); FILE_TYPE_MAP.put("526172211a0700cf9073", "rar"); FILE_TYPE_MAP.put("235468697320636f6e66", "ini"); FILE_TYPE_MAP.put("504b03040a0000000000", "jar"); FILE_TYPE_MAP.put("4d5a9000030000000400", "exe");//可执行文件 FILE_TYPE_MAP.put("3c25402070616765206c", "jsp");//jsp文件 FILE_TYPE_MAP.put("4d616e69666573742d56", "mf");//MF文件 FILE_TYPE_MAP.put("3c3f786d6c2076657273", "xml");//xml文件 FILE_TYPE_MAP.put("494e5345525420494e54", "sql");//xml文件 FILE_TYPE_MAP.put("7061636b616765207765", "java");//java文件 FILE_TYPE_MAP.put("406563686f206f66660d", "bat");//bat文件 FILE_TYPE_MAP.put("1f8b0800000000000000", "gz");//gz文件 FILE_TYPE_MAP.put("6c6f67346a2e726f6f74", "properties");//bat文件 FILE_TYPE_MAP.put("cafebabe0000002e0041", "class");//bat文件 FILE_TYPE_MAP.put("49545346030000006000", "chm");//bat文件 FILE_TYPE_MAP.put("04000000010000001300", "mxp");//bat文件 FILE_TYPE_MAP.put("504b0304140006000800", "docx");//docx文件 FILE_TYPE_MAP.put("d0cf11e0a1b11ae10000", "wps");//WPS文字wps、表格et、演示dps都是一样的 FILE_TYPE_MAP.put("6431303a637265617465", "torrent"); FILE_TYPE_MAP.put("6D6F6F76", "mov"); //Quicktime (mov) FILE_TYPE_MAP.put("FF575043", "wpd"); //WordPerfect (wpd) FILE_TYPE_MAP.put("CFAD12FEC5FD746F", "dbx"); //Outlook Express (dbx) FILE_TYPE_MAP.put("2142444E", "pst"); //Outlook (pst) FILE_TYPE_MAP.put("AC9EBD8F", "qdf"); //Quicken (qdf) FILE_TYPE_MAP.put("E3828596", "pwl"); //Windows Password (pwl) FILE_TYPE_MAP.put("2E7261FD", "ram"); //Real Audio (ram) } /** * 得到上传文件的文件头 * @param src * @return */ public static String bytesToHexString(byte[] src) { StringBuilder stringBuilder = new StringBuilder(); if (src == null || src.length <= 0) { return null; } for (int i = 0; i < src.length; i++) { int v = src[i] & 0xFF; String hv = Integer.toHexString(v); if (hv.length() < 2) { stringBuilder.append(0); } stringBuilder.append(hv); } return stringBuilder.toString(); } /** * 根据制定文件的文件头判断其文件类型 * @param filePaht * @return */ public static String getFileType(String filePaht){ String res = null; try { FileInputStream is = new FileInputStream(filePaht); byte[] b = new byte[10]; is.read(b, 0, b.length); is.close(); String fileCode = bytesToHexString(b); System.out.println(fileCode); Iterator<String> keyIter = FILE_TYPE_MAP.keySet().iterator(); while(keyIter.hasNext()){ String key = keyIter.next(); if(key.toLowerCase().startsWith(fileCode.toLowerCase()) || fileCode.toLowerCase().startsWith(key.toLowerCase())){ res = FILE_TYPE_MAP.get(key); break; } } } catch (FileNotFoundException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } return res; } public static void main(String[] args) { String fileType = FileType.getFileType("D:/test/test1.mp4"); System.out.println(fileType); } }
相关推荐
文件头信息是判断文件类型的一种常见方法,这涉及到计算机数据存储和处理的基础。这篇博客"根据文件头信息判断文件类型"(链接:https://lstoryc.iteye.com/blog/1997076)可能深入探讨了这个主题。下面我们将详细...
根据头信息判断文件类型是计算机科学中的一个常见技术,它基于这样一个事实:大多数文件格式在开始部分都会包含一些特定的字节序列,这些序列被称为“魔术数字”或“文件签名”,用于标识文件的类型。这种方法在很多...
### Python通过文件头判断文件类型 #### 背景与目的 在开发涉及文件上传功能的应用时,确保用户上传的文件类型符合预期是非常重要的。这不仅有助于提高应用的安全性,还可以减少因错误文件类型导致的问题。例如,在...
文件头(file header),通常是指文件最开始的一段特殊数据,用来标识文件的类型、版本以及其他元信息。对于不同的文件格式,其文件头也各不相同。通过识别这些特定的文件头,可以准确地判断出文件的实际类型,这...
读取文件的二进制数据并将其转换为十六进制时,同类型文件的文件头数据是相同的,即使改变了其后缀,这个数据也不会改变。 在 Java 中,可以使用 FileInputStream 读取文件的二进制数据,并将其转换为十六进制字符...
在编程中,例如在C#中,我们可以使用`System.IO.BinaryReader`类来读取二进制文件的字节,然后对比已知的文件头签名来判断文件类型。例如,以下代码片段展示了如何读取文件头并比较JPEG签名: ```csharp using ...
为了提高识别的准确性,我们可以依据文件头信息来判断文件类型。文件头通常包含特定的字节序列,这些序列是文件格式的标识符。 本文将详细介绍一种在Android中使用Java根据文件头获取文件类型的实现方法。这个方法...
文件头包含了大量关于文档的元数据,下面将详细解析文件头中的各个字段: 1. **复合文档文件标识** (`00-07`): - 这是一段固定长度的字符串,用以标识复合文档的类型。通常情况下,该字段的内容为`DOCF11E0A1B11...
3. 对读取到的数据进行比较,检查是否匹配GIF、BMP或JPEG的文件头特征。 4. 如果找到匹配项,输出对应的文件类型;如果没有找到,可能需要进一步扫描或者报告未知类型。 代码可能会如下所示: ```cpp #include #...
大部分图片格式如JPEG、PNG、GIF等,其二进制数据的头部具有特定的固定字节序列,这些序列称为文件头。通过读取并比较这些文件头,我们可以有效地辨别文件是否为真正的图片。 例如,PNG图片的文件头是"\x89PNG\x0D\...
TrIDNet是一款强大的文件鉴定器,它可以识别数千种不同的文件格式,通过比较文件头的16进制数据与已知的文件类型模板进行匹配。用户只需运行TrIDNet,选择待识别的文件,程序就会返回最可能的文件类型和相应的置信度...
每个文件格式都有其特定的文件头,通过读取并分析这些信息,我们可以判断文件的类型。C#提供了IO流和字节读取功能来实现这一过程。 2. **C#的FileStream类** `FileStream`是C#中用于读写文件的核心类,它继承自`...
判断文件真实类型的应用场景非常广泛,例如,在文件上传时,服务器端可以根据文件头信息来判断文件的真实类型,以防止用户上传伪造文件。在文件下载时,也可以根据文件头信息来判断文件的真实类型,以确保下载的文件...
如果这两种方法都无法确定,还可以尝试读取文件的头部信息,比如查看文件头的前几个字节是否与已知的文件类型头信息相匹配。 在提供的压缩包文件中,“如何判断文件类型.pdf”和“Java判断文件类型.pdf”很可能是...
文件头是文件开头的一段数据,它包含了文件类型的重要标识。例如,JPEG文件通常以“FF D8”开始,PNG以“89 50 4E 47 0D 0A 1A 0A”开头,BMP则以“42 4D”为起始标志。这些独特的二进制序列可以帮助我们识别图片的...
在处理大量文件类型时,可以创建一个映射表,将扩展名或文件头标识符映射到相应的文件类型,然后在判断时查找这个映射表。 最后,需要注意的是,某些文件类型如ZIP或RAR是压缩格式,它们包含多个文件。在这种情况下...
总之,判断文件是文本文件还是二进制文件是一个重要的任务,通常可以通过检查文件中的字节模式、文件头签名或者使用专门的库函数来实现。在这个过程中,理解ASCII编码和二进制数据的基本特性是非常关键的。在实际...
4. **确定文件类型**:如果找到匹配的特征码,根据匹配的键(即文件类型)返回结果。如果没有任何匹配,可能需要依赖文件扩展名或其他方法进行判断。 下面是一个简单的VB.NET示例代码片段,演示了如何实现这个功能...
### Java程序判断文件编码的类型 #### 知识点概览 本文档旨在教导读者如何通过Java编程语言来判断文件...通过以上方法,我们可以有效地判断文件的编码类型,并据此进行相应的编码转换操作,以确保文本数据的正确处理。