`

常见文件类型识别

阅读更多
根据文件的后缀名识别文件类型并不准确,可以使用文件的头信息进行识别:
以下是各类文件的头:
JPEG (jpg),文件头:FFD8FFE1
PNG (png),文件头:89504E47
GIF (gif),文件头:47494638
TIFF (tif),文件头:49492A00
Windows Bitmap (bmp),文件头:424D
CAD (dwg),文件头:41433130
Adobe Photoshop (psd),文件头:38425053
Rich Text Format (rtf),文件头:7B5C727466
XML (xml),文件头:3C3F786D6C
HTML (html),文件头:68746D6C3E
Email [thorough only] (eml),文件头:44656C69766572792D646174653A
Outlook Express (dbx),文件头:CFAD12FEC5FD746F
Outlook (pst),文件头:2142444E
MS Word/Excel (xls.or.doc),文件头:D0CF11E0
MS Access (mdb),文件头:5374616E64617264204A
WordPerfect (wpd),文件头:FF575043
Postscript (eps.or.ps),文件头:252150532D41646F6265
Adobe Acrobat (pdf),文件头:255044462D312E
Quicken (qdf),文件头:AC9EBD8F
Windows Password (pwl),文件头:E3828596
ZIP Archive (zip),文件头:504B0304
RAR Archive (rar),文件头:52617221
Wave (wav),文件头:57415645
AVI (avi),文件头:41564920
Real Audio (ram),文件头:2E7261FD
Real Media (rm),文件头:2E524D46
MPEG (mpg),文件头:000001BA
MPEG (mpg),文件头:000001B3
Quicktime (mov),文件头:6D6F6F76
Windows Media (asf),文件头:3026B2758E66CF11
MIDI (mid),文件头:4D546864
检测文件类型的代码如下:
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.util.HashMap;
import java.util.Map;

public class FileTypeDetector {
	private static Map<String,String> head2FileType = new HashMap<String,String>();
	static{
		head2FileType.put("FFD8FFE1", "jpg");
		head2FileType.put("89504E47", "png");
		head2FileType.put("47494638 ", "gif");
		head2FileType.put("49492A00", "tif");
		head2FileType.put("424D", "bmp");
		head2FileType.put("41433130", "dwg");
		head2FileType.put("38425053 ", "psd");
		head2FileType.put("7B5C727466", "rtf");
		head2FileType.put("3C3F786D6C", "xml");
		head2FileType.put("68746D6C3E ", "html");
		head2FileType.put("44656C69766572792D646174", "eml");
		head2FileType.put("CFAD12FEC5FD746F ", "dbx");
		head2FileType.put("2142444E", "pst");
		head2FileType.put("D0CF11E0", "xls/doc");
		head2FileType.put("5374616E64617264204A", "mdb");
		head2FileType.put("FF575043", "wpd");
		head2FileType.put("252150532D41646F6265", "eps/ps");
		head2FileType.put("255044462D312E", "pdf");
		head2FileType.put("E3828596", "pwl");
		head2FileType.put("504B0304", "zip");
		head2FileType.put("52617221", "rar");
		head2FileType.put("57415645", "wav");
		head2FileType.put("41564920", "avi");
		head2FileType.put("2E7261FD", "ram");
		head2FileType.put("2E524D46", "rm");
		head2FileType.put("000001BA", "mpg");
		head2FileType.put("000001B3", "mpg");
		head2FileType.put("6D6F6F76", "mov");
		head2FileType.put("3026B2758E66CF11", "asf");
		head2FileType.put("4D546864", "mid");
	}
	
	private static String bytesToHexString(String fileName) throws IOException{
        FileInputStream fis = null;
        StringBuilder stringBuilder = new StringBuilder();
        try{
	        fis = new FileInputStream(new File(fileName));
	        byte[] b = new byte[4];
	        fis.read(b, 0, b.length);

	        for (int i = 0; i < b.length; i++) {
	            int v = b[i] & 0xFF;
	            String hv = Integer.toHexString(v);
	            if (hv.length() < 2) {
	                stringBuilder.append(0);
	            }
	            stringBuilder.append(hv);
	        }
        }finally{
        	if(fis != null)
        		fis.close();
        }
        return stringBuilder.toString().toUpperCase();
    }
	
	public static String fileType(String fileName) throws IOException{
		String head = bytesToHexString(fileName);
		return head2FileType.get(head);
	}
	
	public static void main(String[] args) throws IOException {
		System.out.println(fileType("d://aaa.png"));
	}
}



参考:http://blog.sina.com.cn/s/blog_4c98b9600100jamb.html
分享到:
评论

相关推荐

    文件类型识别工具

    在IT领域,文件类型识别是日常操作中必不可少的一部分,尤其对于处理未知文件或大量文档时。"文件类型识别工具"正是解决这个问题的关键。这类工具能够分析文件的二进制数据,通过查找特定的签名或模式来确定文件的...

    文件类型识别软件

    “tridnet-1.8”是一个常见的文件类型识别工具,它能够通过分析文件的头部信息来判断文件类型。文件头通常包含特定的字节序列,这些序列对于特定的文件格式是独一无二的,就像每个文件类型的“指纹”。例如,JPEG...

    通过文件头识别文件类型

    在计算机世界中,文件并不仅仅依赖扩展名来确定其类型,因为扩展名可以被随意更改。为了确保我们能够准确地识别文件的类型,一个重要的方法就是通过...通过学习和实践,我们可以更加熟练地应对各种文件类型识别的挑战。

    FileAnalysis文件类型识别

    在IT领域,文件类型识别是一项基础且至关重要的技术。它涉及到计算机系统如何理解和处理不同类型的文件,以便正确地打开、编辑或执行它们。文件类型识别通常基于文件的扩展名、文件头信息以及内部数据结构。以下是对...

    文件类型识别软件,识别类型达2000多种

    标题中的"文件类型识别软件,识别类型达2000多种"表明这款软件具备广谱的文件类型检测能力,覆盖了常见的到不常见的各类文件格式。这种软件的主要功能是通过分析文件的头几个字节(也称为魔数或文件签名)来确定文件...

    FFV文件格式识别工具 绿色单文件

    FFV是一款专业的文件格式识别软件,使用该软件用户只需将文件拖入窗口中即可快速精准的检测文件格式,支持批量检测功能,有时候,电脑中一个文件的扩展名(或后缀名)被改...本软件就是通过上述原理判断常见文件类型!

    C# 读取文件类型,不是文件后缀

    在C#编程中,识别文件类型通常有两种方法:一种是通过检查文件的后缀名,另一种是通过读取文件的二进制数据并分析其内容。标题“C# 读取文件类型,不是文件后缀”暗示我们需要关注第二种方法,即不依赖文件扩展名来...

    根据文件头信息判断文件类型

    1. **文件类型识别的原理**: 文件头检查是基于文件的二进制结构进行的。每个文件格式都定义了一个或多个固定的字节模式,这些模式在文件的开头出现。通过比较这些模式,我们可以确定文件的类型。例如,PDF文件通常...

    VC实现常见文件类型的判断

    首先,我们需要了解文件扩展名是文件类型识别的主要依据之一。在Windows操作系统中,每个文件都有一个关联的扩展名,如.txt代表文本文件,.jpg代表图像文件等。在VC++中,我们可以通过`std::string`或`CString`类...

    根据头信息判断文件类型

    常见文件类型的魔术数字 - JPEG(jpg):`FF D8 FF` - PNG(png):`89 50 4E 47` - GIF(gif):`47 49 46 38` - TIFF(tif):`49 49 2A 00` - Windows Bitmap(bmp):`42 4D` 此外,还有更多类型的文件拥有自己的独特...

    swift-swift-magic是libmagic文件类型识别库的Swift接口

    Swift-Magic库的出现,为Swift开发者提供了一种便捷的方式来处理文件类型识别的问题。在Swift中,我们通常会遇到需要确定文件类型的场景,例如在处理用户上传的文件或解析不同格式的数据时。通过Swift-Magic,我们...

    获取文件类型_获取文件类型_

    对于更复杂的文件类型识别需求,可以构建一个映射表,将常见的扩展名与文件类型对应起来,或者使用第三方库,如`Microsoft.DotNet.PlatformAbstractions.FileExtensions`。 通过以上知识点的学习,初学者能够掌握...

    FileAnalyze文件类型分析工具

    很多恶意软件会伪装成常见文件类型,试图欺骗用户执行。FileAnalyze这样的工具可以帮助用户识别潜在的威胁,防止因误操作而导致的安全风险。 总的来说,FileAnalyze是一款强大的文件分析工具,通过对文件的深度分析...

    文件头和文件尾.docx

    本文将对文件头和文件尾进行详细的介绍,并对常见文件类型的文件头和文件尾进行总结。 文件头(File Header)是文件的开头部分,它包含了文件的元数据,例如文件类型、版本号、作者信息等。文件头的大小和内容因...

    文件类型的图片集合

    在IT领域,文件类型的图标是用户界面中至关重要的元素,它们直观地表示了不同种类的文件,帮助用户快速识别和操作。"文件类型的图片集合"这个主题涉及到的是这些图标的设计、用途以及与之相关的技术标准。 首先,...

    用C#开发的获取真实文件类型的代码

    1. **文件类型识别原理** 文件类型通常由文件的二进制头部信息决定,这些信息被称为文件头或魔数。每个文件格式都有其特定的文件头,通过读取并分析这些信息,我们可以判断文件的类型。C#提供了IO流和字节读取功能...

    C# 编码自动识别 匹配文件当前编码格式

    在编程领域,尤其是在处理文本文件时,正确识别和使用文件的编码格式至关重要。C#作为.NET框架中的主要编程语言,提供了强大的支持来处理各种编码格式。本文将详细讲解"C#编码自动识别匹配文件当前编码格式"这一主题...

    常用文件类型图标

    在Windows操作系统中,文件类型的图标是用户识别和理解文件内容的一种直观方式。这些图标与文件扩展名相关联,通常代表了文件的用途或其所属的应用程序。以下是对“常用文件类型图标”这一主题的详细解释: 1. **...

    各种类型文件头标准编码.docx

    通过识别文件头标准编码,可以快速确定文件的类型和格式,从而帮助我们更好地处理和分析文件。 下面,我们将对各种类型文件头标准编码进行详细的介绍: 1. JPEG (jpg):FF D8 FF JPEG 是一种常见的图像文件格式,...

    文件格式识别工具.rar

    文件格式识别工具是一种重要的软件应用,它主要用于确定电脑上的文件属于哪种特定的文件类型。在日常工作中,我们可能经常会遇到未知格式的文件,这时候就需要利用这类工具来识别和解析文件内容,以便正确处理或打开...

Global site tag (gtag.js) - Google Analytics