`

PNG文件结构分析(上:了解PNG文件存储格式)

阅读更多

前言

我们都知道,在进行J2ME的手机应用程序开发的时候,在图片的使用上,我们可以使用PNG格式的图片(甚至于在有的手机上,我们只可以使用PNG格式的图片),尽管使用图片可以为我们的应用程序增加不少亮点,然而,只支持PNG格式的图片却又限制了我们进一步发挥的可能性(其实,应该说是由于手机平台上的处理能力有限)。 在MIDP2中,或者某些厂商(如NOKIA)提供的API中,提供了drawPixels/getPixels的方法,这些方法进一步提高了开发者处理图片的灵活性,然而,在MIDP2还未完全普及的今天,我们需要在MIDP1 .0中实现这类方法还属于异想天开,因此,为了实现更高级的应用,我们必须充分挖掘PNG的潜力。

PNG的文件结构

对于一个PNG文件来说,其文件头总是由位固定的字节来描述的:

十进制数 137 80 78 71 13 10 26 10
十六进制数 89 50 4E 47 0D 0A 1A 0A

其中第一个字节0x89超出了ASCII字符的范围,这是为了避免某些软件将PNG文件当做文本文件来处理。文件中剩余的部分由3个以上的PNG的数据块(Chunk)按照特定的顺序组成,因此,一个标准的PNG文件结构应该如下:

PNG文件标志 PNG数据块 …… PNG数据块

PNG数据块(Chunk)

PNG定义了两种类型的数据块,一种是称为关键数据块(critical chunk),这是标准的数据块,另一种叫做辅助数据块(ancillary chunks),这是可选的数据块。关键数据块定义了4个标准数据块,每个PNG文件都必须包含它们,PNG读写软件也都必须要支持这些数据块。虽然PNG文件规范没有要求PNG编译码器对可选数据块进行编码和译码,但规范提倡支持可选数据块。

下表就是PNG中数据块的类别,其中,关键数据块部分我们使用深色背景加以区分。

PNG文件格式中的数据块
数据块符号
数据块名称
多数据块
可选否
位置限制
IHDR 文件头数据块 第一块
cHRM 基色和白色点数据块 在PLTE和IDAT之前
gAMA 图像γ数据块 在PLTE和IDAT之前
sBIT 样本有效位数据块 在PLTE和IDAT之前
PLTE 调色板数据块 在IDAT之前
bKGD 背景颜色数据块 在PLTE之后IDAT之前
hIST 图像直方图数据块 在PLTE之后IDAT之前
tRNS 图像透明数据块 在PLTE之后IDAT之前
oFFs (专用公共数据块) 在IDAT之前
pHYs 物理像素尺寸数据块 在IDAT之前
sCAL (专用公共数据块) 在IDAT之前
IDAT 图像数据块 与其他IDAT连续
tIME 图像最后修改时间数据块 无限制
tEXt 文本信息数据块 无限制
zTXt 压缩文本数据块 无限制
fRAc (专用公共数据块) 无限制
gIFg (专用公共数据块) 无限制
gIFt (专用公共数据块) 无限制
gIFx (专用公共数据块) 无限制
IEND 图像结束数据 最后一个数据块

为了简单起见,我们假设在我们使用的PNG文件中,这4个数据块按以上先后顺序进行存储,并且都只出现一次。

数据块结构

PNG文件中,每个数据块由4个部分组成,如下:

名称 字节数 说明
Length (长度) 4字节 指定数据块中数据域的长度,其长度不超过(231-1)字节
Chunk Type Code (数据块类型码) 4字节 数据块类型码由ASCII字母(A-Z和a-z)组成
Chunk Data (数据块数据) 可变长度 存储按照Chunk Type Code指定的数据
CRC (循环冗余检测) 4字节 存储用来检测是否有错误的循环冗余码

CRC(cyclic redundancy check)域中的值是对Chunk Type Code域和Chunk Data域中的数据进行计算得到的。CRC具体算法定义在ISO 3309和ITU-T V.42中,其值按下面的CRC码生成多项式进行计算:

x32+x26+x23+x22+x16+x12+x11+x10+x8+x7+x5+x4+x2+x+1

下面,我们依次来了解一下各个关键数据块的结构吧。

IHDR

文件头数据块IHDR(header chunk):它包含有PNG文件中存储的图像数据的基本信息,并要作为第一个数据块出现在PNG数据流中,而且一个PNG数据流中只能有一个文件头数据块。

文件头数据块由13字节组成,它的格式如下表所示。

域的名称
字节数
说明
Width 4 bytes 图像宽度,以像素为单位
Height 4 bytes 图像高度,以像素为单位
Bit depth 1 byte 图像深度:
索引彩色图像:1,2,4或8
灰度图像:1,2,4,8或16
真彩色图像:8或16
ColorType 1 byte 颜色类型:
0:灰度图像, 1,2,4,8或16
2:真彩色图像,8或16
3:索引彩色图像,1,2,4或8
4:带α通道数据的灰度图像,8或16
6:带α通道数据的真彩色图像,8或16
Compression method 1 byte 压缩方法(LZ77派生算法)
Filter method 1 byte 滤波器方法
Interlace method 1 byte 隔行扫描方法:
0:非隔行扫描
1: Adam7(由Adam M. Costello开发的7遍隔行扫描方法)

由于我们研究的是手机上的PNG,因此,首先我们看看MIDP1.0对所使用PNG图片的要求吧:

  • 在MIDP1.0中,我们只可以使用1.0版本的PNG图片。并且,所以的PNG关键数据块都有特别要求:
    IHDR
  • 文件大小:MIDP支持任意大小的PNG图片,然而,实际上,如果一个图片过大,会由于内存耗尽而无法读取。
  • 颜色类型:所有颜色类型都有被支持,虽然这些颜色的显示依赖于实际设备的显示能力。同时,MIDP也能支持alpha通道,但是,所有的alpha通道信息都会被忽略并且当作不透明的颜色对待。
  • 色深:所有的色深都能被支持。
  • 压缩方法:仅支持压缩方式0(deflate压缩方式),这和jar文件的压缩方式完全相同,所以,PNG图片数据的解压和jar文件的解压可以使用相同的代码。(其实这也就是为什么J2ME能很好的支持PNG图像的原因:))
  • 滤波器方法:尽管在PNG的白皮书中仅定义了方法0,然而所有的5种方法都被支持!
  • 隔行扫描:虽然MIDP支持0、1两种方式,然而,当使用隔行扫描时,MIDP却不会真正的使用隔行扫描方式来显示。
  • PLTE chunk:支持
  • IDAT chunk:图像信息必须使用5种过滤方式中的方式0 (None, Sub, Up, Average, Paeth)
  • IEND chunk:当IEND数据块被找到时,这个PNG图像才认为是合法的PNG图像。
  • 可选数据块:MIDP可以支持下列辅助数据块,然而,这却不是必须的。

    bKGD cHRM gAMA hIST iCCP iTXt pHYs
    sBIT sPLT sRGB tEXt tIME tRNS zTXt

关于更多的信息,可以参考http://www.w3.org/TR/REC-png.html

PLTE

调色板数据块PLTE(palette chunk)包含有与索引彩色图像(indexed-color image)相关的彩色变换数据,它仅与索引彩色图像有关,而且要放在图像数据块(image data chunk)之前。

PLTE数据块是定义图像的调色板信息,PLTE可以包含1~256个调色板信息,每一个调色板信息由3个字节组成:

颜色

字节

意义

Red

1 byte

0 = 黑色, 255 = 红

Green

1 byte

0 = 黑色, 255 = 绿色

Blue

1 byte

0 = 黑色, 255 = 蓝色

因此,调色板的长度应该是3的倍数,否则,这将是一个非法的调色板。

对于索引图像,调色板信息是必须的,调色板的颜色索引从0开始编号,然后是1、2……,调色板的颜色数不能超过色深中规定的颜色数(如图像色深为4的时候,调色板中的颜色数不可以超过2^4=16),否则,这将导致PNG图像不合法。

真彩色图像和带α通道数据的真彩色图像也可以有调色板数据块,目的是便于非真彩色显示程序用它来量化图像数据,从而显示该图像。

IDAT

图像数据块IDAT(image data chunk):它存储实际的数据,在数据流中可包含多个连续顺序的图像数据块。

IDAT存放着图像真正的数据信息,因此,如果能够了解IDAT的结构,我们就可以很方便的生成PNG图像。

IEND

图像结束数据IEND(image trailer chunk):它用来标记PNG文件或者数据流已经结束,并且必须要放在文件的尾部。

如果我们仔细观察PNG文件,我们会发现,文件的结尾12个字符看起来总应该是这样的:

00 00 00 00 49 45 4E 44 AE 42 60 82

不难明白,由于数据块结构的定义,IEND数据块的长度总是0(00 00 00 00,除非人为加入信息),数据标识总是IEND(49 45 4E 44),因此,CRC码也总是AE 42 60 82。

实例研究PNG

以下是由Fireworks生成的一幅图像,图像大小为8*8,为了方便大家观看,我们将图像放大:



使用UltraEdit32打开该文件,如下:
00000000~00000007:

可以看到,选中的头8个字节即为PNG文件的标识。

接下来的地方就是IHDR数据块了:

00000008~00000020:

  • 00 00 00 0D 说明IHDR头块长为13
  • 49 48 44 52 IHDR标识
  • 00 00 00 08 图像的宽,8像素
  • 00 00 00 08 图像的高,8像素
  • 04 色深,2^4=16,即这是一个16色的图像(也有可能颜色数不超过16,当然,如果颜色数不超过8,用03表示更合适)
  • 03 颜色类型,索引图像
  • 00 PNG Spec规定此处总为0(非0值为将来使用更好的压缩方法预留),表示使压缩方法(LZ77派生算法)
  • 00 同上
  • 00 非隔行扫描
  • 36 21 A3 B8 CRC校验

00000021~0000002F:

可选数据块sBIT,颜色采样率,RGB都是256(2^8=256)

00000030~00000062:

这里是调色板信息

  • 00 00 00 27 说明调色板数据长为39字节,既13个颜色数
  • 50 4C 54 45 PLTE标识
  • FF FF 00 颜色0
  • FF ED 00 颜色1
  • …… ……
  • 09 00 B2 最后一个颜色,12
  • 5F F5 BB DD CRC校验

00000063~000000C5:

这部分包含了pHYs、tExt两种类型的数据块共3块,由于并不太重要,因此也不再详细描述了。

000000C0~000000F8:

以上选中部分是IDAT数据块

  • 00 00 00 27 数据长为39字节
  • 49 44 41 54 IDAT标识
  • 78 9C…… 压缩的数据,LZ77派生压缩方法
  • DA 12 06 A5 CRC校验

IDAT中压缩数据部分在后面会有详细的介绍。

000000F9~00000104:

IEND数据块,这部分正如上所说,通常都应该是

00 00 00 00 49 45 4E 44 AE 42 60 82

至此,我们已经能够从一个PNG文件中识别出各个数据块了。由于PNG中规定除关键数据块外,其它的辅助数据块都为可选部分,因此,有了这个标准后,我们可以通过删除所有的辅助数据块来减少PNG文件的大小。(当然,需要注意的是,PNG格式可以保存图像中的层、文字等信息,一旦删除了这些辅助数据块后,图像将失去原来的可编辑性。)

删除了辅助数据块后的PNG文件,现在文件大小为147字节,原文件大小为261字节,文件大小减少后,并不影响图像的内容。

其实,我们可以通过改变调色板的色值来完成一些又趣的事情,比如说实现云彩/水波的流动效果,实现图像的淡入淡出效果等等,在此,给出一个链接给大家看也许更直接:http://blog.csdn.net/flyingghost/archive/2005/01/13/251110.aspx,我写此文也就是受此文的启发的。

如上说过,IDAT数据块是使用了LZ77压缩算法生成的,由于受限于手机处理器的能力,因此,如果我们在生成IDAT数据块时仍然使用LZ77压缩算法,将会使效率大打折扣,因此,为了效率,只能使用无压缩的LZ77算法,关于LZ77算法的具体实现,此文不打算深究,如果你对LZ77算法的JAVA实现有兴趣,可以参考以下两个站点:

参考资料:

PNG文件格式白皮书:http://www.w3.org/TR/REC-png.html
为数不多的中文PNG格式说明:http://dev.gameres.com/Program/Visual/Other/PNGFormat.htm
RFC-1950(ZLIB Compressed Data Format Specification):ftp://ds.internic.net/rfc/rfc1950.txt
RFC-1950(DEFLATE Compressed Data Format Specification):ftp://ds.internic.net/rfc/rfc1951.txt
LZ77算法的JAVA实现:http://jazzlib.sourceforge.net/
LZ77算法的JAVA实现,包括J2ME版本:http://www.jcraft.com/jzlib/index.html

分享到:
评论

相关推荐

    PNG文件结构分析之一 (2).docx

    PNG(Portable Network Graphics)是一种无损压缩的位图文件格式,广泛用于互联网和移动设备上。PNG文件结构具有严谨的规范,确保了跨平台的兼容性和数据的完整性。以下是PNG文件结构及其关键知识点的详细分析: 1....

    PNG.rar_png文件_png规范

    11. **文档资源**:提供的两个文档“PNG文件结构分析之一.doc”和“PNG文件结构分析之二.doc”可能深入探讨了PNG文件的内部结构和解析过程,是理解PNG格式的宝贵资料。 总之,PNG文件格式通过其规范化的结构和高效...

    png图片格式最新源码

    PNG(Portable Network Graphics)是一种广泛使用的位图图像格式,它以无损压缩方式存储图像数据,支持透明度和丰富的色彩表现。PNG格式是为了解决GIF格式的专利问题而诞生的,它在互联网上被广泛应用,特别是在网页...

    png格式详解

    ### PNG格式详解 #### PNG文件概述 ...通过了解PNG文件的关键数据块和辅助数据块,可以更好地掌握PNG文件的内部结构和解析机制。这对于进行图像处理、图像格式转换以及开发支持PNG格式的应用程序都至关重要。

    文件格式分析器 (斯托夫文件格式分析器)

    文件格式分析器是一种用于识别和解析不同类型的文件格式的工具,它们可以帮助用户了解文件内部结构,确认文件的真实类型,尤其是在处理未知或混淆的文件时非常有用。斯托夫文件格式分析器是这类工具的一个实例,它专...

    易语言腾讯GFT转到png文件

    1. **解析GFT文件**:这一步是转换的核心,需要了解GFT文件的内部结构和数据存储方式。可能包括读取文件头信息、解析图像数据等。由于GFT不是公开的标准格式,所以这部分需要对腾讯游戏的文件格式有深入的理解或者...

    VB6.0 PNG文件查看软件

    VB6.0是一款经典的Visual Basic版本,用于开发...通过分析和理解这些文件,开发者可以学习到如何在VB6.0环境中集成第三方库或API来处理不被原生支持的文件格式,以及如何设计简单的用户界面来实现基本的图像查看功能。

    PNG图片宽高一把梭,爆破PNG图片宽高

    1. PNG文件结构:了解PNG文件的结构至关重要,包括PNG头、数据块以及每个块的数据格式。 2. IHDR块解析:IHDR块是PNG文件的第一个数据块,包含图像的基本信息,如宽度、高度、颜色类型、位深度等。 3. 位操作:在...

    libpng error not a png file

    2. 文件可能损坏,导致PNG结构不完整。 3. 图片转换过程中出现问题,没有正确生成PNG格式。 4. 网络传输过程中数据丢失或错误。 解决这个问题的方法通常包括: 1. 验证文件的来源,确保图片是从可靠渠道获取的。 2....

    c++读写BMP JPG 和png 的图像文件(linux)

    使用libpng时,需要理解PNG文件的结构,包括图像头部信息(IHDR)、颜色类型、压缩方法等。在C++中,通过调用`png_create_read_struct`和`png_create_write_struct`创建读写结构体,然后使用`png_init_io`绑定到文件...

    大话西游WAS导出PNG图片,C#源码!方便导出大话西游WDF资源.非本人原创!

    通常,这样的程序会包括读取WAS文件的二进制数据,解析其内部结构,提取图像数据,并将这些数据转换成PNG格式所要求的像素数组。在C#中,这可能涉及到使用System.IO类来处理文件流,使用System.Drawing或System....

    腾讯GFT转到png文件易语言源码.rar

    这涉及理解PNG文件格式,并按照该格式规范来构造文件结构。 5. **用户界面设计**:为了让用户能够方便地使用这个工具,源码可能包含了一个简单的用户界面,比如文件选择对话框,进度条显示等。易语言提供了丰富的...

    cpp-在PE文件中扫描浪费的PNG文本块

    1. **解析PE文件结构**:首先,需要了解PE文件的结构,包括Dos头、NT头、节表等,找到嵌入的PNG图像数据所在的节。 2. **识别PNG头部**:PNG文件以固定的8字节标识符"PNG\r\n\x1A\n"开始,可以据此找到文件中的所有...

    J2ME优化压缩PNG文件

    在实际操作中,开发者可以将待优化的PNG文件输入到这个J2ME控制台程序,程序会分析文件并移除不必要的数据段,然后输出一个经过压缩的PNG文件。这样,开发者可以将压缩后的PNG文件集成到他们的J2ME应用中,从而提高...

    png_to_klg.tar.gz

    "png_to_klg.tar.gz"是一个压缩包,内含将PNG图像转换为KLG格式的代码和可能的辅助文件。这个转换工具的目的是将普通的PNG图像数据集转换成KLG,以便用于三维重建算法。代码简洁明了,使用者可以根据自己的需求进行...

    BMP文件格式分析

    尽管由于其较大的文件大小,在网络传输和移动应用领域不如JPEG、PNG等格式流行,但在图像处理和分析方面,BMP文件格式依然占有重要的地位。 #### 二、BMP文件格式的特点 1. **无损压缩**:BMP文件格式通常不使用...

    C语言的png和jpeg图片格式转换为bmp格式

    - **JPEG (Joint Photographic Experts Group)**:JPEG是一种有损压缩的格式,适合存储照片类图像,通过压缩可以大幅度减小文件大小,但会损失部分图像质量。 - **BMP (Bitmap)**:BMP是Windows操作系统中常用的...

    CTF神器:自动爆破PNG图片宽高并一键修复工具

    `Deformed-Image-Restorer.py`很可能就是这个神器的主程序,它可能是一个Python脚本,用于读取、分析PNG文件的结构,并尝试恢复正确的尺寸信息。 `README.md`文件通常包含了项目的介绍、使用方法、注意事项等信息,...

    高级PNG读写操作示例[PNGReader.rar]-精品源代码

    通过分析这些文件,我们可以了解到如何在VB环境中使用自定义类和库来实现PNG图像的高级操作,包括读取图像数据、解析PNG头部信息、处理颜色通道和透明度、以及写入新的PNG图像。这对于开发者来说是一个宝贵的学习...

    Fexplorer 数据文件结构分析工具(可安装)

    了解文件结构对于分析、解析或修改文件内容至关重要。例如,音频文件可能包含头部信息,用于标识文件类型和编码方式,接着是数据流,包含实际的音频样本。 **数据格式** 数据格式定义了数据如何被编码、存储和交换...

Global site tag (gtag.js) - Google Analytics