`
shappy1978
  • 浏览: 698518 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

[转]TIF图像数据结构之研究

    博客分类:
  • J2EE
阅读更多

[转]TIF图像数据结构之研究
2010-09-24 20:27
TIF文件格式最早是为了存储扫描仪图像而设计的。它的最大的特点就是与计算机的结构、操作系统以及图形硬件系统无关。它可处理黑白、灰度、彩色图像。在存储真彩色图像时和BMP格式一样,直接存储RGB三原色的浓度值而不使用彩色映射(调色板)。对于介质之间的交换,TIF称得上是位图格式的最佳选择之一。
  TIF的全面性也产生了不少问题,它的包罗万象造成结构较为复杂,变体很多,兼容性较差,它需要大量的编程工作来全面译码。例如,TIF图像数据可以用几种不同的方法压缩,用一个程序来读出所有的TIF几乎是不可能的。
  TIF图一般由三个部分组成:文件头(简称IFH)、文件目录(简称IFD)、图像数据。
一、图像文件头(Image File Header)
  IFH数据结构包含3个成员共计8个字节(见表一):
表一 IFH结构描述
------------------------------------------------------------
名称        字节数 数据类型   说明
------------------------------------------------------------
Byteorder            2 Integer TIF标记,其值为4D4D或4949
Version                2 Integer 版本号,其值恒为2A00
Offset to first IFD   4 Long    第一个IFD的偏移量
------------------------------------------------------------
表一说明
  1.Byteorder:可能是H4D4D或H4949,H4D4D表示该图是摩托罗拉整数格式,H4949表示该图是Intel整数格式。
  2.Version:总是H2A00,它可能是tif文件的版本,也可能用于进一步校验该文件是否为TIF格式。
  3.Offset to first IFD:第一个IFD相对文件开始处的偏移量(因为可能会有多个顺序排列的IFD)。IFD数据结构并不一定紧跟在IFH后面,相反,它常常位于第三部分图像数据的后面,即TIF图像文件的一般组织形式是:IFH——图像数据——IFD。
二、图像文件目录(Image File Directory)
  IFD是TIF图像文件中重要的数据结构,它包含了三个成员。由于一个TIF文件中可以有多个图像,而一个IFD只标识一个图像的所有属性(有的文章把“属性”称之为“标签”),所以,一个TIF文件中有几个图像,就会有几个IFD。IFD的结构见表二:
表二 IFD结构描述
-----------------------------------------------------------------
名称         字节数 数据类型   说明
-----------------------------------------------------------------
Directory Entry Count 2 Integer 本IFD中DE的数量
Directory Entry(1)       12    简称DE,中文译义“目录项”
Directory Entry(2)      12
……
Directory Entry(N)       12
Offset to next IFD         4 Long    下一个IFD的偏移量
-----------------------------------------------------------------
表二说明
  1.Directory Entry Count:指出在该IFD中DE的个数;
  2.Directory Entry:共12个字节,结构见表三。需要指出的是,DE的个数是不定的,因为每个DE只标识了图像的一个属性,那么这幅图像有N个属性就会有N个DE,用户甚至可添加自定义的标记属性,这就是为什么称TIF格式文件为“可扩充标记的文件”的原因。
  3.Offset to next IFD Or NULL:下一个IFD相对于文件开始处的位置,这是一个链式构成。如果该数字为0,表示已经是最后一个IFD。当然,如果该TIF文件只包含了一幅图像,那么就只有一个IFD,显然这个偏移量也会等于0。
表三 DE结构描述
--------------------------------------------------
名称     字节数  数据类型   说明
--------------------------------------------------
tag          2    Integer 本属性的标签编号
type           2    Integer 本属性值的数据类型
length       4    Long    该类型数据的数量
valueOffset 4    Long    属性值的存放偏移量
--------------------------------------------------
表三说明
  由DE标识的图像属性有:图像的大小、分辨率、是否压缩、像素的行列数、颜色深度(单色、16色、256色、真彩色)等等。其中:
  ①tag:是该属性的标签编号(TagID),在图像文件目录中,它是按照升序排列的(但不一定是连续的)。这些编号在TIF格式官方白皮书中可以查到相应的含义,但遗憾的是,我们到哪儿可以找到官方白皮书呢?所以,笔者只能把网上能找得到资料(再结合自己的实验结果)罗列出来,见表四。
  ②type:表示该属性数据的类型,一般认为TIF官方指定的有5种数据类型(但也有说12种数据类型的)。见表五。
  ③length:该种类型的数据的个数,而不是某个数据的长度。 
  ④valueOffset:是tagID代表的变量值相对文件开始处的偏移量,但如果变量值占用的空间不多于4个字节(例如只有1个Integer类型的值),那么该值就直接存放在valueOffset中,没必要再另外指向一个地方了。
表四 DE中标签编号的含义
-------------------------------------------------------------------------
TagID   属性名称       type 说明
-------------------------------------------------------------------------
0100 图像宽             0003
0101 图像高             0003
0102 颜色深度          0003   值=1为单色,=4为16色,=8为256色。
                 如果该类型数据个数>2个,说明是真彩图像
0103 图像数据是否压缩    0003   值=05表示压缩
按照adobe的文档,这里应该是tiff的压缩算法,K<0是G4,否则是G3
A code identifying the encoding scheme used:
< 0 Pure two-dimensional encoding (Group 4)
=0 Pure one-dimensional encoding (Group 3, 1-D)
>0 Mixed one- and two-dimensional encoding (Group 3, 2-D), in which a line encoded one-dimensionally may be followed by at most K − 1 lines encoded two-dimensionally
The filter shall distinguish among negative, zero, and positive values of K to determine how to interpret the encoded data; however, it shall not distinguish between different positive Kvalues. Default value: 0.
0106 图像是否采用反色显示    0003   值=01表示反色,否则表示不反色 
0111 图像扫描线偏移量    0004   图像数据起始字节相对于文件开始处的位置
0116 图像扫描线的数量       0004   表示图像有几行扫描线,实际上等于图像高度
0117 图像数据字节总数    0003   如果不是偶数,那么实际存放时会在后面加0
011A 水平分辩率偏移量    0005   常用计量单位是:像素/英寸
011B 垂直分辩率 偏移量    0005   常用计量单位是:像素/英寸
0131 生成该图像的软件名    0002   文本类型
0132 生成该图像的时间    0002   文本类型
0140 调色板偏移量       0003   256色和16色图像才有此属性,而且有连续2个
                 调色板,但属性的length值只表示出1个调色板
-------------------------------------------------------------------------
表四说明
  ①“水平(垂直)分辩率”是分数型的属性,其值要占用8个字节,所以在valueOffset中存放的肯定是它的具体数值的偏移量,而不是数值本身。
  ②“生成图像的软件名称”和“生成图像的时间”这两个字符型属性,它们的值所占用的空间也会大于4字节,所以在valueOffset中存放的也是它们的值的偏移量,而不是值本身。
  ③“图像数据字节总数”一般是个偶数,如果是奇数,那么实际存放时会在后面加一个0,但这个0不会计算在字节总数之内。
表五 DE中的数据类型
--------------------------------------------------------------------
type值 数据类型  说明
--------------------------------------------------------------------
0001 Byte    
0002 Ascii     文本类型,7位Ascii码加1位二进制0
0003 Integer 
0004 Long    
0005 RATIONAL   分数类型,由两个Long组成,第1个是分子,第2个是分母
--------------------------------------------------------------------
三、图像数据。

     这些数据可能是压缩的,也可能是未压缩的。如果经过压缩,那么压缩算法又有许多种,所以,图像数据是TIF文件中最为复杂的部分,暂还没有哪个软件能译出所有的压缩算法。
四、一个 Tif 文件的实例
  让我们自己动手做一个实验,以加深理性认识。
  用系统自带的画图程序新建一个17*15的白色图像,另存为TIF文件,它的全部数据如下(因设备差异你的数据也许会有些微不同):
0000: 49 49 2A 00 4E 00 00 00 80 3F E0 50 38 24 16 0D
0010: 07 84 42 61 50 B8 64 36 1D 0F 88 44 62 51 38 A4
0020: 56 2D 17 8C 46 63 51 B8 E4 76 3D 1F 90 48 64 52
0030: 39 24 96 4D 18 80 80 00 60 00 00 00 01 00 00 00
0040: 60 00 00 00 01 00 00 00 08 00 08 00 08 00 0F 00
0050: FE 00 04 00 01 00 00 00 00 00 00 00 00 01 03 00
0060: 01 00 00 00 11 00 00 00 01 01 03 00 01 00 00 00
0070: 0F 00 00 00 02 01 03 00 03 00 00 00 48 00 00 00
0080: 03 01 03 00 01 00 00 00 05 00 00 00 06 01 03 00
0090: 01 00 00 00 02 00 00 00 11 01 04 00 01 00 00 00
00A0: 08 00 00 00 15 01 03 00 01 00 00 00 03 00 00 00
00B0: 16 01 04 00 01 00 00 00 0F 00 00 00 17 01 04 00
00C0: 01 00 00 00 2F 00 00 00 1A 01 05 00 01 00 00 00
00D0: 38 00 00 00 1B 01 05 00 01 00 00 00 40 00 00 00
00E0: 1C 01 03 00 01 00 00 00 01 00 00 00 28 01 03 00
00F0: 01 00 00 00 02 00 00 00 3D 01 03 00 01 00 00 00
0100: 01 00 00 00 00 00 00 00
简要分析(请注意转换16进制数据时,低位在前,高位在后):
0000-0007:文件头,可以看出,该图是Intel整数格式,第一个IFD的偏移量为4E。
0008-0037:图像数据。注意最后那个0是补加的,它没有统计在“图像数据字节总数”属性值中。
0038-003F:水平分辩率值。
0040-0047:垂直分辩率值。
0048-004D:颜色深度值。
004E-0107:第一个IFD。Directory Entry Count的值(004E-004F)为F,表示这个IFD中有15个DE,每个DE占用12字节,15个DE共占用180字节,加上Directory Entry Count占用的2字节,再加上Offset to next IFD占用的4字节,这个IFD共占用186字节,换算为16进制就是BA,所以,它的数据结束于0107。Offset to next IFD的值(最后4个字节)均为0,表示整幅图像文件只有这一个IFD。其中15个DE的描述见表六。
表六 一个Tif文件实例的DE描述
-------------------------------------------------------------------------
顺号 偏移量 TagID   Type length valueOffset   说明
--------------------------------------------------------------------------
1 0050   00FE Long       1    00        未知属性值=0
2 005C   0100 Integer       1    11        图像宽为17像素(10进制)
3 0068   0101 Integer       1    0F        图像高为15像素(10进制)
4 0074   0102 Integer       3    48        图像为真彩色,其值存放在48-4D
5 0080   0103 Integer       1    05        图像数据是压缩的
6 008C   0106 Integer       1    02        图像不反色显示
7 0098   0111 Long         1    08        图像数据起始字节为8
8 00A4   0115 Integer       1    03        未知属性值=3
9 00B0   0116 Long         1    0F        图像扫描线有15行

10 00BC   0117 Long           1    2F        图像共有47个字节的压缩数据
11 00C8   011A RATIONAL   1    38        水平分辩率存放在38-3F
12 00D4   011B RATIONAL   1    40        垂直分辩率存放在40-47
13 00E0   011C Integer       1    01        未知属性值=1
14 00EC   0128 Integer      1    02        未知属性值=2
15 00F8   013D Integer       1    01        未知属性值=1
--------------------------------------------------------------------------
表六说明
  ①水平分辩率值存放在0038-003F,占用8个字节,这8个字节是:60 00 00 00 01 00 00 00。由于它是分数类型,前4个字节是分子,其值为60000000,转换为10进制就是96,后4个字节是分母,其值是10000000,转换为10进制就是1,所以,分数值是:96/1,它表示每英寸96像素。
  ②垂直水平分辩率值存放在0040-0047,请参照①进行分析。
  ③颜色深度属性,它有3个Integer类型的值,共计6字节,所以valueOffset中存放的也是其值的偏移量。它的属性值存放在0048-004D,3个整形数据值都为8,表示这是一幅24位真彩色的图像。

 

分享到:
评论

相关推荐

    pic&tif图像转换与图像挖取程序(先前一个有误).rar_cimg_open_tif图_图像 tif_格式转换

    标题中的“pic&tif图像转换与图像挖取程序(先前一个有误).rar_cimg_open_tif图_图像 tif_格式转换”表明这是一个关于图像处理的程序,具体涉及两个关键功能:图像格式的转换(从pic转换为tif)以及图像的挖取。...

    pic&tif图像转换与图像挖取程序.rar_PIC_open_tif_图像 tif

    标题中的“pic&tif图像转换与图像挖取程序.rar”表明这是一个关于图像处理的软件或代码包,专注于pic和tif两种图像格式之间的转换,并具备从图像中挖取特定区域的功能。描述进一步解释了该程序的核心功能,即图像...

    hdf转tif,hdf转tif envi,Python

    HDF是一种通用的、自描述的数据格式,它允许存储和组织大量的多维数组和其他数据结构。然而,在某些情况下,我们可能需要将HDF文件转换为其他格式,如TIFF(Tagged Image File Format),这通常是因为TIFF在地理信息...

    geotif、tif图像金字塔处理

    综上所述,"geotif、tif图像金字塔处理"涉及了GeoTIFF和TIFF图像格式的理解,GDAL库的使用,以及图像金字塔的构建过程。在实际开发中,掌握这些知识点可以帮助我们高效地处理地理空间数据,优化GIS应用程序的性能。

    气象数据(nc转tif)

    在GIS领域,`.tif`常被用作地理参考的图像文件,可以存储带有坐标系统的多层、多波段的图像数据。`.tif`文件支持压缩,且提供了丰富的元数据,使得它成为地理数据交换的标准格式。 "nc转tif"的过程涉及到以下几个...

    tif图像图像格式介绍.pdf

    IFD是TIF图像文件中最重要的数据结构,包含了一个TIF文件中的最重要的信息。一个TIF文件可以有多个IFD,每个IFD标识一个图像的基本属性。IFD结构中包含三个成员:Directory Entry Count、N个线性排列的DE序列和偏移...

    地形高程数据 .tif 生成适用于 Cesium terrain 地形数据

    首先,`.tif`文件是一种常见的栅格地理数据格式,它由地理空间信息和图像数据组成,通常包含全球高程数据,如 Shuttle Radar Topography Mission (SRTM) 数据。SRTM数据是由NASA发起的一项任务,收集了全球大部分...

    实验报告 显示tif图像.pdf

    【实验报告 显示tif图像.pdf】的分析与理解 TIF(Tagged Image File Format)是一种灵活且功能强大的图像文件格式,广泛应用于图形设计、扫描、打印和存档领域。本实验报告主要围绕TIF格式的组成部分进行深入解析,...

    将BMP转换TIF的程序

    这个过程中,可能涉及到的函数包括GDI+的`Bitmap::FromFile`用于加载BMP,`Save`函数用于保存为TIF,以及设置图像信息的`PropertyItem`结构等。 此外,转换过程中可能会考虑以下几点: 1. **色彩深度**:BMP和TIF都...

    程序_nc文件tiff_将nc文件批量转换为tif文件

    `tif` 文件则是一个基于像素的图像文件格式,通常用于存储地理空间数据,如遥感图像。每个 `tif` 文件由多个图像层组成,可以包含地理参考信息,如投影、行列坐标等,这使得它们能够在GIS软件中进行空间分析和叠加...

    使用matlab内置图像'tree.tif' 实现K-means算法进行图像分割

    在本项目中,MATLAB用于加载图像数据,然后将其转化为可以输入到K-means算法的数据结构。 3. RGB图像处理: 'tree.tif'是一个RGB图像,由红色、绿色和蓝色三个通道组成。在K-means算法中,每个像素点被表示为一个3...

    batch_HDF投影_hdf转tif_格式转换_IDl_批处理_

    首先,HDF是一种高级的数据存储格式,它允许用户存储复杂的数据结构,如多维数组和元数据。这种格式常用于科学和工程应用,如卫星遥感数据。而TIFF则是一种通用的图像文件格式,支持多种压缩算法,适用于多种平台,...

    BMP转换TIF程序(delphi)

    这个例子中,我们使用了IndyGraphics库的TIndyImage组件,加载BMP文件,然后将BMP图像数据复制到新的TIF图像中,并设置压缩类型。最后,将TIF图像保存到内存流,然后写入磁盘。 需要注意的是,实际的项目中可能需要...

    实验报告 显示tif图像.docx

    【实验报告 显示tif图像.docx】的摘要与解析 TIF(Tagged Image File Format)是一种非常灵活且广泛使用的图像文件格式,尤其在印刷和专业图像处理领域中常见。本实验报告主要围绕TIF文件的结构进行分析,具体包括...

    16种文件的数据结构

    0001 ani文件数据结构以及分解ani文件的图像的代码. 0002 bmp文件数据结构.txt 0003 FLV文件数据结构以及读取其脚本信息的代码.txt 0004 gif文件数据结构.txt 0005 ico文件数据结构以及制作特大图标的代码.txt ...

    TIF转换为BMP.rar

    在这个例子中,程序需要解析TIF文件的元数据和图像数据,然后将其转换成BMP文件格式。 5. **编程实现**:在BCB中,可以使用VCL(Visual Component Library)框架中的`TImage`组件来加载和显示图像。对于转换,可能...

    读取tif格式图片程序

    总的来说,读取 TIFF 格式图片涉及到理解 TIFF 文件格式、使用相应的库(如 LibTiff),以及正确处理图像数据。这个过程不仅涵盖了编程技巧,还涉及图像处理的基础知识,对于开发涉及图像处理的软件至关重要。通过这...

    科学可视化体数据(TIF格式)

    科学可视化体数据是一种重要的工具,尤其在医学、地理信息系统、物理学和工程学等领域,它能够帮助研究人员和专家们理解复杂的三维结构和模式。在这种情况下,我们关注的是“TIF”格式的体数据,这是一种用于存储高...

    测试数据tif格式可生成cesium地形(外国网站下载)

    这里提到的“测试数据tif格式可生成cesium地形”涉及到两个关键概念:TIFF(Tagged Image File Format)文件和Cesium地形渲染。 TIFF是一种灵活的图像文件格式,广泛用于存储包括地理空间数据在内的各种图像。在...

Global site tag (gtag.js) - Google Analytics