小波变换网文精粹:小波:看森林,也看树木(五)
英文原名:Wavelets: Seeing the forest and the trees
转自:http://www.china-vision.net/blog/user1/8/2006220133756.html
五、小波是怎样工作的?(How Do Wavelets work?)
到目前为止,小波的最多应用(“Killer app”)一直是数字图像压缩。它们是新JPEG2000数字图像标准的核心,WSQ(wavelet scalar quantization)方法被FBI用来压缩指纹数据库。在这个里面,小波被认为是图像的建造用的砖。一幅森林图像能从最宽的小波中获得:森林的一列绿,天空的一抹蓝。更为详细的是,更锐利的小波能帮助辨别树,用更精细的小波可把树干和树枝添加到图像中。像一个绘画用的单个笔刷一样,每个小波不是图像本身,但是众多小波在一起就能重建任何东西。不像绘画中的一支笔刷,一个小波能被做成任意小;一个小波没有物理尺寸限制是因为它在计算机内存中是以一系列简单的0和1存储的。
与普遍的想法相反,小波它们本身不能压缩一幅图像,它们的工作是使压缩成为可能。要理解为什么,先假设一幅图像被一系列间隔的数字所编码,比如1,3,7,9,8,8,6,2。如果每个数字代表一个像素的亮暗程度,用0代表白,15代表黑,则这个字符串代表某一类在一个亮度背景下(1的,2的和3的)对象(7的,8的和9的)。
多分辨率分析最简单形式对图像的滤波是通过把每一个相邻像素值平均。在上面的例子中,字符串结果是2,8,8,4:一个低分辨率图像仍然显示一个亮背景下的灰度对象。如果我们想从这里去重构一幅原始图像的退化版本,我们就需要重复每个数字,即为2,2,8,8,8,8,4,4。
然而,假设我们想去完美的重现原始图像。我们在第一步中就必须保存一些附加信息,就是从低分辨率信号去获得高分辨率信号所能添加或减去的一个数字集合。这这个例子中,那些数字是-1,-1,0,2。(例如,把-1加到退化图像的第一个像素,则原始图像的第一个像素为1;用退化图像的第二个像素减去-1,就是原始图像的第二个像素)
因此多分辨率分析的第一级把原始信号分割成低分辨率部分(2,8,8,4)和一个高分辨率部分或细节部分(-1,-1,0,2)。这高频率细节也成为Haar小波系数。事实上,整个程序就是在1909年发明的Haar小波变换的多分辨率版本。
似乎不能认为小波变换的第一步已经得到所有。原始信号中有8个数字,变换中仍然有8个数字。但在典型数字图像中,大部分像素都与它们的邻像素非常相似:Sky pixels will occur next to sky pixels, forest pixels next to forest pixels。这意味着相邻像素的平均值将最有可能与原始像素值一样,因此细节系数的大多数会是0,或者非常接近0。如果我们把那些系数简单近似为0,我们需要的仅有信息就保留在低分辨率图像加上没有近似为0的一些细节系数之上。因此,需要存储图像的数据量已被压缩了将近一半。把高精度数字近似成只有更少数字的较低精度的过程称为量化(WSQ中的Q)
变换和量化过程可以重复多次,每次以2的倍数来减少信息比特数,而且还平滑地降低图像的质量。根据用户的需求,这个过程可在更低分辨率开始出现之前停止,或者继续下去获得具有越来越精确细节的超低分辨率图像。用JPEG2000标准,在图像质量没有视觉上变化下可压缩到200:1。这样的小波分解可以通过一次平均多于2个邻像素值来获得,例如,最简单的Daubechies小波变换组合4个像素组成的组,用6个,8个甚至更多个来平滑一个。
小波的一个令人着迷的特性是它们能跟我们人眼一样自动挑出相同的特征。那些量化后留下的小波系数与那些特别不同于邻像素的像素是对应的,比如一幅图像的边缘。因此,小波大多数是从图画边缘来重造图像,这些图画边缘是人们在描绘一张图画时所画的。的确,一些研究者指出小波变换与人类视觉之间的类似不是偶然的,那是我们的神经以与小波类似的方法对视觉信号进行滤波。
PS:这是一篇很好的小波方面的科普文章,译文也很好,译者联系不上,如有版权问题,请联系博主。
分享到:
相关推荐
**UML精粹:标准对象建模语言简明指南(第3版)** UML,全称为Unified Modeling Language,是面向对象系统设计的一种标准化建模语言。它为软件开发提供了图形化表示方法,用于描述系统的需求、结构和行为。UML自...
清华大学出版社《UML精粹:标准对象...对类图 顺序图 状态图 活动图等也有较多更新 ">《UML精粹:标准对象建模语言简明指南 第3版 》在紧迫的时间压力下 程序员很难通过紧跟技术创新的脚步来享受软件工程领域的最新成果
《UML精粹:标准对象建模语言简明指南》是Martin Fowler的经典之作,自1997年初版以来,一直是UML学习者和实践者的首选参考书籍。这本书旨在为读者提供一个清晰、简洁的UML(Unified Modeling Language)理解和应用...
其中,《编程精粹:编写高质量C语言代码》是针对C语言编程的一部经典之作,旨在帮助程序员提升C语言编程技巧,写出高效、可靠的代码。这本书不仅适合初学者,也对有经验的开发者具有很高的参考价值。 在C语言编程中...
UML不仅仅适用于软件行业,它也被广泛应用于非软件系统,比如电信、交通、商业等领域。 UML的图表主要分为三大类:结构图、行为图和分组图。结构图主要描述系统的静态结构,包括用例图(Use Case Diagrams)、类图...
**CMMI精粹:集成化过程改进实用导论** CMMI,即能力成熟度模型集成(Capability Maturity Model Integration),是软件工程领域的一种过程改进框架,旨在提高组织的开发和服务提供能力。《CMMI精粹:集成化过程...
[源代码]算法精粹_经典计算机科学问题的Python实现,面向中高级程序员的算法教程,借助Python语言,用经典的算法、编码技术和原理来求解计算机科学的一些经典问题。介绍了递归、结果缓存和位操作等基本编程组件,还...
《Excel实战技巧精粹:Excel模板1000例》是一部深入探讨Excel应用的宝典,旨在提升用户在日常工作中处理数据、分析信息和优化工作效率的能力。这本书包含了丰富的实例和实用模板,覆盖了从基础操作到高级技巧的全...
《信息系统开发实例精粹:My Disc》这本著作,便以其独特的视角,通过具体而详细的案例分析,向读者展示了信息系统如何在不同领域中发挥其巨大作用,以及如何通过信息技术与业务流程的紧密结合来提升效率和决策质量...
注意:这个可是最新英文版的,要学的话需要点英文基础哦! ......解压密码 www.infoxa.com
AXURE RP8实战手册 网站和APP原型制作案例精粹:全选与取消全选效果.rp
《UML精粹:标准对象建模语言简明指南 第三版》是一本深入浅出地介绍统一建模语言(Unified Modeling Language,简称UML)的权威书籍。这本书旨在为IT专业人士提供一个全面理解UML的框架,帮助他们有效地进行系统...
AXURE RP8实战手册 网站和APP原型制作案例精粹:制作商品列表.rp
《GPU精粹:GPU 3D和通用编程技巧》是一本深入探讨GPU编程技术的专著,涵盖了3D图形处理和通用计算领域的诸多关键知识点。GPU(Graphics Processing Unit)最初是为了加速计算机图形渲染而设计的,但随着技术的发展...
HTML5精粹:利用HTML5开发令人惊奇的Web站点和革命性应用
Excel实战技巧精粹:Excel实用模板972例:个体工商户设立登记申请书.xls中介单位人员登.xls中外学者越洋对话日程安排.xls中央基层预算单位开立银行帐户申请表.xls中央基层预算单位财政支出月报表.xls中学校小升初...