`
xpp02
  • 浏览: 1048917 次
社区版块
存档分类
最新评论

DCT(离散余弦变换(DiscreteCosineTransform))

 
阅读更多

离散余弦变换(Discrete Cosine Transform,简称DCT变换)是一种与傅立叶变换紧密相关的数学运算。在傅立叶级数展开式中,如果被展开的函数是实偶函数,那么其傅立叶级数中只包含余弦项,再将其离散化可导出余弦变换,因此称之为离散余弦变换。

离散余弦变换(Discrete Cosine Transform)

离散余弦变换(DCT)是N.Ahmed等人在1974年提出的正交变换方法。它常被认为是对语音和图像信号进行变换的最佳方法。为了工程上实现的需要,国内外许多学者花费了很大精力去寻找或改进离散余弦变换的快速算法。由于近年来数字信号处理芯片(DSP)的发展,加上专用集成电路设计上的优势,这就牢固地确立离散余弦变换(DCT)在目前图像编码中的重要地位,成为H.261、JPEG、MPEG 等国际上公用的编码标准的重要环节。在视频压缩中,最常用的变换方法是DCT,DCT被认为是性能接近K-L变换的准最佳变换,变换编码的主要特点有:   (1)在变换域里视频图像要比空间域里简单。   (2)视频图像的相关性明显下降,信号的能量主要集中在少数几个变换系数上,采用量化和熵编码可有效地压缩其数据。   (3)具有较强的抗干扰能力,传输过程中的误码对图像质量的影响远小于预测编码。通常,对高质量的图像,DMCP要求信道误码率 ,而变换编码仅要求信道误码率 。   DCT等变换有快速算法,能实现实时视频压缩。针对目前采用的帧内编码加运动补偿的视频压缩方法的不足, 我们在Westwater 等人提出三维视频编码的基础上, 将三维变换的结构应用于视频图像压缩, 进一步实现了新的视频图像序列的编码方法。

离散余弦变换英语DCT for Discrete Cosine Transform)是与傅里叶变换相关的一种变换,它类似于离散傅里叶变换DFT for Discrete Fourier Transform),但是只使用实数。离散余弦变换相当于一个长度大概是它两倍的离散傅里叶变换,这个离散傅里叶变换是对一个实偶函数进行的(因为一个实偶函数的傅里叶变换仍然是一个实偶函数),在有些变形里面需要将输入或者输出的位置移动半个单位(DCT有8种标准类型,其中4种是常见的)。

最常用的一种离散余弦变换的类型是下面给出的第二种类型,通常我们所说的离散余弦变换指的就是这种。它的逆,也就是下面给出的第三种类型,通常相应的被称为"反离散余弦变换","逆离散余弦变换"或者"IDCT"。

有两个相关的变换,一个是离散正弦变换DST for Discrete Sine Transform),它相当于一个长度大概是它两倍的实奇函数离散傅里叶变换;另一个是改进的离散余弦变换MDCT for Modified Discrete Cosine Transform),它相当于对交叠的数据进行离散余弦变换。

离散余弦变换英语DCT for Discrete Cosine Transform)是与傅里叶变换相关的一种变换,它类似于离散傅里叶变换DFT for Discrete Fourier Transform),但是只使用实数。离散余弦变换相当于一个长度大概是它两倍的离散傅里叶变换,这个离散傅里叶变换是对一个实偶函数进行的(因为一个实偶函数的傅里叶变换仍然是一个实偶函数),在有些变形里面需要将输入或者输出的位置移动半个单位(DCT有8种标准类型,其中4种是常见的)。

最常用的一种离散余弦变换的类型是下面给出的第二种类型,通常我们所说的离散余弦变换指的就是这种。它的逆,也就是下面给出的第三种类型,通常相应的被称为"反离散余弦变换","逆离散余弦变换"或者"IDCT"。

有两个相关的变换,一个是离散正弦变换DST for Discrete Sine Transform),它相当于一个长度大概是它两倍的实奇函数离散傅里叶变换;另一个是改进的离散余弦变换MDCT for Modified Discrete Cosine Transform),它相当于对交叠的数据进行离散余弦变换。

File:Dandelion clock quarter dft dct.png

目录

应用

离散余弦变换,尤其是它的第二种类型,经常被信号处理图像处理使用,用于对信号图像(包括静止图像运动图像)进行有损数据压缩。这是由于离散余弦变换具有很强的"能量集中"特性:大多数的自然信号(包括声音和图像)的能量都集中在离散余弦变换后的低频部分,而且当信号具有接近马尔可夫过程Markov processes)的统计特性时,离散余弦变换的去相关性接近于K-L变换Karhunen-Loève变换——它具有最优的去相关性)的性能。

例如,在静止图像编码标准JPEG中,在运动图像编码标准MJPEGMPEG的各个标准中都使用了离散余弦变换。在这些标准制中都使用了二维的第二种类型离散余弦变换,并将结果进行量化之后进行熵编码。这时对应第二种类型离散余弦变换中的n通常是8,并用该公式对每个8x8块的每行进行变换,然后每列进行变换。得到的是一个8x8的变换系数矩阵。其中(0,0)位置的元素就是直流分量,矩阵中的其他元素根据其位置表示不同频率的交流分量。

一个类似的变换, 改进的离散余弦变换被用在高级音频编码AAC for Advanced Audio Coding),VorbisMP3 音频压缩当中。

离散余弦变换也经常被用来使用谱方法来解偏微分方程,这时候离散余弦变换的不同的变量对应着数组两端不同的奇/偶边界条件。

正式定义

形式上来看,离散余弦变换一个线性可逆函数 F:R^n\rightarrow R^n 其中R实数集, 或者等价的说一个n \times n方阵。离散余弦变换有几种变形的形式, 它们都是根据下面的某一个公式把n 个实数x_0,\ldots ,x_{n-1} 变换到另外n个实数f_0,\ldots ,f_{n-1} 的操作。

DCT-I

f_m = \frac{1}{2} (x_0 + (-1)^m x_{n-1})      + \sum_{k=1}^{n-2} x_k \cos \left[\frac{\pi}{n-1} m k \right]

有些人认为应该将 x_0x_{n-1} 乘以\sqrt{2},相应的将f_0f_{n-1} 乘以\frac{1}{\sqrt{2}}。这样做的结果是这种 DCT-I 矩阵变为了 正交矩阵 (再乘一个系数的话),但是这样就不能直接和一个实偶离散傅里叶变换对应了。


一个n=5的对实数abcde的DCT-I型变换等价于一个8点的对实数abcdedcb(偶对称)的DFT变换,结果再除以2(对应的,DCT-II~DCT-IV相对等价的DFT有一个半个抽样的位移)。需要指出的是,DCT-I不适用于n<2的情况(其它的DCT类型都适用于所有的整数n)。

所以,DCT-I暗示的边界条件是: x_k 相对于k=0 点偶对称,并且相对于 k=n-1 点偶对称; 对f_m 的情况也类似。

DCT-II

f_m =   \sum_{k=0}^{n-1} x_k \cos \left[\frac{\pi}{n} m \left(k+\frac{1}{2}\right) \right]

DCT-II大概是最常用的一种形式,通常直接被称为DCT。

有些人更进一步的将f_0再乘以\frac{1}{\sqrt{2}}(参见下面的DCT-III型的对应修改)。这将使得DCT-II成为正交矩阵 (再乘一个系数的话),但是这样就不能直接和一个有半个抽样位移的实偶离散傅里叶变换对应了。

所以,DCT-II暗示的边界条件是: x_k 相对于k=-\frac{1}{2} 点偶对称,并且相对于 k=n-\frac{1}{2} 点偶对称; 对f_m 相对于m=0 点偶对称,并且相对于m=n 点奇对称。

DCT-III

f_m = \frac{1}{2} x_0 +   \sum_{k=1}^{n-1} x_k \cos \left[\frac{\pi}{n} \left(m+\frac{1}{2}\right) k \right]

因为这是DCT-II的逆变换(再乘一个系数的话),这种变形通常被简单的称为逆离散余弦变换。

有些人更进一步的将x_0再乘以\sqrt{2}(参见上面的DCT-II型的对应修改),这将使得DCT-III成为正交矩阵 (再乘一个系数的话),但是这样就不能直接和一个结果有半个抽样位移的实偶离散傅里叶变换对应了。

所以,DCT-III暗示的边界条件是: x_k 相对于k=0 点偶对称,并且相对于 k=n 点奇对称; 对f_m 相对于m=-\frac{1}{2} 点偶对称,并且相对于 m=n-\frac{1}{2} 点奇对称。

DCT-IV

f_m =   \sum_{k=0}^{n-1} x_k \cos \left[\frac{\pi}{n} \left(m+\frac{1}{2}\right) \left(k+\frac{1}{2}\right) \right]

DCT-IV对应的矩阵是正交矩阵 (再乘一个系数的话)。


一种DCT-IV的变形,将不同的变换的数据重叠起来,被称为改进的离散余弦变换

DCT-IV暗示的边界条件是: x_k 相对于k=-\frac{1}{2} 点偶对称,并且相对于 k=''n''-1/2 点奇对称;对j 类似。

DCT V~VIII

上面提到的DCT I~IV是和偶数阶的实偶DFT对应的。原则上,还有四种DCT变换(Martucci, 1994)是和奇数阶的实偶DFT对应的,它们在分母中都有一个''n''+1/2的系数。但是在实际应用中,这几种变型很少被用到。

最平凡的和奇数阶的实偶DFT对应的DCT是1阶的DCT (1也是奇数),可以说变换只是乘上一个系数a而已,对应于DCT-V的长度为1的状况。

反变换

DCT-I的反变换是把DCT-I乘以系数\frac{1}{n-1}。 DCT-IV的反变换是把DCT-IV乘以系数\frac{2}{n}。 DCT-II的反变换是把DCT-III乘以系数\frac{2}{n},反之亦然。

离散傅里叶变换类似,变化前面的归一化系数仅仅是常规而已,改变这个系数并不改变变换的性质。例如,有些人喜欢在DCT-II变换的前面乘以\sqrt{\frac{2}{n}},这样反变换从形式上就和变换更相似,而不需要另外的归一化系数。

计算

尽管直接使用公式进行变换需要进行O(n^2)次操作,但是和快速傅里叶变换类似,我们有复杂度为O(n \log(n))的快速算法,这就是常常被称做蝶形变换的一种分解算法。另外一种方法是通过快速傅里叶变换来计算DCT,这时候需要O(n)的预操作和后操作。

参考

  • K. R. Rao and P. Yip, 离散余弦变换: 算法、优点和应用 (Discrete Cosine Transform: Algorithms, Advantages, Applications) (Academic Press, Boston, 1990).
  • A. V. Oppenheim, R. W. Schafer, and J. R. Buck, 时间离散信号处理 (Discrete-Time Signal Processing), second edition (Prentice-Hall, New Jersey, 1999).
  • S. A. Martucci, 对称卷积和离散正弦余弦变换 (Symmetric convolution and the discrete sine and cosine transforms),IEEE Trans. Sig. Processing SP-42, 1038-1051 (1994).
  • Matteo Frigo and Steven G. Johnson: FFTW, http://www.fftw.org/. 一个免费的C语言GPL,可以计算DCT-I~IV的1维到多维的任意大小的变换
  • M. Frigo and S. G. Johnson, "FFTW3的设计和实现,"Proceedings of the IEEE 93 (2), 216–231 (2005).

目录

应用

离散余弦变换,尤其是它的第二种类型,经常被信号处理图像处理使用,用于对信号图像(包括静止图像运动图像)进行有损数据压缩。这是由于离散余弦变换具有很强的"能量集中"特性:大多数的自然信号(包括声音和图像)的能量都集中在离散余弦变换后的低频部分,而且当信号具有接近马尔可夫过程Markov processes)的统计特性时,离散余弦变换的去相关性接近于K-L变换Karhunen-Loève变换——它具有最优的去相关性)的性能。

例如,在静止图像编码标准JPEG中,在运动图像编码标准MJPEGMPEG的各个标准中都使用了离散余弦变换。在这些标准制中都使用了二维的第二种类型离散余弦变换,并将结果进行量化之后进行熵编码。这时对应第二种类型离散余弦变换中的n通常是8,并用该公式对每个8x8块的每行进行变换,然后每列进行变换。得到的是一个8x8的变换系数矩阵。其中(0,0)位置的元素就是直流分量,矩阵中的其他元素根据其位置表示不同频率的交流分量。

一个类似的变换, 改进的离散余弦变换被用在高级音频编码AAC for Advanced Audio Coding),VorbisMP3 音频压缩当中。

离散余弦变换也经常被用来使用谱方法来解偏微分方程,这时候离散余弦变换的不同的变量对应着数组两端不同的奇/偶边界条件。

正式定义

形式上来看,离散余弦变换一个线性可逆函数 F:R^n\rightarrow R^n 其中R实数集, 或者等价的说一个n \times n方阵。离散余弦变换有几种变形的形式, 它们都是根据下面的某一个公式把n 个实数x_0,\ldots ,x_{n-1} 变换到另外n个实数f_0,\ldots ,f_{n-1} 的操作。

DCT-I

f_m = \frac{1}{2} (x_0 + (-1)^m x_{n-1})      + \sum_{k=1}^{n-2} x_k \cos \left[\frac{\pi}{n-1} m k \right]

有些人认为应该将 x_0x_{n-1} 乘以\sqrt{2},相应的将f_0f_{n-1} 乘以\frac{1}{\sqrt{2}}。这样做的结果是这种 DCT-I 矩阵变为了 正交矩阵 (再乘一个系数的话),但是这样就不能直接和一个实偶离散傅里叶变换对应了。


一个n=5的对实数abcde的DCT-I型变换等价于一个8点的对实数abcdedcb(偶对称)的DFT变换,结果再除以2(对应的,DCT-II~DCT-IV相对等价的DFT有一个半个抽样的位移)。需要指出的是,DCT-I不适用于n<2的情况(其它的DCT类型都适用于所有的整数n)。

所以,DCT-I暗示的边界条件是: x_k 相对于k=0 点偶对称,并且相对于 k=n-1 点偶对称; 对f_m 的情况也类似。

DCT-II

f_m =   \sum_{k=0}^{n-1} x_k \cos \left[\frac{\pi}{n} m \left(k+\frac{1}{2}\right) \right]

DCT-II大概是最常用的一种形式,通常直接被称为DCT。

有些人更进一步的将f_0再乘以\frac{1}{\sqrt{2}}(参见下面的DCT-III型的对应修改)。这将使得DCT-II成为正交矩阵 (再乘一个系数的话),但是这样就不能直接和一个有半个抽样位移的实偶离散傅里叶变换对应了。

所以,DCT-II暗示的边界条件是: x_k 相对于k=-\frac{1}{2} 点偶对称,并且相对于 k=n-\frac{1}{2} 点偶对称; 对f_m 相对于m=0 点偶对称,并且相对于m=n 点奇对称。

DCT-III

f_m = \frac{1}{2} x_0 +   \sum_{k=1}^{n-1} x_k \cos \left[\frac{\pi}{n} \left(m+\frac{1}{2}\right) k \right]

因为这是DCT-II的逆变换(再乘一个系数的话),这种变形通常被简单的称为逆离散余弦变换。

有些人更进一步的将x_0再乘以\sqrt{2}(参见上面的DCT-II型的对应修改),这将使得DCT-III成为正交矩阵 (再乘一个系数的话),但是这样就不能直接和一个结果有半个抽样位移的实偶离散傅里叶变换对应了。

所以,DCT-III暗示的边界条件是: x_k 相对于k=0 点偶对称,并且相对于 k=n 点奇对称; 对f_m 相对于m=-\frac{1}{2} 点偶对称,并且相对于 m=n-\frac{1}{2} 点奇对称。

DCT-IV

f_m =   \sum_{k=0}^{n-1} x_k \cos \left[\frac{\pi}{n} \left(m+\frac{1}{2}\right) \left(k+\frac{1}{2}\right) \right]

DCT-IV对应的矩阵是正交矩阵 (再乘一个系数的话)。


一种DCT-IV的变形,将不同的变换的数据重叠起来,被称为改进的离散余弦变换

DCT-IV暗示的边界条件是: x_k 相对于k=-\frac{1}{2} 点偶对称,并且相对于 k=''n''-1/2 点奇对称;对j 类似。

DCT V~VIII

上面提到的DCT I~IV是和偶数阶的实偶DFT对应的。原则上,还有四种DCT变换(Martucci, 1994)是和奇数阶的实偶DFT对应的,它们在分母中都有一个''n''+1/2的系数。但是在实际应用中,这几种变型很少被用到。

最平凡的和奇数阶的实偶DFT对应的DCT是1阶的DCT (1也是奇数),可以说变换只是乘上一个系数a而已,对应于DCT-V的长度为1的状况。

反变换

DCT-I的反变换是把DCT-I乘以系数\frac{1}{n-1}。 DCT-IV的反变换是把DCT-IV乘以系数\frac{2}{n}。 DCT-II的反变换是把DCT-III乘以系数\frac{2}{n},反之亦然。

离散傅里叶变换类似,变化前面的归一化系数仅仅是常规而已,改变这个系数并不改变变换的性质。例如,有些人喜欢在DCT-II变换的前面乘以\sqrt{\frac{2}{n}},这样反变换从形式上就和变换更相似,而不需要另外的归一化系数。

计算

尽管直接使用公式进行变换需要进行O(n^2)次操作,但是和快速傅里叶变换类似,我们有复杂度为O(n \log(n))的快速算法,这就是常常被称做蝶形变换的一种分解算法。另外一种方法是通过快速傅里叶变换来计算DCT,这时候需要O(n)的预操作和后操作。

参考

  • K. R. Rao and P. Yip, 离散余弦变换: 算法、优点和应用 (Discrete Cosine Transform: Algorithms, Advantages, Applications) (Academic Press, Boston, 1990).
  • A. V. Oppenheim, R. W. Schafer, and J. R. Buck, 时间离散信号处理 (Discrete-Time Signal Processing), second edition (Prentice-Hall, New Jersey, 1999).
  • S. A. Martucci, 对称卷积和离散正弦余弦变换 (Symmetric convolution and the discrete sine and cosine transforms),IEEE Trans. Sig. Processing SP-42, 1038-1051 (1994).
  • Matteo Frigo and Steven G. Johnson: FFTW, http://www.fftw.org/. 一个免费的C语言GPL,可以计算DCT-I~IV的1维到多维的任意大小的变换
  • M. Frigo and S. G. Johnson, "FFTW3的设计和实现,"Proceedings of the IEEE 93 (2), 216–231 (2005).


分享到:
评论

相关推荐

    视频编码中DCT离散余弦变换原理

    "视频编码中DCT离散余弦变换原理详解" 视频编码中离散余弦变换(DCT)是一种实数域变换,其变换核为实数余弦函数。对一幅图像进行离散余弦变换后,许多有关图像的重要可视信息都集中在DCT变换的一小部分系数中。...

    DCT离散余弦变换算法

    DCT离散余弦变换的C++源程序,可自定定义维数。

    dct离散余弦变换图像处理专用

    离散余弦变换(Discrete Cosine Transform, DCT)是一种广泛应用在图像处理和信号处理中的数学工具。它能够将一个原始信号转换到频率域,从而实现数据的压缩和分析。在图像处理中,DCT常用于图像编码,如JPEG(Joint...

    DCT离散余弦变换的图像融合的MATLAB仿真

    离散余弦变换(Discrete Cosine Transform, DCT)是一种广泛应用在图像处理和信号处理中的数学工具,特别是在图像融合和视频编码中占有重要地位。MATLAB作为一种强大的数值计算和可视化环境,是进行DCT仿真和研究的...

    离散余弦变换原理和JPEG压缩算法

    离散余弦变换(Discrete Cosine Transform,DCT)是一种常用的图像压缩算法,广泛应用于图像和视频压缩领域,例如JPEG压缩算法。DCT的原理是将图像信号或视频信号从空间域变换到频率域,并对变换后的信号进行量化和...

    离散余弦变换DCT代码C++

    离散余弦变换(DCT for Discrete Cosine Transform)是与傅里叶变换相关的一种变换,它类似于离散傅里叶变换(DFT for Discrete Fourier Transform),但是只使用实数。离散余弦变换相当于一个长度大概是它两倍的离散...

    C# DCT离散余弦变换

    离散余弦变换(Discrete Cosine Transform, DCT)是一种广泛应用在图像处理、音频编码和数据压缩等领域的数学变换技术。在C#中实现DCT可以帮助开发者在这些领域创建高效的算法。本篇将深入探讨C#实现DCT的相关知识点...

    离散余弦变换的原理的介绍

    离散余弦变换(Discrete Cosine Transform, DCT)是一种重要的数字信号处理技术,尤其在图像和视频压缩领域有着广泛的应用。它是一种离散正交变换,能够将信号从空间域转换到频率域,有效地将相关性强的空间信号转化...

    离散余弦变换(完整的源码)

    离散余弦变换(Discrete Cosine Transform, DCT)是一种在数字信号处理领域广泛应用的数学变换技术,特别是在图像和音频压缩中,如JPEG和MP3等标准中扮演着核心角色。DCT能够将信号从时域转换到频域,从而帮助我们...

    DCT离散余弦变换pdf

    离散余弦变换(Discrete Cosine Transform,简称DCT)是数字信号处理领域中一种重要的变换技术,尤其在图像和视频压缩编码中扮演着关键角色。本文将深入探讨DCT的基本原理、数学表达以及其在工程实践中的应用,旨在...

    【图像加密】基于DCT(离散余弦变换)与SVD(奇异值分解)域自适应嵌入水印matlab源码.md

    【图像加密】基于DCT(离散余弦变换)与SVD(奇异值分解)域自适应嵌入水印matlab源码.md

    离散余弦变换(DCT)应用方面的论文

    DCT域图像边缘的快速提取.pdf MATLAB在数字水印中的应用.pdf MATLAB在数字水印技术研究的应用.pdf 一个面像识别系统的实现.pdf 一种JPEG图像边缘检测算法.pdf ...离散余弦变换(DCT)在彩色图像盲水印技术中的应用.pdf

    离散余弦变换DCT★.ppt

    离散余弦变换(DCT)是一种广泛应用于图像与视频压缩中的变换编码方法。它利用三角函数进行变换,并将幅度变成频率。DCT 变换的基向量由余弦函数构成,一维 DCT 变换和二维 DCT 变换都是图像与视频压缩的重要技术。 ...

    图像处理中的傅里叶变换与离散余弦变换_tuxiangchuli_

    在图像处理领域,傅里叶变换(Fourier Transform)和离散余弦变换(Discrete Cosine Transform, DCT)是两种重要的分析和处理图像的方法。它们被广泛应用于图像压缩、图像增强、噪声滤波等多个方面。下面我们将深入...

    数字图像处理及应用:第三章 离散余弦变换(32学时新).ppt

    数字图像处理及应用的第三章介绍了离散余弦变换(DCT),它是一种常用的正交变换,广泛应用于图像处理和压缩领域。本章节主要讨论了DCT的定义、性质和应用。 3.2 离散余弦变换 3.2.1 离散余弦变换的定义 离散余弦...

    图像的离散余弦变换(DCT)

    离散余弦变换(DCT,Discrete Cosine Transform)的变换核为实数的余弦函数,因而DCT的计算速度要比变换核为复指数的DFT要快得多。离散余弦变换是仅次于K-L变换的次最佳正交变换,且有这样的性质:许多有关图像的...

    基于图像的离散余弦变换

    离散余弦变换(Discrete Cosine Transform, DCT)是一种广泛应用的数字信号处理技术,特别是在图像和视频压缩领域,如JPEG和MPEG标准中。它通过将图像数据转换到频域,使得图像中的高频细节信息更加集中,从而便于...

    离散余弦变换原理

    ### 离散余弦变换(DCT)原理详解 #### 一、离散余弦变换简介 离散余弦变换(Discrete Cosine Transform,简称DCT)是一种用于信号处理和图像压缩领域的数学工具,与傅立叶变换有着密切的关系。DCT由N.Ahmed等人于...

    离散余弦变换的最小二乘法相位解包裹

    离散余弦变换(DCT,Discrete Cosine Transform)是一种广泛应用在信号处理和图像压缩中的数学工具。在本文中,我们将深入探讨一种利用DCT进行相位解包裹的方法,即最小二乘法相位解包裹(LS-DCT)。相位解包裹是...

Global site tag (gtag.js) - Google Analytics