CVPR读书笔记[4]:Gabor特征提取之Gabor核
朱金华 jinhua1982@gmail.com 2014.08.09
本文是Gabor特征提取三部分之一:
[1]CVPR读书笔记[4]:Gabor特征提取之Gabor核
http://blog.csdn.net/njzhujinhua/article/details/38460861
[2] CVPR读书笔记[5]:Gabor特征提取之Gabor核的实现
http://blog.csdn.net/njzhujinhua/article/details/38610281
[3] CVPR读书笔记[6]:Gabor特征提取
http://blog.csdn.net/njzhujinhua/article/details/38614697
(后注:传图片好麻烦, 几个公式截图在一块了, 除了wiki那个其余的可是我用公式编辑器一个个敲的啊 )
关于Gabor滤波,有的说法是加窗傅里叶变换,有的说法是用复正弦函数调制的高斯核,其实都是一个意思.
傅里叶变换不能同时进行时域与频域分析, 1946年D.Gabor提出加窗傅里叶变换, 通过在时间轴位置p加窗实现对p周围小范围内信号的短时分析, 即现在的短时傅里叶变换. 通过对点p的平移,则可实现对整个时域的信号分析. 其通过窗函数g(t-p)与原信号的乘积对原信号进行在p点周围开窗, 在其它时域抑制,然后进行傅里叶变换, 这边是Gabor变换了. Gabor使用高斯函数作为窗函数.
Gabor算不算小波,都有一定说法. Gabor没有正交基,,不算小波.而且也不能自动调节分辨率的. 但是其可以反映信号局部区域的特征,对图像边缘敏感, 且可以做到在不同方向不同尺度下的局部区域特征提取.当去除Gabor变换的直流分量时可以去除光照影响,因而Gabor小波被广泛用于图像识别领域.
一维Gabor函数
为了更好的理解Gabor在时域上的分析能力,我们从一维看起
f(t)为一维信号,其傅里叶变换为
信号与高斯函数
卷积,即加窗可得
, 这就是所谓的Gabor变换
可看出t取p时,高斯函数是取到最大的,t向两边延伸,则f(t)的取值被迅速消弱.即Gabor在p点的变换即主要取p周围3* σ范围的信号, 且离得越远作用越小. 将p依次在时间轴上移动,即可得到在时域内的信号分析
二维Gabor函数及其推导
二维Gabor函数则是二维高斯函数与二维傅里叶的卷积
令f=1/λ则最后这个除了归一化系数外就是维基百科上的Gabor的复形式了(同时假设γ=1, 即高斯函数两个方向的尺度是一样的x'^2+y'^2=x^2+y^2)
http://en.wikipedia.org/wiki/Gabor_filter
λ表示正弦波长
θ表示Gabor函数条纹的方向
ψ表示相位,我们假设为0,
σ表示高斯函数的标准差
γ表示空间纵横比我们已做假设值为1
Gabor滤波器设计
Gabor滤波器核的通常形式为
上面两个等号一个意思, 只是怕截图后第一个等号字太小看不清了,又换了exp的表达.
由此可得Gabor核的实部为
式中x,y为位置坐标,
σ为高斯函数的标准差, 与小波的带宽有关,这里一般取常数.
k确定了Gabor的尺度, k=k_max/f^n, 这里k_max为最大频率,f是频域中的间隔因子,n是尺度序号, 取值0…N-1. f一般大于0,取固定值,当n增大时尺度增大,分辨率变低,n降低时分辨率更精细.在相同的尺度n下,如果增大f的话其也相当于增大尺度的效果.
θ确定了Gabor的方向, θ=pi*m/M, M为总的方向数,u为方向序号,取值0…M-1.
参考了众多说明, 一般是取值为Kmax=pi/2, f=sqrt(2.0), σ=2pi, 但没找到出处.
稍后代码参照上述描述的Gabor核实现.
[参考文献]
[1]Handbook ofFace Recognition 2nd Edition
[2]JoineBook.Com_Springer.Computer.Vision.A.Reference.Guide.Jun.2014
[3] http://en.wikipedia.org/wiki/Gabor_filter
[4] Movellan,Javier R."Tutorialon Gabor Filters". Retrieved 2008-05-14.
[5]http://blog.csdn.net/sunboyiris/article/details/21559505
相关推荐
在Pytorch中,可以构建神经网络模型来学习如何在辐射场中嵌入和提取水印。通过训练,模型可以学习到如何在保持图像质量的同时,巧妙地隐藏和保护水印信息。文件列表中的"cvpr2024_WateRF-main"可能包含了相关的代码...
【标题】"RestoreFormer"是2022年在计算机视觉领域知名会议CVPR上发表的一项研究工作,专注于人脸恢复技术。该技术尤其关注在无监督的条件下,如何实现高质量的盲人脸修复,即在没有原始参考图像的情况下,恢复低...
4. **Image Processing**:图像处理是计算机视觉的基础,包括图像增强、去噪、特征提取等。在这些代码中,可能会用到OpenCV、PIL等库进行图像预处理,以提高后续算法的性能。 5. **Object Detection**:目标检测是...
CVPR是由IEEE举办的国际计算机视觉与模式识别会议,是计算机视觉领域最重要的顶级会议之一,每年举办一次。该会议涵盖了计算机视觉领域的前沿研究和技术发展,包括图像处理、机器学习、深度学习等多个方向。CVPR不仅...
CVPR 2018笔记以下是我在大会期间遇到的最有趣的论文,挑战和研讨会的链接,注释和想法。 但是,您可能希望通过回顾所有979篇被接受的论文并逐步浏览所有21个教程和48个研讨会的内容,来形成自己对计算机视觉和模式...
5. **扩展性**:支持添加自定义的特征提取器、描述符、匹配器和优化器,以适应不同的任务和数据集。 6. **并行处理**:利用多核CPU和GPU资源,OpenSfM能够有效地处理大量图像,缩短计算时间。 【应用场景】 ...
2. **深度学习架构**:可能使用了卷积神经网络(CNN)或者Transformer等先进的网络结构,以提取图像特征并进行曲线拟合。 3. **数据预处理**:包括图像增强、灰度化、直方图均衡化等步骤,以提高模型对不同光照和...
CVPR2021-代码 论文开源项目(带代码的文件)合集!CVPR 2021论文收录列表: : 注1:等2021年2月28日开奖后,欢迎各位大佬提交issue,分享CVPR 2021本文和开源项目! 注2:CVPR 2021已交稿成立!已投稿且想要进来的...
git clone https://github.com/YueJiang-nj/CVPR2020-SDFDiff.git 使用virtualenv或conda安装需求: # pip source virtual_env/install_pip.sh # conda source virtual_env/install_conda.sh 介绍
4. **数据组织**:解压后文件放入“darknet”文件夹,可能反映了项目结构,方便管理和运行代码。 深入研究这些文件,我们可以了解到具体的模型架构、训练参数、数据集详情以及转换过程,这对于理解和改进神经网络...
Deep Learning Methods for Vision CVPR 2012 Tutorial 9:00am-5:30pm, Sunday June 17th, Ballroom D (Full day)
(CVPR2024) Scaling Up to Excellence: Practicing Model Scaling for Photo-Realistic Image Restoration In the Wild
5. extr_sift.m:SIFT(尺度不变特征变换)是一种经典的图像特征提取方法,此文件可能用于提取图像的SIFT特征,作为LLC编码的输入。 6. README:这是项目说明文件,通常会包含关于代码的使用说明、依赖库和运行环境...
然而,实际数据往往呈现出长尾分布,即一部分类别的样本数量远远超过其他类别,这种现象在CVPR2020年的一篇论文《Deep Representation Learning on Long-tailed Data: A Learnable Embedding Augmentation ...
【标题】"matlab中存档算法代码-FSF_CVPR2017_Demo:带运动分割的快速多帧立体声场景流演示(CVPR2017)"涉及的知识点主要集中在计算机视觉(Computer Vision)领域,尤其是立体视觉(Stereo Vision)、场景流(Scene...
如我们的CVPR 2020出版物( )中所建议,该存储库包含用于对基于排名的深度度量学习方法运行策略适应性否定采样的代码。 SAMPLE_RUNS.sh中列出了可以达到与本文报告相似的结果的示例运行,因为基于RL的方法引入了更...
4 SiamRPN++-CVPR2019:SiamRPN++: Evolution of Siamese Visual Tracking with Very Deep Networks.pdf 5 siamMask-CVPR2019:FastOnlineObjectTrackingandSegmentation: AUnifyingApproach.pdf
《DeepOIS:陀螺仪引导的深光学图像稳定器补偿》是2021年在计算机视觉领域知名会议CVPR上发表的一项研究成果。这项工作主要聚焦于解决移动设备(如智能手机、无人机等)在拍摄时由于运动引起的图像模糊问题。光学...
CVPR2018_attention 用于语义分割的上下文编码MegaDepth:从互联网照片中学习单视图深度预测LiteFlowNet:用于光流估计的轻量级卷积神经网络PWC-Net:使用金字塔,翘曲和成本量的光流CNN 语义分割模型对对抗攻击的...