经典算法研究系列:九、SIFT算法研究
作者:July、二零一一年二月十五日。
推荐阅读:
David G. Lowe, "Distinctive image features from scale-invariant keypoints,"
International Journal of Computer Vision, 60, 2 (2004), pp. 91-110
---------------------------------------------
尺度不变特征转换(Scale-invariant feature transform 或 SIFT)是一种电脑视觉的算法用来侦测与描述影像中的局部性特征,它在空间尺度中寻找极值点,并提取出其位置、尺度、旋转不变量,此算法由 David Lowe 在1999年所发表,2004年完善总结。
Sift算法就是用不同尺度(标准差)的高斯函数对图像进行平滑,然后比较平滑后图像的差别,
差别大的像素就是特征明显的点。
一、Sift算法的步骤
Sift(Scale Invariant Feature Transform)是一个很好的图像匹配算法,
同时能处理亮度、平移、旋转、尺度的变化,利用特征点来提取特征描述符,最后在特征描述符之间寻找
匹配。
该算法主要包括5个步骤进行匹配:
1、构建尺度空间,检测极值点,获得尺度不变性;
2、特征点过滤并进行精确定位,剔除不稳定的特征点;
3、在特征点处提取特征描述符,为特征点分配方向值;
4、生成特征描述子,利用特征描述符寻找匹配点;
以特征点为中心取16*16的邻域作为采样窗口,
将采样点与特征点的相对方向通过高斯加权后归入包含8个bin的方向直方图,
最后获得4*4*8的128维特征描述子。
示意图如下:
5、计算变换参数。
当两幅图像的Sift特征向量生成以后,下一步就可以采用关键点特征向量的欧式距离来作为两幅图像中
关键点的相似性判定度量。
取图1的某个关键点,通过遍历找到图像2中的距离最近的两个关键点。
在这两个关键点中,如果次近距离除以最近距离小于某个阙值,则判定为一对匹配点。
最后,看下Sift 算法效果图:
下图左边部分Sift算法匹配结果,右边部分是其它算法匹配结果:
二、Sift算法的描述
在上述的Sift算法步骤一中,提到了尺度空间,那么什么是尺度和尺度空间呢?
尺度就是受delta这个参数控制的表示。
而不同的L(x,y,delta)就构成了尺度空间,实际上,具体计算的时候,即使连续的高斯函数,都要被离
散为(一般为奇数大小)(2*k+1) *(2*k+1)矩阵,来和数字图像进行卷积运算。
David Lowe关于Sfit算法,2004年发表在Int. Journal of Computer Vision的经典论文中,
对尺度空间(scal space)是这样定义的 :
It has been shown by Koenderink (1984) and Lindeberg (1994) that under a variety of
reasonable assumptions the only possible scale-space kernel is the Gaussian function.
Therefore,the scale space of an image is defined as a function, L(x; y; delta) that is
produced from the convolution of a variable-scale Gaussian, G(x; y; delta), with an input
image, I(x; y):
因此 ,一个图像的尺度空间,L(x,y,delta) ,
定义为原始图像I (x,y)与一个可变尺度的2维高斯函数G(x,y,delta) 卷积运算。
即,原始影像I(x,y)在不同的尺度e下,与高斯滤波器G(x,y,e)进行卷积,得到L(x,y,e),如下:
L(x,y,e) = G(x,y,e)*I(x,y)
其中G(x,y,e)是尺度可变高斯函数,
G(x,y,e) = [1/2*pi*e2] * exp[ -(x2 + y2)/2e2]
(x,y)是空间坐标, e是尺度坐标。
为了更有效的在尺度空间检测到稳定的关键点,提出了高斯差分尺度空间(DOG scale-space)。
利用不同尺度的高斯差分核与原始图像I(x,y) ,卷积生成。
D(x,y,e) = ((G(x,y,ke) - G(x,y,e)) * I(x,y)
= L(x,y,ke) - L(x,y,e)
DOG算子计算简单,是尺度归一化的LoG算子的近似。
Gaussian卷积是有尺寸大小的,使用同一尺寸的滤波器对两幅包含有不同尺寸的同一物体的图像求局部最值将有可能出现一方求得最值而另一方却没有的情况,但是容易知道假如物体的尺寸都一致的话它们的局部最值将会相同。
SIFT的精妙之处在于采用图像金字塔的方法解决这一问题,我们可以把两幅图像想象成是连续的,分别以它们作为底面作四棱锥,就像金字塔,那么每一个 截面与原图像相似,那么两个金字塔中必然会有包含大小一致的物体的无穷个截面,但应用只能是离散的,所以我们只能构造有限层,层数越多当然越好,但处理时 间会相应增加,层数太少不行,因为向下采样的截面中可能找不到尺寸大小一致的两个物体的图像。
有了图像金字塔就可以对每一层求出局部最值,但是这样的稳定 点数目将会十分可观,所以需要使用某种方法抑制去除一部分点,但又使得同一尺度下的稳定点得以保存
图像金字塔的构建:图像金字塔共O组,每组有S层,下一组的图像由上一组图像降采样得到。
如下图:
三、Sift算法的实现
作为一种匹配能力较强的局部描述算子,SIFT算法的实现相当复杂,
不过David Lowe到底也还是用c++实现了它,下面,阐述下其中的俩个关键函数。
关键函数一:
int sift_features( IplImage* img, struct feature** feat )
这个函数就是用来提取图像中的特征向量。
参数img为一个指向IplImage数据类型的指针,用来表示需要进行特征提取的图像。
IplImage是opencv库定义的图像基本类型(关于opencv是一个著名的图像处理类库,详细的介绍可以参见
http://www.opencv.org.cn
)。
参数feat 是一个数组指针,用来存储图像的特征向量。
函数调用成功将返回特征向量的数目,否则返回-1.
函数,完整表述如下:
int sift_features( IplImage* img, struct feature** feat )
{
return _sift_features( img, feat, SIFT_INTVLS, SIFT_SIGMA, SIFT_CONTR_THR,
SIFT_CURV_THR, SIFT_IMG_DBL, SIFT_DESCR_WIDTH,
SIFT_DESCR_HIST_BINS );
}
关键函数二:
int _sift_features( IplImage* img, struct feature** feat, int intvls,double sigma, double
contr_thr, int curv_thr, int img_dbl, int descr_width, int descr_hist_bins )
稍微介绍下此函数的几个参数:
intvls: 每个尺度空间的采样间隔数,默认值为3.
sigma: 高斯平滑的数量,默认值1.6.
contr_thr:判定特征点是否稳定,取值(0,1),默认为0.04,这个值越大,被剔除的特征点就越多。
curv_thr:判定特征点是否边缘点,默认为6.
img_dbl:在建立尺度空间前如果图像被放大了1倍则取值为1,否则为0.
descr_width:计算特征描述符时邻域子块的宽度,默认为4.
descr_hist_bins:计算特征描述符时将特征点邻域进行投影的方向数,默认为8,分别是0,45,90,135
,180,215,270,315共8个方向。
以下是此函数的完整表述:
int _sift_features( IplImage* img, struct feature** feat, int intvls,
double sigma, double contr_thr, int curv_thr,
int img_dbl, int descr_width, int descr_hist_bins )
{
IplImage* init_img;
IplImage*** gauss_pyr, *** dog_pyr;
CvMemStorage* storage;
CvSeq* features;
int octvs, i, n = 0;
/* check arguments */
if( ! img )
fatal_error( "NULL pointer error, %s, line %d", __FILE__, __LINE__ );
if( ! feat )
fatal_error( "NULL pointer error, %s, line %d", __FILE__, __LINE__ );
/* build scale space pyramid; smallest dimension of top level is ~4 pixels */
init_img = create_init_img( img, img_dbl, sigma );
octvs = log( MIN( init_img->width, init_img->height ) ) / log(2) - 2;
gauss_pyr = build_gauss_pyr( init_img, octvs, intvls, sigma );
dog_pyr = build_dog_pyr( gauss_pyr, octvs, intvls );
storage = cvCreateMemStorage( 0 );
features = scale_space_extrema( dog_pyr, octvs, intvls, contr_thr,
curv_thr, storage );
calc_feature_scales( features, sigma, intvls );
if( img_dbl )
adjust_for_img_dbl( features );
calc_feature_oris( features, gauss_pyr );
compute_descriptors( features, gauss_pyr, descr_width, descr_hist_bins );
/* sort features by decreasing scale and move from CvSeq to array */
cvSeqSort( features, (CvCmpFunc)feature_cmp, NULL );
n = features->total;
*feat = calloc( n, sizeof(struct feature) );
*feat = cvCvtSeqToArray( features, *feat, CV_WHOLE_SEQ );
for( i = 0; i < n; i++ )
{
free( (*feat)[i].feature_data );
(*feat)[i].feature_data = NULL;
}
cvReleaseMemStorage( &storage );
cvReleaseImage( &init_img );
release_pyr( &gauss_pyr, octvs, intvls + 3 );
release_pyr( &dog_pyr, octvs, intvls + 2 );
return n;
}
这个函数是上述函数一的重载,作用是一样的,实际上函数一只不过是使用默认参数调用了函数二,
核心的代码都是在函数二中实现的。
sift创始人David Lowe的完整代码,包括他的论文,请到此处下载:
http://www.cs.ubc.ca/~lowe/keypoints
日后,本BLOG内,会具体剖析下上述David Lowe的Sift算法代码。
Rob Hess维护的sift 库:
http://blogs.oregonstate.edu/hess/code/sift/
还可,参考这里:
sift图像特征提取与匹配算法代码(友人,onezeros博客):
http://blog.csdn.net/onezeros/archive/2011/01/05/6117704.aspx
完。
本人July对本博客所有任何文章、内容和资料享有版权。
转载务必注明作者本人及出处,并通知本人。July、二零一一年二月十五日。
分享到:
相关推荐
图像特征点提取及匹配算法研究论文 图像特征点提取及匹配算法是机器视觉领域中的核心技术,广泛应用于目标识别、物体跟踪、图像检索等领域。本论文研究的主要目标是设计和实现一个高效的图像特征点提取及匹配算法,...
总的来说,SIFT算法是一种强大的图像特征提取工具,它在图像识别、目标检测等领域有广泛的应用。通过使用提供的SIFT程序,开发者和研究人员可以更便捷地处理和分析图像数据,提高他们的项目效率和准确性。
总的来说,掌握MATLAB实现的SIFT算法不仅可以提升图像处理能力,还能够为机器视觉和计算机视觉领域的研究提供坚实的基础。通过深入理解并实践提供的源代码,你将能更好地运用SIFT算法解决实际问题。
SIFT算法因其对尺度、旋转和光照变化的不变性而受到广泛关注,使其成为图像匹配、物体识别、三维重建等任务中的重要工具。 在"图像特征提取SIFT匹配源码"中,我们可以预期包含以下几个关键知识点: 1. **尺度空间...
综上所述,图像匹配算法的核心在于特征提取和匹配策略,SIFT和SURF是其中的经典方法。理解并掌握这些理论,对于进行图像处理和计算机视觉相关的研究与开发至关重要。通过阅读“图像匹配算法及其实现原理.pdf”这样的...
【标题】中的“一种比SIFT算法更好的特征提取及匹配算法”指的是在计算机视觉领域,研究者们在SIFT(尺度不变特征变换)算法的基础上,发展出了一种更高效的特征提取和匹配方法。SIFT算法是由David Lowe在1999年提出...
综上所述,SIFT算法及其改进版本是图像处理和计算机视觉领域的关键技术,其原理和实践对于理解图像特征提取和匹配至关重要。通过不断的研究和改进,这一领域持续发展,为各种图像相关应用提供了坚实的基础。
在图像处理领域,特征提取和匹配是至关重要的步骤,它们为图像识别、图像检索和计算机视觉应用提供基础。本资源是基于MATLAB实现的SIFT(尺度不变特征变换)算法,这是一种经典且强大的特征提取方法,特别适用于图像...
1. SIFT特征提取算法:SIFT算法是由David Lowe提出的一种鲁棒的图像特征提取算法,该算法可以从图像中提取出稳定的特征点。SIFT算法的实现过程包括尺度空间 构建、关键点检测、特征描述符计算等步骤。 2. 图像匹配...
为了验证改进后的SIFT算法的有效性,研究人员针对不同类型的图像进行了大量实验,这些图像包含了几何失真、辐射失真以及噪声影响等多种因素。实验结果显示,改进后的SIFT算法在保持原有优势的基础上,进一步提升了...
本代码是sift特征提取代码,sift特征可以用于人脸识别,图像检索 图像匹配 图像拼接,sift特征具有旋转不变形,尺度不变形,光照不变形等,此算法已广泛应用于人脸识别 图像检索 图像匹配 图像拼接的研究。...
基于 SIFT 特征提取与 Delaunay 三角网格剖分算法在图像匹配中的研究 本文研究的主要内容是基于 SIFT 特征提取与 Delaunay 三角网格剖分算法在图像匹配中的应用。该算法主要用于遥感卫星图像的匹配,通过 SIFT 算法...
在这个主题“OPENCV_SIFT_特征提取_匹配算法”中,我们将深入探讨SIFT(尺度不变特征变换)特征提取和匹配算法,这是计算机视觉领域中一个经典且重要的概念。 SIFT特征是一种局部描述符,由David Lowe在1999年提出...
改进的Canny算子与SIFT算法相结合的医学图像特征提取 改进的Canny算子与SIFT算法相结合的医学图像特征提取是指结合改进的Canny算子和SIFT算法来实现医学图像特征的快速提取和分析。这种方法可以使计算机具备图像...
在图像处理领域,SIFT(尺度不变特征变换)是...总之,基于MATLAB的SIFT匹配算法研究不仅涵盖了SIFT算法的基本原理,还涉及到其在MATLAB环境中的实现细节,对于理解SIFT算法和进行相关图像处理项目有着重要的参考价值。
1. SIFT 算法:SIFT 是一种常用的图像特征提取算法,能够鲁棒地提取图像中的特征点。SIFT 算法可以分为三步:检测极值点、计算方向梯度、计算描述子。 2. RANSAC 算法:RANSAC 是一种常用的图像优化处理算法,能够...
本文研究了面向书脊图像的特征提取与匹配技术,旨在解决传统SIFT算法在计算耗时长的问题。作者提出了基于统一计算设备架构(CUDA)的SIFT特征提取与匹配算法,并将其应用于书脊图像匹配中。 SIFT算法是一种常用的...