本文摘自论文《视频镜头分割方法综述》,列举并比较了几种像素域的镜头分割方法。
1 基于像素的镜头分割算法
基于像素的镜头分割主要是对视频帧的图像底层处理过程,包括亮度、灰度或者色彩值,其计算简单,原理是计算两帧之间的每个对应的像素的灰度(亮度)的变化。相邻两帧对应点的灰度(亮度)差为
式中,fn(i, j)、fn+1(i, j)分别代表第n 帧和第n+1 帧像素(i, j)的灰度(亮度),则相邻两帧之间的总帧差为
式中,M、N 为图像的尺寸。若总帧差大于某一设定阈值,则判断镜头内容发生变化。该方法原理简单、便于实现。缺点是对于摄像机及镜头内运动物体、光线条件的剧烈变化敏感,容易误检。
2 基于直方图的镜头分割算法
基于直方图的算法是最普遍的分割方法,它实现简单方便,而且对于大多数视频能得到较好的效果。基于直方图的算法是在基于像素的比较上发展来的,基于直方图的算法通常是将相邻帧之间的各个像素的灰度、亮度等分为N 个等级,再针对每个等级统计像素数做成直方图比较,给出两个图像的直方图,则直方图帧差计算公式如下所示:
其中,N 为图像帧像素的总数。hm(i)-hn(i)表示的是两个视频帧在i这个直方图单位上面的距离。基于直方图法不考虑像素的位置信息,而使用其亮度和色彩的统计值,缺点是对结构不同而直方图却很相近的两帧造成漏检而且对于光线变化比较剧烈的情况下,帧差值会受到很大的干扰。
3 基于X2直方图的镜头分割算法
X2 直方图[5]的算法因能放大最大帧差及算法比较稳定而得到广泛应用,为了使直方图帧差更好反映两帧间的差别,可把直方图帧差按下式归一化为:
式中,k 为图像帧像素的总数,hm(i)-hn(i)表示的是两个视频帧在i 这个直方图单位上面的距离。可见,X2 值越大,则两帧间差异越大; 反之则越小。直方图的归一化也叫直方图均衡化,是通过使用累积函数对灰度值进行“调整”以实现对比度的增强。直方图均衡化处理的“中心思想”是把原始图像的灰度直方图从比较集中的某个灰度区间变成在全部灰度范围内的均匀分布。直方图均衡化就是对图像进行非线性拉伸,重新分配图像像素值,使一定灰度范围内的像素数量大致相同。简单说就是把给定图像的直方图分布改变成“均匀”分布直方图分布。其缺点:① 变换后图像的灰度级减少,某些细节消失; ②某些图像,如直方图有高峰,经处理后对比度不自然的过分增强。算法对于摄像机及镜头内物体运动具有良好的容忍程度,但是实现复杂,计算复杂度高。
4 基于X2直方图分块的镜头分割算法
X2直方图分块法顾名思义是在X2基础上改进的,近几年对X2 直方图分块的研究比较少,为了减少运动、光照等引起的帧差值的变化,本文将各帧分块处理,比较每个块的直方图,将差值最大的块剔除,剩下的块比较帧差异值,其计算公式如下:
式中,k 为图像帧像素的总数,p 为块数,hm(i)-hn(i)表示的是两个视频帧在i这个直方图单位上面的距离。缺点是计算时间较X2 直方图时间长,计算复杂度高,优点对于运动的物体有良好的容忍程度。
5 基于边缘轮廓变化率的镜头分割
此方法的主要思想是通过计算边界的变化程度来确定镜头的边界。首先利用canny 算子将图像边缘化,然后计算出帧间的总体位移,以此进行配准,然后计算边缘的数量和位置。帧差由边缘变化的比例表示,即边缘从一帧到另一帧移进和移出的比例。但是由于该方法是先边缘化再进行配准最后才进行边缘比较,因此此方法对于运动时稳健的但计算比较复杂。设Qk为k 帧中与k+1 帧中最近边缘的距离大于给定阈值T 的边缘像素数目的百分比; 同样设Qk+1 为k+1 帧中与k 帧中最近边缘的距离大于给定阈值T的边缘像素数目的百分比,则帧差为:
6 实验结果与分析
首先,选择2个视频剪辑作为实验数据,它们的格式都是avi 格式。第一个视频时长18 秒,共有465帧; 另一个时长17 秒,共有448 帧,播放速度都是25帧/秒,每个视频都有三个人走动,本文就是将每个人走入镜头和走出镜头的镜头边界检测出来。本文比较了两个算法的运行速度和准确率,实验在Window XP 系统下利用 Matlab 运行五个算法,对上述的视频段进行镜头检测。五种算法的运行速度和准确率如表所示。
由表1 可知像素法、X2 直方图法和X2 直方图分块法准确率都比较高,其中X2 直方图分块法准确率最高但是时间比像素法和X2 直方图长。而直方图和边缘轮廓变化率法准确率相对较低,但是边缘轮廓变化率法时间比直方图法时间长4 倍多。由于光照变化影响,以上五种算法性能都没有很达到最优。如图2 展示了第一段视频的其中四种镜头检测的
结果比较:
由图 2 曲线图可知镜头内帧差异值变化不大,但是由于光照和快速运动也会发生很大变化,镜头和镜头的边界也发生了很大的变化,怎么样区分是否镜头边界这几种算法都没有得到很好地诠释。而且选取的阈值也不是唯一的,如直方图选择的阈值是0。025 渐变的阈值是0。013,X2 直方图法选择的是800 渐变的阈值是175,这些值都是根据经验得到的,没有一种通用的算法来计算阈值,这样得到的结果也不是最完美的。
相关推荐
像素域方法是相对于变换域而言的,视频数据以图像的原始形式存在,包含了颜色、纹理、形状、运动矢量等特性。常见的像素域镜头分割方法包括: (1) 绝对距离法,即模板匹配法,通过计算两帧对应像素灰度差的绝对值之...
零镜头分割实验
在实际应用中,常见的镜头分割方法包括基于统计模型、边缘检测、颜色直方图和光流的方法。这个项目可能使用了其中的一种或多种技术来实现镜头的自动分割。 接下来,我们讨论关键帧(Keyframe)的概念。关键帧是在一...
目前,研究者们对摄像机镜头非线性畸变校正方法进行了大量的研究,这些方法可以大致分为两类:基于控制对象的方法和基于模式的方法。基于控制对象的方法主要通过对摄像机拍摄的控制对象进行分析,计算出畸变参数,...
通常,镜头分割通过比较相邻帧之间的显著差异来完成,如像素级的亮度、颜色或纹理变化。其中,“cutDetect.m”可能用于检测突变镜头,而“shot_detection.m”可能用于检测渐变镜头,这两种方法分别处理快速和缓慢的...
视频镜头分割是视频处理中的一个关键技术,主要用于将一段连续的视频序列分割成多个逻辑上独立的镜头,每个镜头对应视频中的一个场景。基于颜色直方图的方法是其中一种常用的技术,它利用颜色信息来判断场景的变化。...
镜头分割,也称镜头边界检测(SBD-Shot Boundary Detection)是一个活跃的研究领域,吸引了许多研究团体的注意力,对它的研究已超过十年,出现了大量算法,早期的工作主要针对突变镜头边界检测,最近的技术主要处理...
针对传统的非压缩域镜头分割算法数据多、运算量大和效率低的缺点,提出了一种基于RS理论的压缩域镜头分割算法。该算法首先根据MPEG压缩标准,从视频流中提取DCT系数;然后经预处理得到每一帧的DC系数;最后依DC系数...
在众多的研究方法中,基于机器学习的压缩域镜头分割技术以其独特的优势脱颖而出,为视频内容分析带来了新的曙光。 本文深入探讨了刘生贵等人提出的一种创新算法,该算法运用支持向量机(SVM)在压缩视频流中直接...
标题中的“镜头镜头,配合ffmpeg分割”表明这是一个关于视频处理的项目,主要涉及两个关键技术:镜头检测(Scene Detection)和使用ffmpeg进行视频分割。在这个项目中,开发者使用了OpenCV库来执行镜头检测,找到...
2. **帧间差异计算**:帧间差异是检测镜头切换常用的方法之一,通过比较连续两帧之间的像素差异来判断是否存在镜头切换。常见的计算方法有绝对差分、平方差分或结构相似性指数(SSIM)。 3. **运动向量分析**:运动...
具体实现中,可以利用诸如图像块匹配、光流估计等方法来检测镜头边界。 接着是"关键帧提取"。关键帧是一段视频中最能代表其内容的帧,它能够概括该镜头的信息。提取关键帧有助于减少视频的数据量,同时保持视频的...
综上所述,基于聚类的镜头分割和关键帧提取方法为基于内容的视频检索提供了一种有效途径。通过优化聚类过程和引入图像熵概念,不仅能提高镜头分割的准确性,还能确保关键帧的选择更加合理,从而为用户提供更为高效和...
冯驰和谭枫两位学者在他们的研究论文中提出了一种改进的自动分割镜头的方法,该方法结合了传统的视频处理技术,并在此基础上进行了创新,以期望达到更高的检出率和精确率。以下为该研究的知识点详解: ### 镜头分割...
一个用作视频镜头分割提取图片的工具,可以通过命令行进行使用。
标题中的“电信设备-视频镜头分割的方法、存储介质和移动终端”主要涵盖了三个核心领域:视频处理技术、存储技术和移动设备应用。以下是这些领域的详细解释: 1. 视频镜头分割方法: 视频镜头分割是视频处理的一个...
光学镜头研究:持续创新精品报告2020.pdf