- 浏览: 452438 次
- 性别:
- 来自: 西安
文章分类
最新评论
-
进退取舍:
谢谢,这个用上了!!
Java 一个线程池的示例 -
pb_water:
感谢楼主,打算买楼主的书,支持一下,楼主功德无量
JavaScript内核系列第0版整理稿下载 -
lancezhcj:
有图会直观的多呢,再摸索摸索
有限自动机与建模 -
hsmsyy:
这里应该是原创了吧,楼主我觉得闭包的作用:实现面向对象。有待商 ...
JavaScript内核系列 第7章 闭包 -
wll52:
在应用退出之前,需要释放连接 con.disconnect() ...
使用smack与GTalk通信
前言
关于opencv
OpenCV 是 Intel 开源计算机视觉库 (Computer Version) 。它由一系列 C 函数和少量 C++ 类构成,实现了图像处理和计算机视觉方面的很多通用算法。
OpenCV 拥有包括 300 多个 C 函数的跨平台的中、高层 API 。它不依赖于其它的外部库 —— 尽管也可以使用某些外部库。 OpenCV 对非商业应用和商业应用都是免费 的。同时 OpenCV 提供了对硬件的访问,可以直接访问摄像头,并且 opencv 还提供了一个简单的 GUI(graphics user interface) 系统 :highgui 。 我们就通过 OpenCV 提供的一些方法来构造出这个人脸检测 ( face detection ) 程序来。
opencv的python包装
OpenCV 本身是有 C/C++ 编写的,如果要在其他语言中使用,我们可以通过对其动态链接库文件进行包装即可,幸运的是, Python 下有很多个这样的包装,本文中使用的是 Cvtypes 。
事实上,在 Python 中很多的包都是来自第三方的,比如 PIL(Python Image Library) 即为 C 语言实现的一个图形处理包,被包装到了 Python 中,这些包装可以让你像使用 Python 的内建函数一样的使用这些 API 。
人脸检测原理
人脸检测属于目标检测(object detection) 的一部分,主要涉及两个方面
- 先对要检测的目标对象进行概率统计,从而知道待检测对象的一些特征,建立起目标检测模型。
- 用得到的模型来匹配输入的图像,如果有匹配则输出匹配的区域,否则什么也不做。
计算机视觉
计算机的视觉系统,跟人的眼睛是大不相同的,但是其中也有类似之处。人眼之能够看到物体,是通过物体上反射出来的光线刺激人眼的感光细胞,然后视觉神经在大脑中形成物体的像。计算机通过摄像头看到的东西要简单的多,简单来说,就是一堆由数字组成的矩阵。这些数字表明了物体发出的光的强弱,摄像头的光敏元件将光信号转化成数字信号,将其量化为矩阵。
如何从这些数字中得出:"这是一个人脸"的结论,是一个比较复杂的事情。物理世界是彩色的,一般来说,计算机中的彩色图片都是由若干个色彩通道累积出来的,比如RGB模式的图片,有红色通道(Red),绿色通道(Green)和蓝色通道(Blue),这三个通道都是灰度图,比如一个点由8位来表示,则一个通道可以表示2^8=256个灰度。那样三个通道进行叠加以后可以表3*8=24位种色彩,也就是我们常说的24位真彩。
对这样的图片做处理,无疑是一件很复杂的事,所以有必要先将彩色图转为灰度图,那样可以减少数据量(比如RGB模式,可以减少到原图片的1/3),同时可以去掉一些噪声信号。先将图片转化为灰度图,然后将这个灰度图的对比度增高,这样可以使得图片本来暗的地方更暗,亮的地方更亮一些。这样处理以后,图片就更容易被算法设别出来了。
Harr特征级联表
OpenCV在物体检测上使用的是haar特征的级联表,这个级联表中包含的是boost的分类器。首先,人们采用样本的haar特征进行分类器的训练,从而得到一个级联的boost分类器。训练的方式包含两方面:
1. 正例样本,即待检测目标样本
2. 反例样本,其他任意的图片
首先将这些图片统一成相同的尺寸,这个过程被称为归一化,然后进行统计。一旦分类器建立完成,就可以用来检测输入图片中的感兴趣区域的检测了,一般来说,输入的图片会大于样本,那样,需要移动搜索窗口,为了检索出不同大小的目标,分类器可以按比例的改变自己的尺寸,这样可能要对输入图片进行多次的扫描。
什么是级联的分类器呢?级联分类器是由若干个简单分类器级联成的一个大的分类器,被检测的窗口依次通过每一个分类器,可以通过所有分类器的窗口即可判定为目标区域。同时,为了考虑效率问题,可以将最严格的分类器放在整个级联分类器的最顶端,那样可以减少匹配次数。
基础分类器以haar特征为输入,以0/1为输出,0表示未匹配,1表示匹配。
Haar特征
- 边界特征,包含四种
- 线性特征,包含8种
- 中心围绕特征,包含两种
在扫描待检测图片的时候,以边界特征中的(a)为例,正如前面提到的那样,计算机中的图片是一个数字组成的矩阵,程序先计算整个窗口中的灰度值x,然后计算矩形框中的黑色灰度值y,然后计算(x-2y)的值,得到的数值与x做比较,如果这个比值在某一个范围内,则表示待检测图片的当前扫描区域符合边界特征(a),然后继续扫描。
关于这个算法的更详细描述已经超出了本文的范围,可以在参考资源中获得更多的信息。
非固定大小目标检测
因为是基于视频流的目标检测,我们事先不太可能知道要检测的目标的大小,这就要求我们的级联表中的分类器具有按比例增大(或者缩小)的能力,这样,当小的窗口移动完整个待检测图片没有发现目标时,我们可以调整分类器的大小,然后继续检测,直到检测到目标或者窗口与待检测图片的大小相当为止。
步骤一:图片预处理
在从摄像头中获得一个帧(一张图片)后,我们需要先对这张图片进行一些预处理:
- 将图片从RGB模式转为灰度图将灰度图
- 进行灰度图直方图均衡化操作
这两个步骤在OpenCV中是非常简单的:
image_size = cv.cvGetSize(image)#获取原始图像尺寸 grayscale = cv.cvCreateImage(image_size, 8, 1)# 建立一个空的灰度图 cv.cvCvtColor(image, grayscale, cv.CV_BGR2GRAY)#转换 storage = cv.cvCreateMemStorage(0)#新建一块存储区,以备后用 cv.cvClearMemStorage(storage) cv.cvEqualizeHist(grayscale, grayscale)# 灰度图直方图均衡化
步骤二:检测并标记目标
OpenCV中,对于人脸检测的模型已经建立为一个XML文件,其中包含了上面提到的harr特征的分类器的训练结果,我们可以通过加载这个文件而省略掉自己建立级联表的过程。有了级联表,我们只需要将待检测图片和级联表一同传递给OpenCV的目标检测算法即可得到一个检测到的人脸的集合。
# detect objects cascade = cv.cvLoadHaarClassifierCascade('haarcascade_frontalface_alt.xml', cv.cvSize(1,1)) faces = cv.cvHaarDetectObjects(grayscale, cascade, storage, 1.2, 2, cv.CV_HAAR_DO_CANNY_PRUNING, cv.cvSize(50, 50))#设置最小的人脸为50*50像素 if faces: print 'face detected here', cv.cvGetSize(grayscale) for i in faces: cv.cvRectangle(image, cv.cvPoint( int(i.x), int(i.y)), cv.cvPoint(int(i.x + i.width), int(i.y + i.height)), cv.CV_RGB(0, 255, 0), 1, 8, 0)#画一个绿色的矩形框
步骤三:用highgui画出视频窗口
highgui.cvNamedWindow ('camera', highgui.CV_WINDOW_AUTOSIZE) highgui.cvMoveWindow ('camera', 50, 50) highgui.cvShowImage('camera', detimg)
可以看到,OpenCV的API相当清晰,使用Python的包装,可以使得代码非常小。好了,我们可以看看程序的运行结果:
由于视频流是动态的,所以我们可以在程序的入口中使用一个无限循环,在循环中,每次从视频中读入一个帧,将这个帧传输给人脸检测模块,检测模块在这个帧上进行标记(如果有人脸的话),然后返回这个帧,主程序拿到这个帧后,更新显示窗口。
opencv的其他特性
拉普拉斯边缘检测
def laplaceTransform(image): laplace = None colorlaplace = None planes = [None, None, None] image_size = cv.cvGetSize(image) if not laplace: for i in range(len(planes)): planes[i] = cv.cvCreateImage(image_size, 8, 1) laplace = cv.cvCreateImage(image_size, cv.IPL_DEPTH_16S, 1) colorlaplace = cv.cvCreateImage(image_size, 8, 3) cv.cvSplit(image, planes[0], planes[1], planes[2], None) for plane in planes: cv.cvLaplace(plane, laplace, 3) cv.cvConvertScaleAbs(laplace, plane, 1, 0) cv.cvMerge(planes[0], planes[1], planes[2], None, colorlaplace) colorlaplace.origin = image.origin return colorlaplace
效果图:
CVtypes中自带了一个关于图像色彩空间的直方图的例子:
结束语
OpenCV的功能十分强大,而且提供了大量的算法实现,文中涉及到的内容只是计算机视觉中很小的一部分。读者可以考虑将采集到的人脸进行标识,从而实现特定人的人脸识别。或者考虑将人脸检测移植到网络上,从而实现远程监控。试想一下,原来没有生命的机器,我们可以通过自己的思想,动作来使得它们看起来像是有思想一样,这件事本身就非常的有趣。
评论
但是我还是想说一句:楼主很帅。。。。
-----
我也一直忍者想说,,,,
呵呵,这两个帅哥真是,不要取笑我了。
但是我还是想说一句:楼主很帅。。。。
-----
我也一直忍者想说,,,,
你想说啥?不实用还值得研究?
我个人的看法是,还是老老实实的调用c去这个事情吧
恩,完全可以的,不过自己要封装写接口,另外要特别小心OpenCV中的全局变量和静态变量
google的网络相册跟你的google账户绑定,比如你有个关于你自己的同事的相册,其中有300张照片,你想找其中有张三的,只需要搜张三,Google的系统可以帮你从预先识别出来的人脸中找到相关的图片。
http://www.myheritage.cn/%E4%BA%BA%E8%84%B8%E8%BE%A8%E8%AF%86
用来把照片生成卡通形象,每次看见那个玩意我都万念俱灰
这个东西不知道用在图片智能匹配上效果怎么样,比如我有1000张照片,然后可以根据一个样本图片进行模糊查询
文中的例子是关于人脸检测的,在检测的基础上可以考虑开发人脸识别(特定人脸和基于图片的模糊查询),这种肯定是可以实现的,因为人脸设别是可以实现的,只需要在判断的时候,阀值取成一个范围,应该就可以完成了。
有时间的话研究研究人脸识别,感觉这个比检测要难一些。
发表评论
-
JavaScript内核系列 第15章 服务器端的JavaScript
2012-02-12 21:39 2326第15章已经在icodeit上发布,这一章分为上/下两篇,请朋 ... -
使用vim开发python及graphviz绘图
2011-12-23 14:49 6458基本需求 使用vim中的autocmd命令可以很容易的将正在 ... -
Java脚本技术应用实例
2011-01-22 11:24 4268前言 一直以来都很喜欢可以自由扩展的软件,这一点应该已经在很 ... -
可编程计算器(phoc)的设计与实现
2011-01-17 11:34 1983前言 借助JavaScript脚本 ... -
函数式编程(javascirpt)
2009-04-18 22:18 1264前言 Javascript,有人称 ... -
C和指针
2009-05-21 23:15 1117前言 指针是C的灵魂,正是指针使得C存在了这么多年,而且将长 ... -
C和指针(续)
2009-05-25 23:41 1360前言 上一篇《C和指针》可能对关于C和指针的有些内容没有说透 ... -
有限自动机与建模
2009-06-06 10:48 1786前言 在学校学程序设计语言的时候,能接触到的所有例子没有一个 ... -
事件和监听器
2009-06-21 22:06 1437前言 事件监听器是经 ... -
基于总线的消息服务(BBMS)的设计与实现
2009-07-25 22:19 1365前言 异步事件的通知机制在比较有规模的软件设计中必然会有涉及 ... -
JavaScript内核系列 第9章 函数式的Javascript
2010-05-13 19:20 3788第九章 函数式的Javascript 要说Ja ... -
JavaScript内核系列 第8章 面向对象的JavaScript(下)
2010-05-06 09:40 3673接上篇:JavaScript内核系列 第8章 面向对象的Jav ... -
JavaScript内核系列 第8章 面向对象的JavaScript(上)
2010-05-06 09:26 2906第八章 面向对象的 Javascript ... -
JavaScript内核系列 第7章 闭包
2010-05-04 08:48 3874第七章 闭包 闭包向来给包括JavaScript程序 ... -
JavaScript内核系列 第6章 正则表达式
2010-04-27 19:44 4050第六章 正则表达式 正则表达式是对字符串的结构 ... -
JavaScript内核系列 第5章 数组
2010-04-24 15:17 4531第五章 数组 JavaScript的数组也是一个比较 ... -
Swing小应用(Todo-List)之三
2010-04-22 20:47 2136前言 去年9月份开发的那个小工具sTodo,只是做到了能用, ... -
JavaScript内核系列 第4章 函数
2010-04-18 17:31 5095第四章 函数 函数,在C语言之类的过程式语言中 ... -
JavaScript内核系列 第3章 对象与JSON
2010-04-12 09:12 6134第三章 对象与JSON JavaScript对象与传 ... -
JavaScript内核系列 第2章 基本概念
2010-04-03 19:44 5690第二章 基本概念 ...
相关推荐
通过阅读这本书,读者不仅可以掌握OpenCV和Python在计算机视觉中的应用,还能了解到相关算法的原理和实现,为后续的项目开发和研究打下坚实的基础。同时,"readme.txt"可能是作者提供的额外说明或代码示例,有助于...
总的来说,这个系统通过OpenCV的人脸检测和识别技术,结合Python的编程能力,实现了智能化的上课签到流程。它不仅减轻了教师的工作负担,也为学生提供了便捷的签到体验,充分展示了科技在教育领域的应用潜力。
在本项目中,我们主要探讨的是如何利用OpenCV库与Python编程语言来实现人脸检测的简单功能。OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉库,它包含了大量的图像处理和计算机视觉的算法,...
在示例中,`haarcascade_frontalface_default.xml`是预训练的人脸检测模型,可以从OpenCV的GitHub仓库下载。这个模型可以识别正面的人脸,但OpenCV还提供了其他模型,如侧脸检测或更复杂的面部特征检测。 7. **...
【OpenCV 人脸检测原理】 OpenCV 是一个强大的开源计算机视觉库,由 Intel 开发,包含了大量的 C 函数和 C++ 类,用于图像处理和计算机视觉领域的广泛应用。它提供了跨平台的中、高层 API,无需依赖其他外部库,且...
《OpenCV+3计算机视觉+Python语言实现(第二版)》是一本专注于计算机视觉领域,结合OpenCV 3库和Python编程语言的实战教程。在本教程中,读者将深入学习如何利用OpenCV的强大功能和Python的易用性来解决各种计算机...
在**《OpenCV+3计算机视觉++Python语言实现+第二版》**这本书中,读者可以期待深入学习这些概念,包括详细的代码示例、理论解释以及实践项目,从而提升在计算机视觉领域的技能。通过阅读和实践,开发者不仅可以掌握...
这个资源包可能包含详细步骤、代码示例以及解释,帮助初学者快速上手OpenCV与Python的结合使用,实践颜色识别项目,从而提升对计算机视觉的理解和应用能力。对于进一步学习,可以深入研究OpenCV的高级特性,如深度...
5. 物体检测与识别:使用Haar级联分类器进行人脸识别,或者使用现代深度学习模型(如YOLO、SSD)进行更复杂的目标检测。 6. 视频处理:可以读取、播放和分析视频流,实现运动分析、背景减除等。 7. 机器学习与深度...
《OpenCV+3计算机视觉+Python语言:opencv3计算机视觉python语言实现》 在计算机科学领域,计算机视觉是一门涉及图像处理、机器学习和模式识别等多学科的交叉领域。OpenCV(开源计算机视觉库)是这个领域的核心工具...
基于opencv人脸识别的员工考勤系统python源码+设计文档+示例图片.zip 基于opencv人脸识别的员工考勤系统python源码+设计文档+示例图片.zip 基于opencv人脸识别的员工考勤系统python源码+设计文档+示例图片.zip 基于...
通过Python与OpenCV的结合,树莓派可以在有限的资源下执行复杂的视觉算法,如人脸识别、物体追踪、图像分割等。 在"3rdEdition"这个压缩包中,你可能找到的文件包括书籍的章节、代码示例、实验指导以及可能的附加...
《Practical Python and OpenCV + Case Studies (3rd edition)》是针对Python编程与OpenCV库的实战指南,尤其适合已经有一定Python基础并希望深入学习计算机视觉技术的读者。本书的第三版更新了最新的OpenCV版本,...
使用 MediaPipe 库进行实时人脸检测的Python示例程序,写有详细中文注释。 ## 依赖 确保已经安装了以下依赖: - Python 3.x - OpenCV (`pip install opencv-python`) - MediaPipe (`pip install mediapipe`) ## ...
这个安装包使得开发者能够在Python环境中利用OpenCV的功能,进行图像处理、视频分析、特征检测等任务。 OpenCV的核心功能包括: 1. 图像处理:OpenCV提供了丰富的函数用于图像的读取、显示、保存、颜色空间转换...
Python版本的OpenCV(即`opencv-python`)提供了丰富的接口,使得Python开发者能够轻松地利用这个库进行图像和视频操作。`opencv-python-4.5.5.64.tar.gz`是一个包含了OpenCV Python接口的特定版本4.5.5.64的源码或...
总的来说,Python+OpenCV的人脸检测技术结合了统计学、图像处理和机器学习,提供了一种高效且广泛适用的方法来自动识别和定位图像中的人脸。这个技术在安全监控、社交媒体、人机交互等领域有着广泛应用。
在`opencv-python-4.5.3.56.tar.gz`这个压缩包中,包含了安装OpenCV-Python所需的全部文件,如`.py`源代码、编译好的`.so`或`.dll`动态链接库文件,以及相关的文档和示例。解压后,可以通过Python的`setup.py`脚本...
《实用Python与OpenCV实战案例(第3版)》是一本深入探讨Python编程与计算机视觉库OpenCV结合使用的专业书籍。这本书旨在帮助读者掌握如何利用Python语言和OpenCV库进行图像处理、计算机视觉算法实现以及相关项目的...
OpenCV拥有丰富的官方文档、教程、示例代码以及活跃的开发者社区,包括GitHub、StackOverflow、官方论坛等,为学习和使用OpenCV提供了有力支持。此外,有许多书籍、在线课程、博客文章和研讨会专门讲解OpenCV的使用...