该帖已经被评为良好帖
|
|
---|---|
作者 | 正文 |
发表时间:2009-09-06
前言关于opencvOpenCV 是 Intel 开源计算机视觉库 (Computer Version) 。它由一系列 C 函数和少量 C++ 类构成,实现了图像处理和计算机视觉方面的很多通用算法。
OpenCV 拥有包括 300 多个 C 函数的跨平台的中、高层 API 。它不依赖于其它的外部库 —— 尽管也可以使用某些外部库。 OpenCV 对非商业应用和商业应用都是免费 的。同时 OpenCV 提供了对硬件的访问,可以直接访问摄像头,并且 opencv 还提供了一个简单的 GUI(graphics user interface) 系统 :highgui 。 我们就通过 OpenCV 提供的一些方法来构造出这个人脸检测 ( face detection ) 程序来。 opencv的python包装
OpenCV 本身是有 C/C++ 编写的,如果要在其他语言中使用,我们可以通过对其动态链接库文件进行包装即可,幸运的是, Python 下有很多个这样的包装,本文中使用的是 Cvtypes 。
事实上,在 Python 中很多的包都是来自第三方的,比如 PIL(Python Image Library) 即为 C 语言实现的一个图形处理包,被包装到了 Python 中,这些包装可以让你像使用 Python 的内建函数一样的使用这些 API 。
人脸检测原理人脸检测属于目标检测(object detection) 的一部分,主要涉及两个方面
计算机视觉计算机的视觉系统,跟人的眼睛是大不相同的,但是其中也有类似之处。人眼之能够看到物体,是通过物体上反射出来的光线刺激人眼的感光细胞,然后视觉神经在大脑中形成物体的像。计算机通过摄像头看到的东西要简单的多,简单来说,就是一堆由数字组成的矩阵。这些数字表明了物体发出的光的强弱,摄像头的光敏元件将光信号转化成数字信号,将其量化为矩阵。 Harr特征级联表OpenCV在物体检测上使用的是haar特征的级联表,这个级联表中包含的是boost的分类器。首先,人们采用样本的haar特征进行分类器的训练,从而得到一个级联的boost分类器。训练的方式包含两方面: Haar特征
非固定大小目标检测因为是基于视频流的目标检测,我们事先不太可能知道要检测的目标的大小,这就要求我们的级联表中的分类器具有按比例增大(或者缩小)的能力,这样,当小的窗口移动完整个待检测图片没有发现目标时,我们可以调整分类器的大小,然后继续检测,直到检测到目标或者窗口与待检测图片的大小相当为止。
步骤一:图片预处理在从摄像头中获得一个帧(一张图片)后,我们需要先对这张图片进行一些预处理:
image_size = cv.cvGetSize(image)#获取原始图像尺寸 grayscale = cv.cvCreateImage(image_size, 8, 1)# 建立一个空的灰度图 cv.cvCvtColor(image, grayscale, cv.CV_BGR2GRAY)#转换 storage = cv.cvCreateMemStorage(0)#新建一块存储区,以备后用 cv.cvClearMemStorage(storage) cv.cvEqualizeHist(grayscale, grayscale)# 灰度图直方图均衡化
步骤二:检测并标记目标OpenCV中,对于人脸检测的模型已经建立为一个XML文件,其中包含了上面提到的harr特征的分类器的训练结果,我们可以通过加载这个文件而省略掉自己建立级联表的过程。有了级联表,我们只需要将待检测图片和级联表一同传递给OpenCV的目标检测算法即可得到一个检测到的人脸的集合。 # detect objects cascade = cv.cvLoadHaarClassifierCascade('haarcascade_frontalface_alt.xml', cv.cvSize(1,1)) faces = cv.cvHaarDetectObjects(grayscale, cascade, storage, 1.2, 2, cv.CV_HAAR_DO_CANNY_PRUNING, cv.cvSize(50, 50))#设置最小的人脸为50*50像素 if faces: print 'face detected here', cv.cvGetSize(grayscale) for i in faces: cv.cvRectangle(image, cv.cvPoint( int(i.x), int(i.y)), cv.cvPoint(int(i.x + i.width), int(i.y + i.height)), cv.CV_RGB(0, 255, 0), 1, 8, 0)#画一个绿色的矩形框
步骤三:用highgui画出视频窗口highgui.cvNamedWindow ('camera', highgui.CV_WINDOW_AUTOSIZE) highgui.cvMoveWindow ('camera', 50, 50) highgui.cvShowImage('camera', detimg)
opencv的其他特性拉普拉斯边缘检测
def laplaceTransform(image): laplace = None colorlaplace = None planes = [None, None, None] image_size = cv.cvGetSize(image) if not laplace: for i in range(len(planes)): planes[i] = cv.cvCreateImage(image_size, 8, 1) laplace = cv.cvCreateImage(image_size, cv.IPL_DEPTH_16S, 1) colorlaplace = cv.cvCreateImage(image_size, 8, 3) cv.cvSplit(image, planes[0], planes[1], planes[2], None) for plane in planes: cv.cvLaplace(plane, laplace, 3) cv.cvConvertScaleAbs(laplace, plane, 1, 0) cv.cvMerge(planes[0], planes[1], planes[2], None, colorlaplace) colorlaplace.origin = image.origin return colorlaplace
结束语OpenCV的功能十分强大,而且提供了大量的算法实现,文中涉及到的内容只是计算机视觉中很小的一部分。读者可以考虑将采集到的人脸进行标识,从而实现特定人的人脸识别。或者考虑将人脸检测移植到网络上,从而实现远程监控。试想一下,原来没有生命的机器,我们可以通过自己的思想,动作来使得它们看起来像是有思想一样,这件事本身就非常的有趣。
声明:ITeye文章版权属于作者,受法律保护。没有作者书面许可不得转载。
推荐链接
|
|
返回顶楼 | |
发表时间:2009-09-06
这么有意思的东西? 原来我也可以搞高科技
|
|
返回顶楼 | |
发表时间:2009-09-07
liusu 写道 这么有意思的东西? 原来我也可以搞高科技 本来Intel就已经为我们做了很多事了,又有Python对其做了一个包装,用起来是相当的方便,如果想深入了解,可能还需要看看opencv的C实现。 前一向将这个人脸检测嵌到一个UDP的网络中,可以实现远程监控(从书房可以看到客厅或者卧室,哈哈),还是比较有意思的。 |
|
返回顶楼 | |
发表时间:2009-09-07
明白了一些
不知道JAVA有没有! |
|
返回顶楼 | |
发表时间:2009-09-07
虽然发与代码无关的东西,是毫无意义的事。。。。
但是我还是想说一句:楼主很帅。。。。 |
|
返回顶楼 | |
发表时间:2009-09-07
yangsp1 写道 虽然发与代码无关的东西,是毫无意义的事。。。。 但是我还是想说一句:楼主很帅。。。。 这位兄弟说笑了,呵呵。 |
|
返回顶楼 | |
发表时间:2009-09-07
楼主你用netbeans怎么处理python中文的?
|
|
返回顶楼 | |
发表时间:2009-09-07
很强大,就是不知道java能调用不。
补充下:楼上 说楼主很帅 不是帅吧,是很帅的嘿嘿。 |
|
返回顶楼 | |
发表时间:2009-09-07
VerRan 写道 很强大,就是不知道java能调用不。 补充下:楼上 说楼主很帅 不是帅吧,是很帅的嘿嘿。 跟楼主平分秋色:) |
|
返回顶楼 | |
发表时间:2009-09-07
qqqckm 写道 楼主你用netbeans怎么处理python中文的?
我的系统是window7 rc的英文版,Netbeans也是下的英文版,我也不知道为什么会出来个中文的界面,哈哈。 |
|
返回顶楼 | |