`
buliedian
  • 浏览: 1238399 次
  • 性别: Icon_minigender_2
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

验证码识别技术

 
阅读更多

原文:http://www.lafdc.com/captcha/20080702.htm

由于现在很多网站,为了加强安全性,以及防止程序的自动操作网站,都加入的了验证码技术。但却给广大站长推广宣传网站带来的麻烦。所以我准备写这篇关于验证码识别技术的文章,不足之处在所难免!本人从来不写东西,今天为了想落伍才写了!

<wbr><wbr><wbr><wbr>广大站长宣传推广自己的网站,经常要发布一些宣传广告,如果靠人工,太慢太昂贵,所以理想的办法是使用群发软件,可现在很多网站都有验证码,这成为群发软件的技术难点,而识别也就难点中的难点,好的,闲话少说,言归正传!<br><br><wbr><wbr><wbr><wbr>我举的例子是比较难于识别的验证码,不讨论不变形、不换字体、不换大小、不旋转的验证码,这里我可能不会写出代码,只是提供我编写的思路,按照这个思路,我写出的程序,比市场上出售的程序的识别率还要高很多。(有兴趣的可以问我,我不想在这里帮别人宣传,呵呵~~)<br><br><wbr><wbr><wbr><wbr>首先以数字验证码开始,字母的要比数字麻烦一些,不过搞清楚了数字验证码的识别,字母的也就不难了。<br><br><wbr><wbr><wbr><wbr>验证码一般都是图片,而且一般都是4位数,处理过程是:先分割为4个部分,然后逐一识别,由于分割比较简单,我这里就不说了,我这里只说如何识别。<br><br><wbr><wbr><wbr><wbr>我的方法是把需要识别的图片,划分为5 行,3 列,15个块,为什么要划分为15个块呢?先看图!<br><br> ○■○<br> ■○■<br> ■○■<br> ■○■<br> ○■○<br><br> ○■○<br> ■■○<br> ○■○<br> ○■○<br> ■■■<br><br> ■■■<br> ○○■<br> ■■■<br> ■○○<br> ■■■<br><br> ■■■<br> ○○■<br> ■■■<br> ○○■<br> ■■■<br><br><wbr><wbr><wbr><wbr>我先举这4个例子吧,其余的大家可以自己画出来。如果做过验证码识别的朋友,肯定很快就明白为什么划分为15个块,其实主要就是因为这样划分更合理,也就更能提高识别率。<br><br><wbr><wbr><wbr><wbr>我的方法是把需要识别的图片,划分为5 行,3 列,15个块,然后对每个块进行计算,当每个块里的有效象素超过多少百分比的时候,就标记为■,如果没超过就标记为○,(这里为了显示方便我使用了■,○,你完全可以把它标为1、0),这里要注意一下,这里的百分比根据字体的粗细可以取67%,50%,33%,20%,为什么要取这几个数?主要和计算机的浮点数运算有关,选这几个数,运算更快,且不容易出错,否则计算机在进行大量计算时也是会出错的!当然这里,你完全可以选适合你的验证码图片的百分比!!<br><br><wbr><wbr><wbr><wbr>如果验证码不变形、不换字体、不换大小、不旋转,我们的识别工作到这一步基本上就结束了,因为已经可以得到比较清晰的块图,对付大多数论坛,就已经足够了。^_^<br><br><wbr><wbr><wbr><wbr>如果验证码的变形比较大、且有很多字体、大小也不固定、且有旋转,那么我们经过划分、取比率显示后,可能会得到这样一个图:<br><br> ○■○<br> ○○■<br> ○■○<br> ■○○<br> ■■■<br><br><wbr><wbr><wbr><wbr>那么这个数字应该是什么数字,我们需要使用排除法!排除所有不可能,在0123456789中,这个图不可能是013456789,他只能是:2。<br><br><wbr><wbr><wbr><wbr>写过验证码识别的朋友可能已经明白了!是的,我们需要建立一个类似的数据库,也就是识别库,出现哪些图,他就属于那个数字。<br> 再举一个例子:<br><br> ○■○<br> ■○○<br> ■■■<br> ■○■<br> ○■○<br><br><wbr><wbr><wbr><wbr>这是哪个数字呢??是6,没错<br><br><wbr><wbr><wbr><wbr>我这里我需要再说明一下为什么要取5行,3列,15个块,因为块太多了你的识别库就会很大,块太少了,就会出现很多分不清楚的块图。<br><br> 另外你取的百分比也需要注意,不能太大也不能太小。<br><br><wbr><wbr><wbr><wbr>好了,等做好自己的数据库,这时就可以识别大部分数字了。<br><br><wbr><wbr><wbr><wbr>最后还有一个问题,就是重复的问题,比如,图片上的数字,明明是5,可由于它的字体不是常见的字体,且发生了旋转,最后得到这样一个图:<br><br> ■■■<br> ■○○<br> ■■■<br> ■○■<br> ■■■<br><br><wbr><wbr><wbr><wbr>在我的数据库里,这个块图,是6,也是就说识别错误,怎么办?<br><br><wbr><wbr><wbr><wbr>我的解决方法是,在数据库里先把这条数据删除因为这个是错误的。<br><br><wbr><wbr><wbr><wbr>遇到这种情况,就需要进行二次处理,我的方法是:提高百分比,这时就得到了:<br><br> ■■○<br> ■○○<br> ■■○<br> ○○■<br> ■■○<br><br><wbr><wbr><wbr><wbr>OK,经过降低百分比,图片就由“6”又变为“5”了,呵呵~~~由于降低了百分比,我们需要再建立一个识别库的来存储这些数据。<br><br><br><wbr><wbr><wbr><wbr>好了,我的文章就写到这里,只是给大家提供一个思路,可能还有一些细节我没写出来,但主要的方法都提供出来了,希望能起到抛砖引玉的作用,也希望能够落伍!!!!</wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr>


分享到:
评论

相关推荐

    验证码识别技术的源码

    验证码识别技术是网络安全领域中的一个重要组成部分,主要用于防止恶意自动化程序(如机器人)对网站进行非法操作,例如批量注册、刷票等。本源码提供了一种自动识别验证码的方法,特别适用于Delphi编程环境,它具备...

    Microsoft Captcha Decoder 验证码识别技术

    Microsoft Captcha Decoder 是微软开发的一种验证码识别技术,旨在帮助开发者和研究人员更好地理解和处理验证码系统,提高自动化过程中的用户体验。 验证码识别技术涉及多个领域,包括图像处理、机器学习和深度学习...

    数字验证码识别技术

    数字验证码识别技术是一种重要的网络安全措施,它主要用于防止自动化的机器人或恶意软件进行非法操作,如批量注册、垃圾邮件发送等。这项技术的核心是通过人类可理解但机器难以自动解析的图像来验证用户是否为真实的...

    验证码识别技术论文..pdf

    验证码识别技术论文.pdf 验证码识别技术是指通过计算机视觉和机器学习算法来自动识别和填充验证码的技术。该技术可以应用于各种验证码识别平台,以提高验证码识别的准确率和效率。 1. 验证码识别的需求 验证码...

    一种简单的基于字符形状的验证码识别技术.rar

    针对传统的基于模板匹配和字符结构的验证码识别技术对字符大小、倾斜等因素非常敏感, 提出了一种基 于字符形状特征的验证码识别方法, 该方法是模拟人眼通过事物形状特征来识别事物。通过相应算法提取字符特 征, 然后...

    高效的验证码识别技术与验证码分类思想

    ### 高效的验证码识别技术与验证码分类思想 #### 概述 验证码作为一种人机区分技术,被广泛应用于各类网站,尤其是论坛类网站,用于防止自动化程序(如论坛自动灌水机)进行恶意操作。其设计的安全性直接影响到...

    验证码识别技术资料收集

    验证码识别技术是信息安全领域的重要一环,主要用于防止自动化的机器人或恶意软件进行非法操作,如批量注册、恶意登录等。本资料集包含了多种验证码识别的思路和技术,包括图像处理、机器学习以及光学字符识别(OCR...

    完美验证码识别系统V3.2.1.zip--验证码识别通用组件

    验证码识别技术是信息安全领域中的一个重要组成部分,主要用于防止自动化的机器人程序进行恶意操作,如批量注册、刷票等。本资源“完美验证码识别系统V3.2.1.zip”提供了一个通用的验证码识别组件,适用于多种验证码...

    基于PHP的验证码识别技术研究与实现.pdf

    验证码识别技术是指通过计算机自动识别验证码的技术,以提高网站安全性和用户体验。验证码识别方法很多,通常分为图像预处理、字符切割和图像后处理三个步骤。 二、图像预处理 图像预处理是将验证码图像进二值化...

    验证码识别,中文验证码识别,汉字验证码识别开发

    验证码识别技术是信息安全领域中的一个重要组成部分,主要用于防止自动化的机器人或恶意软件进行非法操作,如批量注册、恶意登录等。中文验证码识别则是针对含有中文字符的验证码进行解析,增加了识别难度,因为汉字...

    验证码识别 汉字验证码识别

    验证码识别技术是网络安全中一种常见的身份验证手段,用于防止恶意自动化程序(如机器人)进行非法操作。汉字验证码识别尤其具有挑战性,因为它涉及到中文字符的多样性以及图像处理的复杂性。下面将详细介绍图像分割...

    基于LibSVM的验证码识别.pdf

    验证码识别技术在网络安全领域扮演着至关重要的角色,它主要用于防止自动化的机器人程序进行恶意操作。本项目基于流行的机器学习库LibSVM(Support Vector Machine,支持向量机)实现验证码识别,旨在提高系统的自动...

    一种简单的基于字符形状的验证码识别技术

    ### 一种简单的基于字符形状的验证码识别技术 #### 摘要及背景 本文提出了一种新的基于字符形状特征的验证码识别技术。该技术旨在解决传统验证码识别技术中的一些问题,如对字符大小、倾斜等因素的高度敏感性。...

    验证码识别软件 亦思验证码识别

    验证码识别技术是信息技术领域中的一种重要工具,主要应用于网络安全、数据保护等方面,防止恶意自动程序(如机器人)进行非法操作。亦思验证码识别软件是一款专为此目的设计的软件,能够处理和识别各种复杂的验证码...

Global site tag (gtag.js) - Google Analytics