tongxiaoming520

浏览: 182552 次
性别:
来自: 上海

最近访客更多访客>>

zc5510670

我的无奈

w12983

MuyaXiang

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

识别验证码

博客分类：

ruby
rails

用imagemagick和tesseract-ocr破解简单验证码

Tesseract是Ray Smith 于1985到1995年间在惠普布里斯托实验室开发的一个OCR引擎，曾经在1995 UNLV精确度测试中名列前茅。但1996年后基本停止了开发。2006年，Google邀请Smith加盟，重启该项目。目前项目的许可证是Apache 2.0。

　　该项目目前支持Windows、Linux和Mac OS等主流平台。但作为一个引擎，它只提供核心功能，没有界面。

　　有兴趣参加该项目的同学，可以加入：http://groups.google.com/group/tesseract-dev/，或者与Smith联系。

下载工具：imagemagick + tesseract-ocr

Tesseract-ocr据说辨识程度是世界排名第三,可谓神器啊。

准备工作：

1.安装tesseract-ocr

1

sudo apt-get  install tesseract

2.安装imagemagick

1

sudo apt-get  install imagemagick

3.安装rmagick

1

sudo apt-get remove --purge librmagick-ruby-doc librmagick-ruby1.8

2

sudo apt-get  install libmagick9-dev ruby1.8-dev

3

sudo gem  install rmagick

先试一个简单的：

1

require  'rubygems'

2

require  'rtesseract'

3

img = RTesseract. new ( "tmp/test.jpg" )

4

img.to_s.sub(/\s+$/,  "" )  # => "3R8Z"

很成功，但这个太简单了。一般破解复杂点的验证码处理步骤是先用imagemagick灰度化，灰度反转，提高对比度，二值化等。然后再用ocr去识别。ocr识别黑白图片效果比较好些。

这个的验证码：

1

img = MiniMagick::Image. new ( "tmp/people.jpg" ) 

2

img.colorspace( "GRAY" ) #灰度化

3

image = RTesseract. new (img.path)

4

image.to_s.sub(/\s+$/,  "" )  # => "254369"

这个还是简单，再复杂一点的，这个验证码：

有黑色边框，有背景色，文字稍微扭曲。

1

img = MiniMagick::Image. new ( "tmp/4399.jpg" )

2

img.crop( "#{img[:width] - 2}x#{img[:height] - 2}+1+1" ) #去掉边框（上下左右各 1 像素）

3

img.colorspace( "GRAY" )  #灰度化

4

img.monochrome  #二值化

5

image = RTesseract. new (img.path)  #ocr识别

6

image.to_s.sub(/\s+$/,  "" )  #=> "5692"

像上面这样简单的识别率几乎能达到80%以上，扭曲太严重的识别率就很低了。有轻微噪点的就得自己写去噪算法了。。

破解图片验证码限制的一般思路:

http://www.williamlong.info/archives/347.html

分享到：

code随记 | 图片处理

2011-11-18 17:20
浏览 1148
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

识别验证码

破解图片验证码限制的一般思路:

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

识别验证码

破解图片验证码限制的一般思路:

评论

发表评论

相关推荐

7点关于RESTful规范的API接口设计的想法

RESTful API 设计指南

rails笔记

重构臃肿 ActiveRecord 模型的 7 种方式

Rails系统重构：从单一复杂系统到多个小应用集群

FileUtils 基本文件操作

Custom dialog for data-confirm in Rails

常用ruby gem

sphinx-0.99 + ultrasphinx

rails3 simple captcha

测试ruby代码高亮

rails3 time zone

Creating a 100% ajax CRUD using rails 3 and unobtrusive javascript

rails render用法

Rails 3.2 的 Ajax 向导

ror websites

mutex

Twitter相关

OAuth gem for rails3

安装RMagick

最近访客更多访客>>