`
JasonChi
  • 浏览: 96627 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

用imagemagick和tesseract-ocr破解简单验证码 自我补充记录

 
阅读更多
http://hooopo.iteye.com/blog/993538

用imagemagick和tesseract-ocr破解简单验证码  补充
不知道怎么回事,我这的机器 直接 sudo apt-get install tesseract 不行

下载gz包安装也没成功




结果是 sudo apt-get install tesseract-ocr


还有安装mini_magick,gem install mini_magick 也不行

后来索性全去rubygems把包都下载下来本地安装的包括依赖包:subexec-0.1.0

还有rtesseract也一样



linux下安装tesseract及配置
http://code.google.com/p/tesseract-ocr/wiki/ReadMe
attention:
Install language data:
Download langugage data file (e.g. 'wget http://tesseract-ocr.googlecode.com/files/eng.traineddata.gz')
Decompress it ('gzip -d eng.traineddata.gz')


分享到:
评论

相关推荐

    Auto-Reservation:基于Tesseract-OCR和ImageMagick的验证码自动识别与自动提交

    利用OCR识别验证码, 解决一次实际问题 (Node.js) 用户故事 (User Story) 最近因为牙齿不舒服, 打算通过网上预约挂号, 到附近医院的口腔科就诊. 打开网页注册帐号, 来到预约页面, 预约流程如下: 确定医生和时间段, ...

    验证码识别(java与python解决方案)

    Java中也有类似的库,如`Java Advanced Imaging (JAI)`和`ImageMagick`进行图像处理,`Tess4J`作为Tesseract OCR的Java接口。Java的验证码识别流程基本与Python相同,主要区别在于使用的库和API。 1. **读取和...

    用Shell 识别 http://www.programfan.com/ 验证码

    而“工具”标签则暗示了可能涉及到了一些外部工具的使用,如curl、wget、OpenCV、ImageMagick和Tesseract。 在提供的文件列表中,只有一个名为“bmp”的条目,这可能是指验证码图片的格式。BMP是一种常见的位图图像...

    PHP实现验证码自动识别

    验证码自动识别是一个常见的任务,尤其在自动化测试和爬虫领域中。PHP作为一款广泛应用的服务器端脚本语言,可以通过各种技术手段实现验证码的解析。在这个测试案例中,我们将探讨如何用PHP来实现实现验证码自动识别...

    ValidPic.rar_vb 验证码_vb验证码_vb验证码识别_数字识别_验证码识别

    VB可以通过调用Tesseract OCR等开源库,或者使用第三方API如Google的Vision API来进行识别。 5. 错误修正:由于验证码图像的变形和噪声,识别结果可能会有误。因此,需要一些错误纠正策略,如模板匹配、统计分析或...

    autoit验证码识别

    总的来说,AutoIt验证码识别是一个融合了图像处理、模式识别、OCR技术和自动化控制的综合问题,需要一定的编程和算法知识来解决。通过对相关库和工具的掌握,我们可以构建高效且准确的验证码识别解决方案。

Global site tag (gtag.js) - Google Analytics