`

java验证码识别--1 收藏

阅读更多

(本文仅用于学习研究图像匹配识别原理,不得用于其他用途。

 

最近看了看验证码的识别,先从最简单的做起吧(固定大小,固定位置,固定字体)

验证码识别基本分四步,图片预处理,分割,训练,识别

看一个最简单验证码

 

这是一个德克萨斯扑克的注册页面的验证码

1。图像的预处理

这种直接根据亮度设个阈值处理就可以了

view plaincopy to clipboardprint?
public static int isWhite(int colorInt) {  
        Color color = new Color(colorInt);  
        if (color.getRed() + color.getGreen() + color.getBlue() > 100) {  
            return 1;  
        }  
        return 0;  
    }  
 
    public static BufferedImage removeBackgroud(String picFile)  
            throws Exception {  
        BufferedImage img = ImageIO.read(new File(picFile));  
        int width = img.getWidth();  
        int height = img.getHeight();  
        for (int x = 0; x < width; ++x) {  
            for (int y = 0; y < height; ++y) {  
                if (isWhite(img.getRGB(x, y)) == 1) {  
                    img.setRGB(x, y, Color.WHITE.getRGB());  
                } else {  
                    img.setRGB(x, y, Color.BLACK.getRGB());  
                }  
            }  
        }  
        return img;  
    } 
public static int isWhite(int colorInt) {
  Color color = new Color(colorInt);
  if (color.getRed() + color.getGreen() + color.getBlue() > 100) {
   return 1;
  }
  return 0;
 }

 public static BufferedImage removeBackgroud(String picFile)
   throws Exception {
  BufferedImage img = ImageIO.read(new File(picFile));
  int width = img.getWidth();
  int height = img.getHeight();
  for (int x = 0; x < width; ++x) {
   for (int y = 0; y < height; ++y) {
    if (isWhite(img.getRGB(x, y)) == 1) {
     img.setRGB(x, y, Color.WHITE.getRGB());
    } else {
     img.setRGB(x, y, Color.BLACK.getRGB());
    }
   }
  }
  return img;
 }

处理完图片效果为

 

图像基本分得比较清楚,图片分割也比较容易

2。分割

这个验证码居然是固定位置的,分割相当简单,直接截取相应位置就可以了

view plaincopy to clipboardprint?
public static List<BufferedImage> splitImage(BufferedImage img)  
            throws Exception {  
        List<BufferedImage> subImgs = new ArrayList<BufferedImage>();  
        subImgs.add(img.getSubimage(10, 6, 8, 10));  
        subImgs.add(img.getSubimage(19, 6, 8, 10));  
        subImgs.add(img.getSubimage(28, 6, 8, 10));  
        subImgs.add(img.getSubimage(37, 6, 8, 10));  
        return subImgs;  
    } 
public static List<BufferedImage> splitImage(BufferedImage img)
   throws Exception {
  List<BufferedImage> subImgs = new ArrayList<BufferedImage>();
  subImgs.add(img.getSubimage(10, 6, 8, 10));
  subImgs.add(img.getSubimage(19, 6, 8, 10));
  subImgs.add(img.getSubimage(28, 6, 8, 10));
  subImgs.add(img.getSubimage(37, 6, 8, 10));
  return subImgs;
 }

3。训练

直接拿几张图片,包含0-9,每个数字一个样本就可以了,将文件名对应相应的数字

 

4。识别

因为是固定大小,固定位置,识别也很简单。

直接拿分割的图片跟这个十个图片一个像素一个像素的比,相同的点最多的就是结果。比如如果跟5.jpg最相似,那么识别的结果就是5。

下面是识别结果,很容易达到100%

 

完整代码(csdn连个附件都不支持):

view plaincopy to clipboardprint?
import java.awt.Color;  
import java.awt.image.BufferedImage;  
import java.io.File;  
import java.io.FileOutputStream;  
import java.io.InputStream;  
import java.io.OutputStream;  
import java.util.ArrayList;  
import java.util.HashMap;  
import java.util.List;  
import java.util.Map;  
 
import javax.imageio.ImageIO;  
 
import org.apache.commons.httpclient.HttpClient;  
import org.apache.commons.httpclient.HttpStatus;  
import org.apache.commons.httpclient.methods.GetMethod;  
import org.apache.commons.io.IOUtils;  
 
public class ImagePreProcess {  
 
    public static int isWhite(int colorInt) {  
        Color color = new Color(colorInt);  
        if (color.getRed() + color.getGreen() + color.getBlue() > 100) {  
            return 1;  
        }  
        return 0;  
    }  
 
    public static int isBlack(int colorInt) {  
        Color color = new Color(colorInt);  
        if (color.getRed() + color.getGreen() + color.getBlue() <= 100) {  
            return 1;  
        }  
        return 0;  
    }  
 
    public static BufferedImage removeBackgroud(String picFile)  
            throws Exception {  
        BufferedImage img = ImageIO.read(new File(picFile));  
        int width = img.getWidth();  
        int height = img.getHeight();  
        for (int x = 0; x < width; ++x) {  
            for (int y = 0; y < height; ++y) {  
                if (isWhite(img.getRGB(x, y)) == 1) {  
                    img.setRGB(x, y, Color.WHITE.getRGB());  
                } else {  
                    img.setRGB(x, y, Color.BLACK.getRGB());  
                }  
            }  
        }  
        return img;  
    }  
 
    public static List<BufferedImage> splitImage(BufferedImage img)  
            throws Exception {  
        List<BufferedImage> subImgs = new ArrayList<BufferedImage>();  
        subImgs.add(img.getSubimage(10, 6, 8, 10));  
        subImgs.add(img.getSubimage(19, 6, 8, 10));  
        subImgs.add(img.getSubimage(28, 6, 8, 10));  
        subImgs.add(img.getSubimage(37, 6, 8, 10));  
        return subImgs;  
    }  
 
    public static Map<BufferedImage, String> loadTrainData() throws Exception {  
        Map<BufferedImage, String> map = new HashMap<BufferedImage, String>();  
        File dir = new File("train");  
        File[] files = dir.listFiles();  
        for (File file : files) {  
            map.put(ImageIO.read(file), file.getName().charAt(0) + "");  
        }  
        return map;  
    }  
 
    public static String getSingleCharOcr(BufferedImage img,  
            Map<BufferedImage, String> map) {  
        String result = "";  
        int width = img.getWidth();  
        int height = img.getHeight();  
        int min = width * height;  
        for (BufferedImage bi : map.keySet()) {  
            int count = 0;  
            Label1: for (int x = 0; x < width; ++x) {  
                for (int y = 0; y < height; ++y) {  
                    if (isWhite(img.getRGB(x, y)) != isWhite(bi.getRGB(x, y))) {  
                        count++;  
                        if (count >= min)  
                            break Label1;  
                    }  
                }  
            }  
            if (count < min) {  
                min = count;  
                result = map.get(bi);  
            }  
        }  
        return result;  
    }  
 
    public static String getAllOcr(String file) throws Exception {  
        BufferedImage img = removeBackgroud(file);  
        List<BufferedImage> listImg = splitImage(img);  
        Map<BufferedImage, String> map = loadTrainData();  
        String result = "";  
        for (BufferedImage bi : listImg) {  
            result += getSingleCharOcr(bi, map);  
        }  
        ImageIO.write(img, "JPG", new File("result\\"+result+".jpg"));  
        return result;  
    }  
 
    public static void downloadImage() {  
        HttpClient httpClient = new HttpClient();  
        GetMethod getMethod = new GetMethod(  
                "http://www.puke888.com/authimg.php");  
        for (int i = 0; i < 30; i++) {  
            try {  
                // 执行getMethod  
                int statusCode = httpClient.executeMethod(getMethod);  
                if (statusCode != HttpStatus.SC_OK) {  
                    System.err.println("Method failed: " 
                            + getMethod.getStatusLine());  
                }  
                // 读取内容  
                String picName = "img\\" + i + ".jpg";  
                InputStream inputStream = getMethod.getResponseBodyAsStream();  
                OutputStream outStream = new FileOutputStream(picName);  
                IOUtils.copy(inputStream, outStream);  
                outStream.close();  
                System.out.println("OK!");  
            } catch (Exception e) {  
                e.printStackTrace();  
            } finally {  
                // 释放连接  
                getMethod.releaseConnection();  
            }  
        }  
    }  
 
    /** 
     * @param args 
     * @throws Exception 
     */ 
    public static void main(String[] args) throws Exception {  
        for (int i = 0; i < 30; ++i) {  
            String text = getAllOcr("img\\" + i + ".jpg");  
            System.out.println(i + ".jpg = " + text);  
        }  
    }  

 

本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/problc/archive/2010/08/07/5794460.aspx

 

 

 

个人签名

-------------------------------------

 

图盾 淘宝保护 保护图片 图片防盗 

 

分享到:
评论

相关推荐

    java-验证码识别-验证码破解

    在这个“java-验证码识别-验证码破解”的主题中,我们将深入探讨如何使用Java进行验证码识别,特别是通过Tess4J库进行OCR(光学字符识别)。 验证码的主要目的是防止自动化的恶意行为,如机器人攻击或垃圾邮件发送...

    java验证码识别

    Java验证码识别技术主要涉及到图像处理和光学字符识别(OCR)两个关键领域,是自动化系统中用于防止机器人自动操作的一种安全机制。在这个Java项目中,我们看到的文件名可能与训练模型、输入图像和识别结果有关。...

    Java简单验证码识别(附源码)

    总的来说,Java验证码识别不仅加深了对图像处理和模式识别的理解,也为后续学习更高级的机器学习和深度学习技术打下了基础。通过实践这个项目,你可以掌握实际问题的解决思路,提高编程能力,并且能够灵活运用所学...

    java 验证码识别源程序

    这个Java验证码识别源程序针对的是Windows操作系统,并且据描述声称其识别准确率超过90%,这意味着它具有较高的实用价值。接下来,我们将深入探讨验证码识别的基本原理、相关技术以及如何在Java中实现。 验证码...

    java验证码识别源码

    在本Java验证码识别源码中,我们将会探讨如何利用编程技术来识别和解析这些图形验证码。 首先,验证码识别通常涉及图像处理和机器学习两大部分。图像处理用于预处理图片,提取特征;机器学习则用于训练模型,识别...

    java-yanzhengma.zip_java验证码识别_验证码 java_验证码识别

    Java验证码识别涉及到图像处理、模式识别和机器学习等多个领域的技术。 1. 图像预处理:在识别验证码前,通常需要对原始图像进行预处理,包括灰度化、二值化、去噪、平滑等步骤。灰度化将彩色图像转换为单色,二值...

    java 验证码识别 OCR

    java 验证码识别 OCR。

    java 开源 验证码识别

    本文将深入探讨“java 开源 验证码识别”这一主题,结合描述中的“增加了细化算法”、“增加了注释”和“界面稍微变了变”,我们将关注验证码识别的算法优化、代码可读性和用户界面改进这三个方面。 首先,验证码...

    12306登录图形验证码识别-基于深度学习

    1. 12306登录验证码识别基于深度学习; 2. 解压send.rar后在里面的bin目录下找到client.exe,并打开 3. 在client界面中点击选择图片中,选择send文件夹中Images中的图片,点击client界面的send按钮后,程序就会把...

    Java验证码识别的例子

    这个Java验证码识别的例子提供了一个实战教程,让我们深入了解验证码识别的原理与实现方法。 验证码(CAPTCHA)的主要目的是防止自动化的机器人程序对网站进行恶意操作,例如批量注册、刷票等。而验证码识别技术则...

    JAVA智能验证码识别,可训练识别率高

    验证码识别技术在现代网络安全中扮演着重要角色,用于防止恶意自动化程序的入侵。JAVA作为一款广泛应用的...开发者需要根据实际应用场景,灵活运用这些技术和策略,以构建出适应性强、识别率高的JAVA验证码识别系统。

    Java 验证码识别引擎

    国内第一个绝对高识别率,高效率的Java 验证码识别引擎,推荐使用于自动发贴机、数据采集系统的图片验证码自动识别场合!使用方法:下载解压后,导入Eclipse或MyEclipse中,然后在c:盘下放置一张验证码图片(如:...

    一个纯java的验证码识别算法

    本文将探讨一个基于Java实现的验证码识别算法,通过提供的标签“源码”和“工具”,我们可以推测这是一个开源项目,旨在帮助开发者理解验证码识别的原理并应用于实际项目。 验证码识别通常涉及图像处理、模式识别和...

    图片验证码识别JAVA源码

    在这个“图片验证码识别JAVA源码”中,我们探讨的是如何使用Java编程语言来实现对图片验证码的自动识别。这种技术通常涉及图像处理、模式识别以及机器学习算法。 首先,我们要理解验证码识别的基本流程: 1. **...

    联众识别-JAVA-HTTP-实例.rar

    在IT行业中,联众识别是一种常见的验证码识别技术,主要用于自动化处理网页或应用中的图像验证码。在本案例中,我们关注的是使用JAVA编程语言通过HTTP协议实现联众打码的实例。这个压缩包文件"联众识别-JAVA-HTTP-...

    基于Java的简单图形验证码识别

    本项目专注于使用Java语言实现一个简单的图形验证码识别系统。通过理解并解析提供的代码,我们可以深入探讨其中涉及的关键技术和知识点。 首先,图形验证码的核心是图像处理。在Java中,我们通常使用Java Advanced ...

    java识别图片验证码的2种方式

    包含5个识别图片验证码的类,分别对应不同5种不同的验证码 其中用了两种不同的实现方式(截取采样像素比对+Tesseract-OCR识别) 附带一个图像指纹类(判定图片相似度)和一个寻找联通线的类(八皇后算法实现)

    java简单图形验证码识别样例

    在本示例中,我们将探讨如何使用Java实现一个简单的图形验证码识别系统。 首先,图形验证码的基本原理是生成一张包含随机字符的图片,用户需要正确输入图片中的字符才能通过验证。这个过程涉及图像处理和机器学习...

    Java使用OCR技术识别验证码实现自动化登陆方法

    在本篇文章里小编给大家分享的是关于Java 如何使用 OCR 技术识别验证码实现自动化登陆的相关知识点内容,需要的朋友们学习下。

Global site tag (gtag.js) - Google Analytics