- 浏览: 19103 次
最新评论
package com.ocr; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import java.util.Iterator; import java.util.Locale; import javax.imageio.IIOImage; import javax.imageio.ImageIO; import javax.imageio.ImageReader; import javax.imageio.ImageWriteParam; import javax.imageio.ImageWriter; import javax.imageio.metadata.IIOMetadata; import javax.imageio.stream.ImageInputStream; import javax.imageio.stream.ImageOutputStream; import com.sun.media.imageio.plugins.tiff.TIFFImageWriteParam; public class ImageIOHelper { /** * 图片文件转换为tif格式 * @param imageFile 文件路径 * @param imageFormat 文件扩展名 * @return */ public static File createImage(File imageFile, String imageFormat) { File tempFile = null; try { Iterator<ImageReader> readers = ImageIO.getImageReadersByFormatName(imageFormat); ImageReader reader = readers.next(); ImageInputStream iis = ImageIO.createImageInputStream(imageFile); reader.setInput(iis); //Read the stream metadata IIOMetadata streamMetadata = reader.getStreamMetadata(); //Set up the writeParam TIFFImageWriteParam tiffWriteParam = new TIFFImageWriteParam(Locale.CHINESE); tiffWriteParam.setCompressionMode(ImageWriteParam.MODE_DISABLED); //Get tif writer and set output to file Iterator<ImageWriter> writers = ImageIO.getImageWritersByFormatName("tiff"); ImageWriter writer = writers.next(); BufferedImage bi = reader.read(0); IIOImage image = new IIOImage(bi,null,reader.getImageMetadata(0)); tempFile = tempImageFile(imageFile); ImageOutputStream ios = ImageIO.createImageOutputStream(tempFile); writer.setOutput(ios); writer.write(streamMetadata, image, tiffWriteParam); ios.close(); writer.dispose(); reader.dispose(); } catch (IOException e) { e.printStackTrace(); } return tempFile; } private static File tempImageFile(File imageFile) { String path = imageFile.getPath(); StringBuffer strB = new StringBuffer(path); strB.insert(path.lastIndexOf('.'),0); return new File(strB.toString().replaceFirst("(?<=\\.)(\\w+)$", "tif")); } }
package com.ocr; import java.io.BufferedReader; import java.io.File; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.List; import org.jdesktop.swingx.util.OS; public class OCR { private final String LANG_OPTION = "-l"; //英文字母小写l,并非数字1 private final String EOL = System.getProperty("line.separator"); private String tessPath = "D:\\Program Files\\Tesseract-OCR"; // private String tessPath = new File("tesseract").getAbsolutePath(); public String recognizeText(File imageFile,String imageFormat)throws Exception{ File tempImage = ImageIOHelper.createImage(imageFile,imageFormat); File outputFile = new File(imageFile.getParentFile(),"output"); StringBuffer strB = new StringBuffer(); List<String> cmd = new ArrayList<String>(); if(OS.isWindowsXP()){ cmd.add(tessPath+"\\tesseract"); }else if(OS.isLinux()){ cmd.add("tesseract"); }else{ cmd.add(tessPath+"\\tesseract"); } cmd.add(""); cmd.add(outputFile.getName()); cmd.add(LANG_OPTION); // cmd.add("chi_sim"); cmd.add("eng"); ProcessBuilder pb = new ProcessBuilder(); pb.directory(imageFile.getParentFile()); cmd.set(1, tempImage.getName()); pb.command(cmd); pb.redirectErrorStream(true); Process process = pb.start(); //tesseract.exe 1.jpg 1 -l chi_sim int w = process.waitFor(); //删除临时正在工作文件 tempImage.delete(); if(w==0){ BufferedReader in = new BufferedReader(new InputStreamReader(new FileInputStream(outputFile.getAbsolutePath()+".txt"),"UTF-8")); String str; while((str = in.readLine())!=null){ strB.append(str).append(EOL); } in.close(); }else{ String msg; switch(w){ case 1: msg = "Errors accessing files.There may be spaces in your image's filename."; break; case 29: msg = "Cannot recongnize the image or its selected region."; break; case 31: msg = "Unsupported image format."; break; default: msg = "Errors occurred."; } tempImage.delete(); throw new RuntimeException(msg); } new File(outputFile.getAbsolutePath()+".txt").delete(); return strB.toString(); } }
package com.ocr; import java.io.File; import java.io.IOException; public class Test { //Tesseract get4.jpg a /** * @param args */ public static void main(String[] args) { String path = "D:\\get2.jpg"; try { String valCode = new OCR().recognizeText(new File(path), "jpg"); System.out.println(valCode); } catch (IOException e) { e.printStackTrace(); } catch (Exception e) { e.printStackTrace(); } } }
需要安装Tesseract-OCR,从google上面下载
导入jai_imageio-1.1-alpha.jar,swingx-1.0.jar
http://www.findjar.com/index.x 可以从这上面下载 ,
发表评论
-
简单的对 linux服务器服务检查的java程序
2012-08-01 14:13 1098package com.Linux; import java ... -
sikuli
2012-08-01 14:02 1161package com.test; import org.s ... -
Linux 安装mongodb
2012-07-19 09:55 7751)、下载MongoDB http://fastdl.mong ... -
java连接linux
2012-07-17 16:53 1093import java.io.IOException; im ... -
jsoup很好很强大 对html解析{待续正在学}
2012-07-16 14:12 1001http://www.open-open.com/jsoup/ ... -
java 对Html的操作
2012-07-16 13:18 938import java.util.regex.Matcher; ... -
mongodb增删查改
2012-07-10 16:21 788Java代码 收藏代码 import java.n ...
相关推荐
本文将深入探讨“易语言识别简单验证码源码”这一主题,旨在帮助初学者理解验证码识别的基本原理,并了解如何在易语言环境下实现这一功能。 验证码,全称“全自动区分计算机和人类的图灵测试”,是一种防止恶意自动...
对于简单的验证码,可以手动创建字符模板进行匹配;对于更复杂的验证码,可能需要用到神经网络,如卷积神经网络(CNN)。在VB中,可以利用第三方库(如 Accord.NET)实现机器学习算法。 5. 后处理与验证:识别出的...
在本教程中,我们将探讨如何使用按键精灵来识别并输入屏幕上的数字验证码。 首先,我们需要理解按键精灵的基本操作。按键精灵提供了一个图形化的用户界面(GUI),用户可以通过录制功能记录下所需的操作,如点击、...
PHP可以通过分析验证码图片的像素信息来尝试识别字符,但这对简单验证码可能有效,对于复杂验证码则需要结合外部服务,如Google的Tesseract OCR引擎,或者使用PHP的机器学习扩展(如PHP-ML)来训练和应用分类器。...
对于简单的验证码,可以建立字符模板库,使用模板匹配;对于更复杂的验证码,可能需要借助深度学习进行端到端的训练。 在这个项目中,"ImageRexonfig"可能是一个用于处理图像的自定义类,它可能包含了上述步骤的...
本文介绍了一种验证码识别系统的实现,该系统不仅能够处理简单的验证码,还能有效地识别带有噪声的复杂验证码。 #### 二、系统设计与实现 ##### 2.1 系统架构 验证码识别系统主要包括以下几个关键模块: 1. **...
易语言简单验证码识别源码,简单验证码识别,计算验证码,判断一下,判断相差值
对于简单的验证码,可能只需要建立一个字符模板库,然后对每个字符进行比较,找出最接近的模板。对于更复杂的验证码,可能需要训练一个神经网络模型来进行识别。 ### 4. 实际应用 识别验证码的能力在自动化测试、...
要实现C#识别简单的验证码,首先需要了解验证码的基本构成和识别过程: 1. 图像处理:验证码通常是一个包含扭曲、噪声和干扰的图像,其中嵌入了随机生成的字符。在识别验证码前,我们需要对图像进行预处理,如灰度...
识别程序使用delphi语言编写,以dll的方式提供使用,通过简单的函数调用即可识别复杂的验证码图片。 自动识别各种验证码 自动识别; 智能处理各种背景、边框、干扰等; 识别率可达100%(指不太复杂的验证码);本...
在本例中,"简单验证码识别"可能是指这个项目专注于识别结构简单、字符较少的验证码。因此,可能采用的方法会相对简单,例如使用基本的图像处理技巧和模板匹配进行识别,而不是依赖深度学习模型。 在开发过程中,...
这里,按键精灵可能结合了模板匹配或简单的形状特征识别。模板匹配是通过预先收集的字符样本与处理后的字符进行比对,寻找最相似的匹配。然而,这种方法对样本库的质量和多样性要求较高,对于变形、扭曲的验证码效果...
这个压缩包包含了一系列验证码图片(1.png, 2.png, 3.png, 4.png),很可能是为了展示验证码识别的不同难度级别,以及如何用Python和MATLAB进行图像处理和文字识别。 首先,我们来看验证码识别的基本过程。它通常...
验证码自动识别技术是一种在计算机视觉领域中用于防止恶意自动化程序的重要手段,而C#作为.NET框架下的编程语言,提供了丰富的库和工具来实现这一功能。本项目“c#源码自动识别验证码.rar”是一个基于Winform的应用...
"提交.zip"则可能是整个验证码识别系统的整合,包括了输入图像的处理、字符识别和结果的校验与提交。这个版本可能会包含一个完整的PHP验证码识别脚本,能够处理用户提交的验证码图像,并返回识别结果。 请注意,...
Visual Basic(VB)是一种常用的编程语言,它可以帮助开发者实现简单的验证码识别功能。本篇文章将深入探讨如何使用VB来创建一个简单的验证码识别系统。 首先,验证码识别通常涉及到图像处理和模式识别技术。在VB中...
本文将深入探讨如何使用C#语言来识别简单的验证码,这对于初学者来说是一个很好的起点。我们将讲解验证码识别的基本概念,C#中的图像处理库,以及实现验证码识别的具体步骤。 验证码(CAPTCHA)是一种用于防止恶意...
本教程将引导你入门BMP图片的验证码识别,通过ReadBMP.zip中的资源,你可以了解到如何处理和分析图像数据,以及如何构建简单的识别算法。 首先,我们需要理解BMP(Bitmap)格式,这是一种无损的位图图像格式,它...
"yzmsb.rar"这个压缩包文件可能包含了一个简单的验证码识别系统或者相关的代码示例,帮助开发者自建验证码识别库。以下是对这个主题的详细说明: 验证码(CAPTCHA)全称是“Completely Automated Public Turing ...
captcha-killer-modified 是一个基于 captcha-killer 的 Burp 插件,用于识别和破解验证码。captcha-killer-modified 插件可以与 Burp Suite 结合使用,实现验证码的自动识别和暴破。 captcha-killer-modified ...