前段时间做网络爬虫需要用到图片解析功能,个人从网络苦心搜索研究了一下,由此产生了以下的文档,博客一下,给有同样需要的人分享,呵呵
一、 开发环境配置
l 开发环境: jdk6.0
l 硬件环境: Windows XP 32bit
l 开发工具: eclipse3.4
l 开发用到外部 java 组件包: Asprise OCR v4.0 for Java
下载 Asprise OCR v4.0 for Java 到 http://asprise.com/product/ocr/download.php?lang=java
l 破解 Asprise OCR v4.0 for Java 工具: CloseWin.exe
(破解 Asprise OCR v4.0 for Java 的原因:由于利用 Asprise OCR v4.0 for Java 进行开发时,总是弹出提示购买的窗口,只有当点击该窗口后才会得到图片的解析结果,所以破解工具的作用就是实现销毁这个窗口,从而实现利用 Asprise OCR v4.0 for Java 进行图片的批量解析)
破解工具是C++写的工程源码等我已经上传了,有需要的下载了,得给点辛苦分哦,呵呵
l 配置 Asprise OCR v4.0 for Java
解压 Asprise-OCR-Java-Windows_XP_32bit-4.0.rar ,到解压后的文件内把 AspriseOCR.dll 、 DevIL.dll 、 ILU.dll 这三个 dll 库文件放到 windows/system32 ,开发中会用到开发用到 aspriseOCR.jar 组件
下面
二、代码开发
1 、流程如下:
2 、详细代码如下:
l 图片下载类
package net.crawler.common;
/**
* 本程序的功能实现网络下载
* 把指定 url 的文件下载到本地硬盘
*
*/
import java.io.*;
import java.net.*;
/**
* @todo 将网上获取的图像 ,mp3 等文件存储到本地
*
* @version 1.0
*/
public class DownLoadWithUrl {
public static File downLoadFile(String fromUrl) {
URL url;
File file = null;
try {
// url = new
// URL("http://count.koubei.com/showphone/showphone.php?f=jpg&w=96&h=10&bc=255,255,255&fc=0,0,0&fs=10&fn=arial&phone=NzMwNzIyNTE1%236aWCXtTNZYkxASrj");
url = new URL(fromUrl);
URLConnection uc = url.openConnection();
InputStream is = uc.getInputStream();
// 根据下载文件类型的不同,进行相应的文件命名
file = new File("D:\\showphone.jpg");
FileOutputStream out = new FileOutputStream(file);
/*
* 该注释内的也是一种写入文件的方法,不过通常下载 mp3 或者比 mp3 更小图片
* 等这些文件用这种带缓冲的方法写文件比较慢,所以说小文件下载通常用下面 的写文件方法就可以了 // byte[] b = new
* byte[102400*3]; // int size = 0; // // while ((size = is.read(b)) !=
* -1) { // out.write(b, 1, size); // // }
*/
int i = 0;
while ((i = is.read()) != -1) {
out.write(i);
}
out.flush();
is.close();
} catch (Exception e) {
System.out.println(" 图片下载或存盘失败! ");
}
return file;
}
/**
* 删除本地磁盘指定路径的文件 create date:2009-5-13 author:Administrator
*
* @param file
*/
public static void delFile(File file) {
if (file.exists())
file.delete();
}
public static void main(String[] args) {
// delFile("D:\\forever.mp3");
downLoadFile("http://count.koubei.com/showphone/showphone.php?f=jpg&w=96&h=10&bc=255,255,255&fc=0,0,0&fs=10&fn=arial&phone=NzMwNzIyNTE1%236aWCXtTNZYkxASrj");
}
}
l 图片文字解析类
package net.crawler.common;
/**
* 本程序实现了图片文字解析 ( 识别图片中的文字信息)
*/
import java.awt.image.BufferedImage;
import java.io.File;
import java.io.IOException;
import javax.imageio.ImageIO;
import com.asprise.util.ocr.OCR;
public class ParseJPEG_withOCR {
public static void main(String[] args) {
}
/**
* 返回图片文字的识别结果 create date:2009-5-22 author:Administrator
*
* @param imageFile
* @return
*/
public static String getRecogniseStr(File imageFile) {
String s = "";
try {
BufferedImage image = ImageIO.read(imageFile);
int width = image.getTileWidth();
int height = image.getTileHeight();
image = image.getSubimage(0, 0, width, height);
s = new OCR().recognizeEverything(image);
} catch (IOException e) {
e.printStackTrace();
System.out.println(" 图片识别失败! ");
}
return s;
}
}
l 网络图片解析类
package net.crawler.common;
/**
* 本程序实现功能:给出一个图片的具体网络地址,把该图片的进行解析,解析后把图片内容以字符串形式进行返回
*/
import java.io.File;
public class RecognisePicture {
/**
* create date:2009- 5- 22 author:Administrator
*
* @param args
*/
public static void main(String[] args) {
// TODO Auto-generated method stub
recognise ( "http://count.koubei.com/showphone/showphone.php?f=jpg&w=96&h=10&bc=255,255,255&fc=0,0,0&fs=10&fn=arial&phone=NzMwNzIyNTE1%236aWCXtTNZYkxASrj" );
}
/**
* 解析指定网络地址的图片信息 create date:2009- 5- 22 author:Administrator
*
* @param fromUrl
* @return
*/
public static String recognise(String fromUrl) {
String result = "" ;
// 下载图片文件到本地磁盘
File file = DownLoadWithUrl.downLoadFile (fromUrl);
if (file != null ) {
// 解析下载到本地磁盘文件
result = ParseJPEG_withOCR.getRecogniseStr (file);
// 删除下载到本地磁盘的文件
DownLoadWithUrl.delFile (file);
}
return result;
}
}
本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/xumiaohua/archive/2009/06/25/4297140.aspx
分享到:
相关推荐
坛子里有破解版的Asprise-OCR-Java,其原理就是利用开启CloseWin.exe窗口扫描有没有Asprise弹出过期的窗口,更具信息框的标题栏来判断是否要关闭此信息窗口。2011年7月以后的使用版无论是点击确定还是关闭按钮,都要...
AspriseOCR 4.0破解dll是由VC编写,所以引用需要用代码来实现,代码如下: [DllImport(@"F:\ocr\OCR\OCR 图片识别\AspriseOCR 4.0破解dll\AspriseOCR.dll", EntryPoint = "OCR", CallingConvention = ...
asprise ocr 识别破解版,使用官方实例,内部包含源码,aocr_x64.dll等,破解弹窗问题
AspriseOCR图片文字识别 破解版
数字图片识别 Asprise-OCR-Java 破解版 Eclipse工程 开发实例代码
数字图片识别 Asprise-OCR-Java 破解版 批量识别
AspriseOCR套C本机库,可以进行图像中的文字(英文字母和数字)及条形码识别。此版本为破解版。
人工神经网络算法的OCR识别,这是最新破解版。附上函数说明。 [DllImport("AspriseOCR.dll", EntryPoint = "OCR")] public static extern IntPtr OCR(string file, int type); [DllImport("AspriseOCR.dll", ...
上个月传了一个5.01的版本,但只...http://cdn.asprise.com/ocr/files/downloads/15/asprise-ocr-csharp-vb.net-15.3-trail.zip ----------- 另,因为我在项目中只是去进行验证码的识别,其它有什么问题我没做测试。
C# Asprise OCR 15.3之64位最新破解(1.去弹窗 2.去100单词限制 3.去过试用期限制),采用IDA破解,希望可以帮到大家
在JAVA_OCR小工具的案例中,开发者可能已经封装了Asprise OCR的使用,简化了与OCR相关的代码,使得最终用户只需要通过简单的接口就能实现文字识别功能。例如,可能有一个`recognizeText`方法,接收图像文件路径作为...
之前一个朋友在csdn上传了64位java版的破解版,但是还存在弹框问题。我这里把弹框解决了。仅提供关键的dll,另外两个dll和jar去官网下。
使用方法: ...4.CloseWin.exe是销毁本sdk调用dll是弹出的Asprise购买提示,在进行批量识别图片时把CloseWin.exe同时运行就好了,这样就解除了弹出购买窗口这个问题 5.文件夹closeWin内C++工程源码
Highest Level of Accuracy - Asprise OCR can easily recognize difficult documents of poor image quality; Excellent Format Retention - Text layouts on the input documents are preserved; High Speed - ...
**MODI及人工神经网络算法AspriseOCR的OCR解析** OCR(Optical Character Recognition,光学字符识别)技术是一种用于将图像中的打印或手写文本转换为机器编码文本的技术。在IT行业中,OCR广泛应用于文档自动化处理...
C# Asprise OCR 15.3之64位最新破解(1.去弹窗 2.去100单词限制 3.去过试用期限制),采用IDA破解,希望可以帮到大家
AspriseOCR 4 完美破解 识别验证码 经过测试可以用 char * OCR ( char* imagePath, int imageFileType)
AspriseOCR_crack 4.0.3 真正破解版
Asprise OCR Java 15.3.1是一个用于验证码识别的框架,专为Java开发者设计。这个框架的主要功能是处理图像识别,特别是针对验证码的自动识别。OCR(Optical Character Recognition,光学字符识别)技术是一种将扫描...
这个“AspriseOCR图片识别参考Demo”提供了使用AspriseOCR进行图片文字识别的基本示例,对于初学者或者希望在项目中应用OCR技术的人来说非常有用。 AspriseOCR的核心功能包括: 1. **文字识别**:能够从图像中精确...