- 浏览: 489388 次
- 性别:
- 来自: 武汉
-
最新评论
-
zyzyzy123:
请问有工程吗,我现在正在实现打电话的功能,但是一直不通,怀疑是 ...
实用的java 串口通信程序 -
wuhaitong:
引用[img][/img][*][url][/url] ...
jbpm -
迷糊_le:
maven命令, 蛮好的,谢谢
maven eclipse -
Wuaner:
不错的文章 , 谢谢分享!
Hadoop -
yuqihengsheng:
strong 很细
HighLighter
AspriseOCR破解用Java实现网络图片解析
关键字: java, 图片解析
前段时间做网络爬虫需要用到图片解析功能,个人从网络苦心搜索研究了一下,由此产生了以下的文档,博客一下,给有同样需要的人分享,呵呵
一、 开发环境配置
l 开发环境: jdk6.0
l 硬件环境: Windows XP 32bit
l 开发工具: eclipse3.4
l 开发用到外部 java 组件包: Asprise OCR v4.0 for Java
下载 Asprise OCR v4.0 for Java 到 http://asprise.com/product/ocr/download.php?lang=java
l 破解 Asprise OCR v4.0 for Java 工具: CloseWin.exe
(破解 Asprise OCR v4.0 for Java 的原因:由于利用 Asprise OCR v4.0 for Java 进行开发时,总是弹出提示购买的窗口,只有当点击该窗口后才会得到图片的解析结果,所以破解工具的作用就是实现销毁这个窗口,从而实现利用 Asprise OCR v4.0 for Java 进行图片的批量解析)
破解工具是C++写的工程源码等我已经上传了,有需要的下载了,得给点辛苦分哦,呵呵
l 配置 Asprise OCR v4.0 for Java
解压 Asprise-OCR-Java-Windows_XP_32bit-4.0.rar ,到解压后的文件内把 AspriseOCR.dll 、 DevIL.dll 、 ILU.dll 这三个 dll 库文件放到 windows/system32 ,开发中会用到开发用到 aspriseOCR.jar 组件
下面
二、代码开发
1 、流程如下:
2 、详细代码如下:
l 图片下载类
package net.crawler.common;
/**
* 本程序的功能实现网络下载
* 把指定 url 的文件下载到本地硬盘
*
*/
import java.io.*;
import java.net.*;
/**
* @todo 将网上获取的图像 ,mp3 等文件存储到本地
*
* @version 1.0
*/
public class DownLoadWithUrl {
public static File downLoadFile(String fromUrl) {
URL url;
File file = null;
try {
// url = new
// URL("http://count.koubei.com/showphone/showphone.php?f=jpg&w=96&h=10&bc=255,255,255&fc=0,0,0&fs=10&fn=arial&phone=NzMwNzIyNTE1%236aWCXtTNZYkxASrj");
url = new URL(fromUrl);
URLConnection uc = url.openConnection();
InputStream is = uc.getInputStream();
// 根据下载文件类型的不同,进行相应的文件命名
file = new File("D:\\showphone.jpg");
FileOutputStream out = new FileOutputStream(file);
/*
* 该注释内的也是一种写入文件的方法,不过通常下载 mp3 或者比 mp3 更小图片
* 等这些文件用这种带缓冲的方法写文件比较慢,所以说小文件下载通常用下面 的写文件方法就可以了 // byte[] b = new
* byte[102400*3]; // int size = 0; // // while ((size = is.read(b)) !=
* -1) { // out.write(b, 1, size); // // }
*/
int i = 0;
while ((i = is.read()) != -1) {
out.write(i);
}
out.flush();
is.close();
} catch (Exception e) {
System.out.println(" 图片下载或存盘失败! ");
}
return file;
}
/**
* 删除本地磁盘指定路径的文件 create date:2009-5-13 author:Administrator
*
* @param file
*/
public static void delFile(File file) {
if (file.exists())
file.delete();
}
public static void main(String[] args) {
// delFile("D:\\forever.mp3");
downLoadFile("http://count.koubei.com/showphone/showphone.php?f=jpg&w=96&h=10&bc=255,255,255&fc=0,0,0&fs=10&fn=arial&phone=NzMwNzIyNTE1%236aWCXtTNZYkxASrj");
}
}
l 图片文字解析类
package net.crawler.common;
/**
* 本程序实现了图片文字解析 ( 识别图片中的文字信息)
*/
import java.awt.image.BufferedImage;
import java.io.File;
import java.io.IOException;
import javax.imageio.ImageIO;
import com.asprise.util.ocr.OCR;
public class ParseJPEG_withOCR {
public static void main(String[] args) {
}
/**
* 返回图片文字的识别结果 create date:2009-5-22 author:Administrator
*
* @param imageFile
* @return
*/
public static String getRecogniseStr(File imageFile) {
String s = "";
try {
BufferedImage image = ImageIO.read(imageFile);
int width = image.getTileWidth();
int height = image.getTileHeight();
image = image.getSubimage(0, 0, width, height);
s = new OCR().recognizeEverything(image);
} catch (IOException e) {
e.printStackTrace();
System.out.println(" 图片识别失败! ");
}
return s;
}
}
l 网络图片解析类
package net.crawler.common;
/**
* 本程序实现功能:给出一个图片的具体网络地址,把该图片的进行解析,解析后把图片内容以字符串形式进行返回
*/
import java.io.File;
public class RecognisePicture {
/**
* create date:2009- 5- 22 author:Administrator
*
* @param args
*/
public static void main(String[] args) {
// TODO Auto-generated method stub
recognise ( "http://count.koubei.com/showphone/showphone.php?f=jpg&w=96&h=10&bc=255,255,255&fc=0,0,0&fs=10&fn=arial&phone=NzMwNzIyNTE1%236aWCXtTNZYkxASrj" );
}
/**
* 解析指定网络地址的图片信息 create date:2009- 5- 22 author:Administrator
*
* @param fromUrl
* @return
*/
public static String recognise(String fromUrl) {
String result = "" ;
// 下载图片文件到本地磁盘
File file = DownLoadWithUrl.downLoadFile (fromUrl);
if (file != null ) {
// 解析下载到本地磁盘文件
result = ParseJPEG_withOCR.getRecogniseStr (file);
// 删除下载到本地磁盘的文件
DownLoadWithUrl.delFile (file);
}
return result;
}
}
一、 开发环境配置
l 开发环境: jdk6.0
l 硬件环境: Windows XP 32bit
l 开发工具: eclipse3.4
l 开发用到外部 java 组件包: Asprise OCR v4.0 for Java
下载 Asprise OCR v4.0 for Java 到 http://asprise.com/product/ocr/download.php?lang=java
l 破解 Asprise OCR v4.0 for Java 工具: CloseWin.exe
(破解 Asprise OCR v4.0 for Java 的原因:由于利用 Asprise OCR v4.0 for Java 进行开发时,总是弹出提示购买的窗口,只有当点击该窗口后才会得到图片的解析结果,所以破解工具的作用就是实现销毁这个窗口,从而实现利用 Asprise OCR v4.0 for Java 进行图片的批量解析)
破解工具是C++写的工程源码等我已经上传了,有需要的下载了,得给点辛苦分哦,呵呵
l 配置 Asprise OCR v4.0 for Java
解压 Asprise-OCR-Java-Windows_XP_32bit-4.0.rar ,到解压后的文件内把 AspriseOCR.dll 、 DevIL.dll 、 ILU.dll 这三个 dll 库文件放到 windows/system32 ,开发中会用到开发用到 aspriseOCR.jar 组件
下面
二、代码开发
1 、流程如下:
2 、详细代码如下:
l 图片下载类
package net.crawler.common;
/**
* 本程序的功能实现网络下载
* 把指定 url 的文件下载到本地硬盘
*
*/
import java.io.*;
import java.net.*;
/**
* @todo 将网上获取的图像 ,mp3 等文件存储到本地
*
* @version 1.0
*/
public class DownLoadWithUrl {
public static File downLoadFile(String fromUrl) {
URL url;
File file = null;
try {
// url = new
// URL("http://count.koubei.com/showphone/showphone.php?f=jpg&w=96&h=10&bc=255,255,255&fc=0,0,0&fs=10&fn=arial&phone=NzMwNzIyNTE1%236aWCXtTNZYkxASrj");
url = new URL(fromUrl);
URLConnection uc = url.openConnection();
InputStream is = uc.getInputStream();
// 根据下载文件类型的不同,进行相应的文件命名
file = new File("D:\\showphone.jpg");
FileOutputStream out = new FileOutputStream(file);
/*
* 该注释内的也是一种写入文件的方法,不过通常下载 mp3 或者比 mp3 更小图片
* 等这些文件用这种带缓冲的方法写文件比较慢,所以说小文件下载通常用下面 的写文件方法就可以了 // byte[] b = new
* byte[102400*3]; // int size = 0; // // while ((size = is.read(b)) !=
* -1) { // out.write(b, 1, size); // // }
*/
int i = 0;
while ((i = is.read()) != -1) {
out.write(i);
}
out.flush();
is.close();
} catch (Exception e) {
System.out.println(" 图片下载或存盘失败! ");
}
return file;
}
/**
* 删除本地磁盘指定路径的文件 create date:2009-5-13 author:Administrator
*
* @param file
*/
public static void delFile(File file) {
if (file.exists())
file.delete();
}
public static void main(String[] args) {
// delFile("D:\\forever.mp3");
downLoadFile("http://count.koubei.com/showphone/showphone.php?f=jpg&w=96&h=10&bc=255,255,255&fc=0,0,0&fs=10&fn=arial&phone=NzMwNzIyNTE1%236aWCXtTNZYkxASrj");
}
}
l 图片文字解析类
package net.crawler.common;
/**
* 本程序实现了图片文字解析 ( 识别图片中的文字信息)
*/
import java.awt.image.BufferedImage;
import java.io.File;
import java.io.IOException;
import javax.imageio.ImageIO;
import com.asprise.util.ocr.OCR;
public class ParseJPEG_withOCR {
public static void main(String[] args) {
}
/**
* 返回图片文字的识别结果 create date:2009-5-22 author:Administrator
*
* @param imageFile
* @return
*/
public static String getRecogniseStr(File imageFile) {
String s = "";
try {
BufferedImage image = ImageIO.read(imageFile);
int width = image.getTileWidth();
int height = image.getTileHeight();
image = image.getSubimage(0, 0, width, height);
s = new OCR().recognizeEverything(image);
} catch (IOException e) {
e.printStackTrace();
System.out.println(" 图片识别失败! ");
}
return s;
}
}
l 网络图片解析类
package net.crawler.common;
/**
* 本程序实现功能:给出一个图片的具体网络地址,把该图片的进行解析,解析后把图片内容以字符串形式进行返回
*/
import java.io.File;
public class RecognisePicture {
/**
* create date:2009- 5- 22 author:Administrator
*
* @param args
*/
public static void main(String[] args) {
// TODO Auto-generated method stub
recognise ( "http://count.koubei.com/showphone/showphone.php?f=jpg&w=96&h=10&bc=255,255,255&fc=0,0,0&fs=10&fn=arial&phone=NzMwNzIyNTE1%236aWCXtTNZYkxASrj" );
}
/**
* 解析指定网络地址的图片信息 create date:2009- 5- 22 author:Administrator
*
* @param fromUrl
* @return
*/
public static String recognise(String fromUrl) {
String result = "" ;
// 下载图片文件到本地磁盘
File file = DownLoadWithUrl.downLoadFile (fromUrl);
if (file != null ) {
// 解析下载到本地磁盘文件
result = ParseJPEG_withOCR.getRecogniseStr (file);
// 删除下载到本地磁盘的文件
DownLoadWithUrl.delFile (file);
}
return result;
}
}
发表评论
-
安装和使用memcached
2014-04-16 16:24 652如何将 memcached 融入到 ... -
applicationContext.xml
2013-08-09 09:05 956<?xml version="1.0&quo ... -
注释驱动的 Spring cache 缓存介绍
2013-08-08 07:04 674概述 Spring 3.1 引入了激动人心的基于注释(an ... -
Spring2.5 Annotations
2013-08-08 06:33 872完成setXxxx功能,即配置文件的 <propert ... -
Spring基于注解的缓存配置--EHCache AND OSCache
2013-08-07 23:21 1044本文将构建一个普通工程来说明spring注解缓存的使用方式, ... -
Ehcache 整合Spring 使用页面、对象缓存
2013-08-07 22:51 907Ehcache 整合Spring 使用页面、对象缓存 ... -
javassist教程和示例
2013-05-18 08:57 2028Javassist是一个执行字节 ... -
ZooKeeper官方文档
2013-05-16 17:09 1570介绍(源自ZooKeeper官方文档) 学习HBase过程 ... -
ZooKeeper -例子
2013-05-16 17:08 1233ZooKeeper ZooKeepe ... -
Spring整合Hessian访问远程服务
2013-05-15 13:44 870Spring整合Hessian访问远程服务 目录 1.1 ... -
redis
2013-05-14 11:44 779redis是一个key-value存储系统。和Memcach ... -
spring 资源访问
2013-05-13 08:26 1020spring在java基础上封装了资源访问,简单易用。 R ... -
ZooKeeper——入门
2013-05-08 16:12 921ZooKeeper——入门 博客分类: ZooK ... -
分布式服务框架 Zookeeper -- 管理分布式环境中的数据(IBM)
2013-05-08 14:07 795安装和配置详解 本文 ... -
分布式协调服务---Zookeeper
2013-05-08 14:05 7861、Zookeeper overview Zookee ... -
Hibernate
2013-03-28 13:04 940一、简述 Hibernate 和 JD ... -
Apache+Tomcat集群配置详解
2013-02-01 10:52 909Apache + Tomcat集群配置详解(1) 一、 ... -
Apache+Jboss集群基于反向代理的负载均衡
2013-02-01 10:40 2519假设三台机器IP分别为172.29.128.100、172. ... -
spring + ibatis 多数据源事务(分布式事务)管理配置方法
2012-12-17 15:18 1288spring + ibatis 多数据源事务(分布式事务 ... -
Hessian序列化不设SerializerFactory性能问题
2012-10-31 09:47 1525Hessian序列化不设SerializerFactor ...
相关推荐
总结,Asprise OCR SDK 4.0为Java开发者提供了强大且易于集成的OCR能力,通过理解其基本原理、API使用和优化策略,可以轻松实现高质量的西文和数字识别功能。在实践中,不断探索和优化,将有助于提升整体项目效率和...
在Java开发中,使用OCR库可以实现自动识别图像中的文字,例如从扫描的文档、图片或者屏幕截图中提取文本。J4L OCR(Java for Leptonica OCR)可能是基于Leptonica,这是一个广泛使用的图像处理库,而j4locr_eval可能...
55links友情链接网址跟踪器,放在桌面,每次直接打开就可以访问55links友情链接交易平台,方便快捷。
AB PLC例程代码项目案例 【备注】 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用!有问题请及时沟通交流。 2、适用人群:计算机相关专业(如计科、信息安全、数据科学与大数据技术、人工智能、通信、物联网、自动化、电子信息等)在校学生、专业老师或者企业员工下载使用。 3、用途:项目具有较高的学习借鉴价值,不仅适用于小白学习入门进阶。也可作为毕设项目、课程设计、大作业、初期项目立项演示等。 4、如果基础还行,或热爱钻研,亦可在此项目代码基础上进行修改添加,实现其他不同功能。 欢迎下载!欢迎交流学习!不清楚的可以私信问我!
moore_01_0909
FIBR English learning
AB PLC例程代码项目案例 【备注】 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用!有问题请及时沟通交流。 2、适用人群:计算机相关专业(如计科、信息安全、数据科学与大数据技术、人工智能、通信、物联网、自动化、电子信息等)在校学生、专业老师或者企业员工下载使用。 3、用途:项目具有较高的学习借鉴价值,不仅适用于小白学习入门进阶。也可作为毕设项目、课程设计、大作业、初期项目立项演示等。 4、如果基础还行,或热爱钻研,亦可在此项目代码基础上进行修改添加,实现其他不同功能。 欢迎下载!欢迎交流学习!不清楚的可以私信问我!
OIF_IEEE802.3_liaison_19OCt09
做网络安全FTP内容的实验必备
nagarajan_01_1107
AB PLC例程代码项目案例 【备注】 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用!有问题请及时沟通交流。 2、适用人群:计算机相关专业(如计科、信息安全、数据科学与大数据技术、人工智能、通信、物联网、自动化、电子信息等)在校学生、专业老师或者企业员工下载使用。 3、用途:项目具有较高的学习借鉴价值,不仅适用于小白学习入门进阶。也可作为毕设项目、课程设计、大作业、初期项目立项演示等。 4、如果基础还行,或热爱钻研,亦可在此项目代码基础上进行修改添加,实现其他不同功能。 欢迎下载!欢迎交流学习!不清楚的可以私信问我!
mellitz_3cd_01_0318
PyQt6实战派 配套代码
陕西省省级非物质文化遗产经纬度数据统计表 统计内容包含以下字段: 1. 项目名称 2. 遗产类别 3. 入选批次 4. 所属地区 5. 申报地区/单位 6. 地理经度 7. 地理纬度 该统计表系统记录了陕西省省级非物质文化遗产的地理空间信息,为文化遗产的数字化保护与研究工作提供了重要的数据支撑。
ran_3ck_02a_0918
毕业设计_基于springboot+vue开发的汽车租赁管理系统【源码+sql+可运行】【50308】.zip 全部代码均可运行,亲测可用,尽我所能,为你服务; 1.代码压缩包内容 代码:springboo后端代码+vue前端页面代码; 脚本:数据库SQL脚本 效果图:运行结果请看资源详情效果图 2.环境准备: - JDK1.8+ - maven3.6+ - nodejs14+ - mysql5.6+ - redis 3.技术栈 - 后台:springboot+mybatisPlus+Shiro - 前台:vue+iview+Vuex+Axios - 开发工具: idea、navicate 4.功能列表 - 系统设置:用户管理、角色管理、资源管理、系统日志 - 业务管理:汽车管理、客户管理、租赁订单 3.运行步骤: 步骤一:修改数据库连接信息(ip、port修改) 步骤二:找到启动类xxxApplication启动 4.若不会,可私信博主!!!
# Runcorder - 跑步训练管理系统 Runcorder 是一款专为跑步爱好者、马拉松运动员及高校体育生设计的本地化跑步训练管理工具,基于 Python 开发,结合 Tkinter 图形界面与强大的数据处理能力,为用户提供从训练记录到数据分析的全方位支持。无论是初学者还是专业跑者,Runcorder 都能帮助你科学规划训练、精准追踪进度,并通过可视化图表直观呈现训练成果,让你的跑步训练更智能、更高效! - **多用户管理**:支持创建、加载和删除用户档案,每个用户的数据独立存储,确保隐私与安全。 - **科学训练记录**:全维度记录跑步数据,包括日期、里程、配速、自评和晨跑标记,支持智能输入校验,避免数据错误。 - **多维数据分析**:通过动态可视化图表展示跑步里程趋势、平均配速曲线,支持自定义 Y 轴范围,帮助用户深入理解训练效果。 - **高阶功能**:提供 4 种科学训练模式(有氧/无氧/混合),支持历史记录修改与删除,数据以 JSON 格式持久化存储,跨平台兼容。
paatzsch_01_0708
AnythingLLM是一个全栈应用程序,您可以使用流行的开源大语言模型,再结合向量数据库解决方案构建个人本地AI大模型知识库
mellitz_3ck_02_0519