`
mingren135
  • 浏览: 72469 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

OCR文字识别

 
阅读更多

OCR(Optical Character Recognition):光学字符识别,是指对图片文件中的文字进行分析识别,获取的过程。  Tesseract:开源的OCR识别引擎,初期Tesseract引擎由HP实验室研发,后来贡献给了开源软件业,后经由Google进行改进,消除bug,优化,重新发布。

http://code.google.com/p/tesseract-ocr/

Summary:Tesseract is probably the most accurate open source OCR engine available. Combined with the Leptonica Image Processing Library it can read a wide variety of image formats and convert them to text in over 60 languages. It was one of the top 3 engines in the 1995 UNLV Accuracy test. Between 1995 and 2006 it had little work done on it, but since then it has been improved extensively by Google. It is released under the Apache License 2.0.

Supported Platforms:Tesseract works on Linux, Windows (with VC++ Express or CygWin) and Mac OSX. See the ReadMe for more details and install instructions. It can also be compiled for other platforms, including Android and the iPhone, though these are not as well tested platforms. See also the AddOns page for other projects using Tesseract on various platforms.

----------------------------------------------------------------------------------------------

1、linux安装tesseract,http://code.google.com/p/tesseract-ocr/wiki/Compiling

 

-----
#install dependent package
sudo apt-get install autoconf automake libtool
sudo apt-get install libpng12-dev
sudo apt-get install libjpeg62-dev
sudo apt-get install libtiff4-dev
sudo apt-get install zlib1g-dev
sudo apt-get install libleptonica-dev
------
sudo apt-get install g++ 
#g++ --version
------
#install tesserocr
./autogen.sh
./configure
make
sudo make install
sudo ldconfig
------
--install language
cd /usr/local/share/tessdata
cp eng.traineddata /usr/local/share/tessdata

 2、测试,总体识别率不算高,第1种数字识别率不错,第2种类型的验证码以‘-psm 6’参数得出的识别率更高

 

1)

 

➜  Downloads  tesseract test.png aa         
Tesseract Open Source OCR Engine v3.02.02 with Leptonica
➜  Downloads  more aa.txt 
0376

 2)

➜  Downloads  tesseract test1.jpg 1 
Tesseract Open Source OCR Engine v3.02.02 with Leptonica
Empty page!!
Empty page!!
➜  Downloads  more 1.txt

 

➜  Downloads  tesseract test1.jpg 1 -psm 7    
Tesseract Open Source OCR Engine v3.02.02 with Leptonica
➜  Downloads  more 1.txt
EMsi~\

 
 

➜  Downloads  tesseract test7.jpg 7 -psm 6
Tesseract Open Source OCR Engine v3.02.02 with Leptonica
➜  Downloads  more 7.txt 
9u2E
  

 

 3)
 

➜  Downloads  tesseract test2.jpg 2
Tesseract Open Source OCR Engine v3.02.02 with Leptonica
➜  Downloads  more 2.txt 
F KASKN

 
 3、补充

1)安装tesseract时,不执行ldconfig命令,会报error while loading shared libraries: xxx.so.x

原因参考:http://hi.baidu.com/longquan302/item/3e3a82102f77565c7b5f251b

2)tesseract语言包下载地址,http://code.google.com/p/tesseract-ocr/downloads/list

3)第3方基于tesseract-ocr开发的工具,http://code.google.com/p/tesseract-ocr/wiki/3rdParty

4)中文安装说明,http://www.linuxidc.com/Linux/2011-07/38728.htm

5)tesseract用法

Usage:tesseract imagename outputbase [-l lang] [-psm pagesegmode] [configfile...]
例如:  tesseract code.jpg result  -l chi_sim -psm 7 nobatch  
-l chi_sim 表示用简体中文字库(需要下载中文字库文件,解压后,存放到tessdata目录下去,字库文件扩展名为.raineddata 简体中文字库文件名为:  chi_sim.traineddata)  
-psm 7 表示告诉tesseract code.jpg图片是一行文本,这个参数可以减少识别错误率, 默认为 3
configfile 参数值为tessdata\configs 和  tessdata\tessconfigs 目录下的文件名。

6)java调用tesseract-ocr, http://blog.sina.com.cn/s/blog_025270e90101avgb.html

7)windows下使用tesseract-ocr,http://blog.csdn.net/xiaochunyong/article/details/7193744

8)仅识别数字,tesseract imagename outputbase digits

  • 大小: 1.3 KB
  • 大小: 1.4 KB
  • 大小: 2.4 KB
  • 大小: 1.2 KB
分享到:
评论

相关推荐

    捷速ocr文字识别软件 v3.0.zip

    捷速OCR文字识别软件是将你的图片转换成word及可编辑的文字。该软件具备一键转换功能,是OCR识别软件中包含格式最多、识别率最高、速度最快的一款识别软件。本软件支持识别前对页面的分析、识别时对文件的预览及修改...

    Android应用源码OCR文字识别

    此项目“Android应用源码OCR文字识别”提供了一种实现方式,帮助开发者集成OCR功能到自己的应用程序中。通过解压SimpleOCR.zip文件,我们可以深入研究OCR在Android上的实现细节。 首先,我们需要理解OCR的基本工作...

    C++ OCR 文字识别

    在"C++ OCR 文字识别"项目中,可能已经包含了这些步骤的实现,以及必要的库和API,例如Tesseract OCR,这是一个开源的OCR引擎,支持多种语言,并且提供C++ API供开发者使用。Tesseract具有良好的社区支持和丰富的...

    方正OCR文字识别软件

    方正OCR文字识别软件是一款高效且精准的工具,专门用于将图像中的文字转换为可编辑的文本格式。OCR,全称为Optical Character Recognition(光学字符识别),是这项技术的缩写,它通过复杂的算法和模式识别来解析...

    天若OCR文字识别V4.45.rar

    《天若OCR文字识别V4.45:高效精准的文字提取技术详解》 在数字化信息时代,文字识别软件已经成为我们日常工作中不可或缺的工具之一。"天若OCR文字识别V4.45"就是这样一款高效实用的软件,它以其便捷的操作方式和...

    天若OCR文字识别本地版-v1.3.5-x64.7z

    《天若OCR文字识别本地版-v1.3.5-x64.7z》是一款专为用户设计的高效OCR(Optical Character Recognition,光学字符识别)软件,适用于64位操作系统。该版本号为1.3.5,体现了软件的不断优化与升级。通过这个压缩包,...

    VB OCR文字识别程序,调用知名OCR平台api,识别正确率高达99%.rar

    VB OCR文字识别程序是利用Visual Basic编程语言,结合外部OCR(Optical Character Recognition,光学字符识别)服务API来实现的高效文字识别工具。OCR技术能够将图像中的文本转换为可编辑的数据,通常用于处理扫描...

    天若OCR文字识别.zip

    《天若OCR文字识别软件详解及其应用》 天若OCR文字识别是一款高效实用的文本识别工具,专为Windows用户设计,具有便捷的操作性和强大的识别能力。该软件的主要功能是将图像中的文字转换成可编辑的文本,极大地提升...

    Android项目OCR文字识别.rar

    Android项目OCR文字识别.rar介绍 本资源为一套基于Android平台的OCR(光学字符识别)文字识别项目。它可以帮助开发者快速实现移动端的文字识别功能,支持多种语言,包括但不限于中文、英文等。该项目采用开源技术,...

    OCR文字识别V4.48(免安装)

    在本案例中提到的"OCR文字识别V4.48(免安装)"是一款小巧实用的OCR软件,它无需安装,用户可以直接使用,方便快捷。 这款OCR工具特别强调了其易用性和高准确性,声称正确率可以达到99%以上。这意味着它可以高效地...

    识别度较高的ocr文字识别软件源码

    总之,这个"识别度较高的OCR文字识别软件源码"为Java开发者提供了一个很好的学习和实践平台,不仅可以直接用于文字识别任务,也能作为深入理解OCR技术的实例。通过阅读和理解源码,开发者可以提升自己的技能,同时为...

    Ocr文字识别完成源码

    在本项目中,"Ocr文字识别完成源码" 提供了一个全面的解决方案,支持处理多种常见的图像和文档格式,包括PDF、JPG、BMP和PNG。以下是对这个源码实现的一些关键知识点的详细说明: 1. **图像预处理**:在进行OCR识别...

    最新版树洞 OCR 文字识别工具(免费版)

    《树洞 OCR 文字识别工具:高效办公的新选择》 在数字化时代,高效处理文本信息成为日常工作中的重要一环。而OCR(Optical Character Recognition,光学字符识别)技术的出现,使得从图像中提取文字变得可能,极大...

    OCR文字识别项目实战

    在这个"OCR文字识别项目实战"中,我们将深入探讨如何利用现代AI技术和算法来实现高效且准确的文字识别。 1. OCR基本原理: OCR技术的核心在于通过图像处理和机器学习算法来识别图像中的文字。首先,对输入的图像...

    奇迹OCR文字识别软件 v5.0 2013.zip

    奇迹OCR文字识别软件免费OCR文字识别软件,图片转换成TXT或WORD,识别极速、效果好。OCR文字识别软件是将你上传的图片转换成WORD、图片转换成文字等可编辑文字,一键转换,OCR识别在线超快并且免费!支持JPG、PNG、...

    最强OCR文字识别工具v4.43

    "最强OCR文字识别工具v4.43"是一款高效且易用的OCR软件,特别适合需要大量文字输入或者撰写学术论文的用户。通过使用这款工具,用户可以快速地将纸质文档、PDF文件或截图中的文字提取出来,大大节省手动输入的时间。...

    奇迹OCR文字识别v1.0中文绿色免费版

    奇迹OCR文字识别软件免费OCR文字识别软件,图片转换成TXT或WORD,识别极速、效果好。OCR文字识别软件是将你上传的图片转换成WORD、图片转换成文字等可编辑文字,一键转换,OCR识别在线超快并且免费!支持JPG、PNG、...

    捷速OCR文字识别

    【捷速OCR文字识别】是一款高效且便捷的光学字符识别(OCR)软件,专为用户设计,以便将扫描文档、图片或PDF中的文本快速转换成可编辑和可搜索的格式。OCR技术是图像处理和人工智能领域的核心技术之一,它能够识别并...

    安卓ocr文字识别app源码

    在安卓平台上,开发一款OCR文字识别APP,可以方便用户快速提取图片中的文字信息。下面将详细阐述Android OCR应用的相关知识点。 1. **Tesseract OCR引擎**: Tesseract是谷歌维护的一款开源OCR引擎,它支持多种...

    Java 百度ocr文字识别-发票识别,并在页面显示信息

    Java 百度OCR文字识别技术在发票识别中的应用是一个典型的计算机视觉与自然语言处理结合的实例,它将图像处理、模式识别与机器学习等技术融合,以实现对图像中的文字内容进行准确提取和理解。本项目主要涉及以下几个...

Global site tag (gtag.js) - Google Analytics