`
canofy
  • 浏览: 828776 次
  • 性别: Icon_minigender_1
  • 来自: 北京、四川
社区版块
存档分类
最新评论

tesseract的东东

    博客分类:
  • ruby
阅读更多
一个文字图像的识别东西,一个google开源的东西,图片格式目前只支持bpm

图像文件不是很大的话,转换成文字还是有一些错误

附件中是Windows下的包,解压缩
分享到:
评论
1 楼 hujinlongman 2009-12-23  
怎么使用啊?

相关推荐

    tesseract-4.1.0最新版,tesseract下载,matlab

    **Tesseract OCR简介** Tesseract OCR(Optical Character Recognition,光学字符识别)是一款开源的文本识别引擎,由HP公司于1985年开发,并在2005年被Google接管并持续维护至今。它的主要功能是将图像中的文本...

    tesseract tesseract-3.04.00

    **Tesseract OCR 简介** Tesseract是一个开源的光学字符识别(OCR)引擎,由HP公司在1985年开发,并在2005年转交给Google维护。Tesseract 3.04.00是该软件的一个版本,它在识别精度和速度上都有显著的提升。OCR技术...

    tesseract-ocr-w64-5.0.0+tesseract4.1.1

    **Tesseract OCR 引擎详解** Tesseract OCR(Optical Character Recognition)是一种强大的文本识别引擎,最初由惠普(HP)实验室在1985年研发。随着时间的推移,这个项目经历了许多演变,最终在2005年被Google接手...

    tesseract中文简体字库

    Tesseract OCR(Optical Character Recognition,光学字符识别)是一款开源的文本识别引擎,由HP公司开发,后来由Google维护。这个工具能够从图像中自动识别并转换文本,尤其在处理扫描文档、图片中的文字时非常有用...

    Tesseract离线安装包(leptonica+tesseract+中英文训练包)

    Tesseract OCR(Optical Character Recognition,光学字符识别)是一个开源的OCR引擎,它能够从图像中识别并转换文本。Tesseract以其强大的识别能力、丰富的语言支持以及灵活的自定义训练功能,在各种场景下得到了...

    Tesseract 数字识别库

    **Tesseract 数字识别库详解** Tesseract OCR(光学字符识别)是一款强大的开源OCR引擎,最初由HP开发,后来由Google维护。它主要用于从图像中提取文本,转换为可编辑和搜索的形式。在这个特定的场景中,我们关注的...

    tesseract-OCR识别实例工程(vs2015+win10)+tesseract 4.0(32位和64位编译库)

    **Tesseract OCR识别技术详解** Tesseract OCR(Optical Character Recognition,光学字符识别)是一种开源的文本识别引擎,由Google维护。它最初由HP开发,后来转移到了Google,现在是世界上最广泛使用的OCR引擎之...

    Tesseract 金额数字识别库

    **Tesseract 金额数字识别库**是一个专门针对中文金额数字识别的轻量级工具,它的设计目的是为了在处理大量文本数据时,特别是涉及到金融、会计等领域时,提供高效的数字识别能力。相较于完整的英文和中文识别包,这...

    Tesseract v5.0.0免安装版.rar

    Tesseract OCR(Optical Character Recognition,光学字符识别)是一款由Google维护的开源OCR引擎,它能够从图像中识别并转换出文本。Tesseract v5.0.0是该软件的一个重要版本更新,提供了更强大的文字识别能力和更...

    delphi 源码Tesseract3.0 ocr

    【标题】"delphi 源码Tesseract3.0 OCR" 涉及到的知识点主要集中在 Delphi 编程语言以及 Tesseract OCR(Optical Character Recognition,光学字符识别)引擎的应用上。Tesseract OCR 是一个开源的、高度可训练的...

    TesseractOCR 训练集

    Tesseract OCR(Optical Character Recognition)是一款开源的文本识别引擎,由谷歌维护,它能够将图像中的文字识别为可编辑的文本。这个压缩包提供的“Tesseract OCR 训练集”包含了不同语言和功能的数据文件,分别...

    tesseract.js-master.zip

    《Tesseract.js:一款强大的JavaScript版OCR库》 在当今数字化的世界中,光学字符识别(Optical Character Recognition,OCR)技术扮演着至关重要的角色,它能够将图像中的文本转换为可编辑、可搜索的数据。...

    OCR-Tesseract5.0编译后完整版本

    **OCR-Tesseract 5.0 编译后完整版本** OCR(Optical Character Recognition,光学字符识别)是一种技术,能够将扫描的文档、图片或PDF中的文本自动转换为可编辑和搜索的形式。Tesseract是一个开源OCR引擎,由...

    Tesseract中文训练库

    Tesseract中文训练库是专为Tesseract OCR(Optical Character Recognition,光学字符识别)引擎定制的一个数据集,用于提高Tesseract在识别中文字符时的准确性和效率。Tesseract是一款开源的OCR软件,由HP开发并在...

    tesseract-ocr 安装包

    3. 将包pytesseract文件中的pytesseract.py中的tesseract_cmd关联到第一步安装的tesseract上,即注释掉tesseract_cmd = 'tesseract'这一行,并添加 tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/...

    Tesseract-OCR中文训练库

    **Tesseract OCR中文训练库详解** Tesseract OCR(Optical Character Recognition)是由Google维护的一款开源OCR引擎,它能够识别图像中的文本并将其转换为可编辑的格式。在处理中文文本时,Tesseract需要特定的...

    tesseract资源包及chinese语言包

    **OCR技术与Tesseract简介** OCR(Optical Character Recognition,光学字符识别)是一种技术,能够将扫描的图像或照片中的印刷体或手写体文本转换为机器编辑的文本。这项技术广泛应用于文档数字化、自动表格处理、...

    tesseract5.0 编译成功的库5.0.rar

    《Tesseract 5.0 编译指南及应用解析》 Tesseract OCR(Optical Character Recognition,光学字符识别)是一款开源的文本识别引擎,由谷歌维护。Tesseract 5.0 是其最新的版本,提供了更强大的文字识别能力,特别是...

    tesseract-5.0.zip

    《Tesseract 5.0:OCR技术的深度解析与应用》 Tesseract 5.0 是一个开源的光学字符识别(OCR)引擎,由谷歌维护并持续更新。这个版本是针对Visual Studio 2015编译环境构建的,支持32位(x86)架构,提供调试和发布...

    C#Tesseract.3.0.2.0 完整实例以及训练教程

    C#Tesseract.3.0.2.0 是一个基于Tesseract OCR引擎的C#完整实例,用于图像文字识别,特别是验证码识别。Tesseract是一个开源的OCR(Optical Character Recognition,光学字符识别)软件,最初由HP开发,后来被Google...

Global site tag (gtag.js) - Google Analytics