`
shappy1978
  • 浏览: 700150 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

Tesseract for Sikulix

    博客分类:
  • CI
 
阅读更多

// need to also select option 1 Jyphon even if you only want to install tesseract, if will popup msg to reuse the downloaded jar

// lib is download to /Users/xxx/Library/Applicatoin Support/Sikulix/SikulixTesseract/

 

最近收到 Yumiay 大大來信討論,OCR 該功能不能動......我想說應該不會啊,這功能雖然辨識度很差,但是用起來還蠻簡單的說
經過討論發現,原來此功能在 Sikuli 1.0.1 版的時候使用 鼎鼎大名的 Tesseract OCR,但是似乎有些 issue 存在
所以這功能預設是關閉的,管他有哪些issue, 庵就是要用 OCR 別攔我 ^^
接下來就是介紹如何開啟封印:

要使用 Tesseract OCR 功能必須要確定在安裝時有勾選~選項 5
Sikuli setup.jpg

確定有勾選之後安裝程式會下載 sikuli-tessdata.jar 檔案,再來要到安裝的目錄中刪除 libs 目錄,讓 Sikuli IDE (runIDE.cmd)重新建立tessdata目錄
Si del libs321.jpg

確認 libs 目錄裡面有 tessdata 目錄,給OCR 使用的字典資料庫,這很重要哦!!!
接下來解除OCR 封印,為蝦米該功能被封印呢? 答案請看 官方文件 ==> https://github.com/RaiMan/SikuliX-IDE/wiki/Release-Notes-IDE
間單來說~ OCR 有問題,這問題會在 1.1 的時候修正,預設OCR 是關閉的
所以你使用 .text() 功能都會得到 "Region.text: text recognition is currently switched off" 的錯誤訊息

Execute siku543.jpg

最後比較兩版本之間的OCR 結果
OCR 老問題~~ 1 和 l 分不清...中文支援....嘿嘿嘿(應該會很慘吧,需要中文的 tessdata 資料庫,我猜應該要吧)~~如果各位看官有玩的話分享一下 ^^

Compare siku5413.jpg

 
分享到:
评论

相关推荐

    Tesseract for Linux下载 附中英识别库

    **Tesseract for Linux:强大的OCR引擎** Tesseract是一款开源的光学字符识别(OCR)引擎,最初由HP开发,后来被Google接手并持续维护。在Linux操作系统中,Tesseract提供了高效且精准的文字识别功能,能够从图像中...

    tesseract稳定版 for windows

    # tesserocr是Python的一个OCR识别库,但其实是对tesseract做的一层Python API封装,所以它的核心是tesseract。 # 因此,在安装tesserocr之前,我们需要先安装tesseract。 # 1.tesseract下载 # 2.接下来,再安装...

    tesseract-ocr-for-php-master.zip

    **Tesseract OCR for PHP**是将Tesseract OCR引擎与PHP编程语言相结合的工具,使得开发者能够在PHP项目中方便地实现图像文字识别功能。Tesseract OCR是Google维护的一个开源项目,它能够从图像中识别出印刷体文本,...

    Tesseract-OCR-4.0 for windows

    "Tesseract OCR 4.0 for Windows" 是一个专为Windows操作系统设计的文本识别软件,由Google进行开发和维护。Tesseract OCR(Optical Character Recognition,光学字符识别)是一种强大的开源工具,用于从图像中提取...

    Tesseract installer for Windows

    The Mannheim University Library (UB Mannheim) uses Tesseract to perform text recognition (OCR = optical character recognition) for historical German newspapers (Allgemeine Preußische Staatszeitung, ...

    TesseractEngine3 for .net 3.01 release r638

    tesseract-ocr .net for tesseract 3.01 release r638 DLL) VC100 & .Net 4.0 Client Profile Data) downlaod tessdata: ...

    tesseract-4.1.0最新版,tesseract下载,matlab

    **Tesseract OCR简介** Tesseract OCR(Optical Character Recognition,光学字符识别)是一款开源的文本识别引擎,由HP公司于1985年开发,并在2005年被Google接管并持续维护至今。它的主要功能是将图像中的文本...

    tesseract tesseract-3.04.00

    **Tesseract OCR 简介** Tesseract是一个开源的光学字符识别(OCR)引擎,由HP公司在1985年开发,并在2005年转交给Google维护。Tesseract 3.04.00是该软件的一个版本,它在识别精度和速度上都有显著的提升。OCR技术...

    tesseract-ocr-w64-5.0.0+tesseract4.1.1

    **Tesseract OCR 引擎详解** Tesseract OCR(Optical Character Recognition)是一种强大的文本识别引擎,最初由惠普(HP)实验室在1985年研发。随着时间的推移,这个项目经历了许多演变,最终在2005年被Google接手...

    tesseract中文简体字库

    Tesseract OCR(Optical Character Recognition,光学字符识别)是一款开源的文本识别引擎,由HP公司开发,后来由Google维护。这个工具能够从图像中自动识别并转换文本,尤其在处理扫描文档、图片中的文字时非常有用...

    tesseract-ocr 4.0 for windows.zip

    **Tesseract OCR 4.0 for Windows:深度学习与图像识别的力量** Tesseract OCR(Optical Character Recognition,光学字符识别)是一种强大的文本识别引擎,最初由惠普公司开发,后来成为了谷歌的一个开源项目。它...

    Tesseract installer for Windows中文包

    Normally we run Tesseract on Debian GNU Linux, but there was also the need for a Windows version. That's why we have built a Tesseract installer for Windows. WARNING: Tesseract should be either ...

    Tesseract 数字识别库

    **Tesseract 数字识别库详解** Tesseract OCR(光学字符识别)是一款强大的开源OCR引擎,最初由HP开发,后来由Google维护。它主要用于从图像中提取文本,转换为可编辑和搜索的形式。在这个特定的场景中,我们关注的...

    Tesseract离线安装包(leptonica+tesseract+中英文训练包)

    Tesseract OCR(Optical Character Recognition,光学字符识别)是一个开源的OCR引擎,它能够从图像中识别并转换文本。Tesseract以其强大的识别能力、丰富的语言支持以及灵活的自定义训练功能,在各种场景下得到了...

    Java使用Tesseract4.0训练字库并且识别训练后的图片

    tesseract-ocr.exe文件要安装上,需要运行环境。 java文件使用:使用Tesseract方法可通过pom方式和jar包方式; 注意:使用前先查看“训练步骤”的那个文档,里面有详细说明,一定要查看;重要!!! 注意:使用前...

    tesseract-master.zip

    This package contains an OCR engine - libtesseract and a command line program - tesseract. Tesseract 4 adds a new neural net (LSTM) based OCR engine which ... See Tesseract Training for more information.

    TesseractOCR 训练集

    Tesseract OCR(Optical Character Recognition)是一款开源的文本识别引擎,由谷歌维护,它能够将图像中的文字识别为可编辑的文本。这个压缩包提供的“Tesseract OCR 训练集”包含了不同语言和功能的数据文件,分别...

    Tesseract 金额数字识别库

    **Tesseract 金额数字识别库**是一个专门针对中文金额数字识别的轻量级工具,它的设计目的是为了在处理大量文本数据时,特别是涉及到金融、会计等领域时,提供高效的数字识别能力。相较于完整的英文和中文识别包,这...

Global site tag (gtag.js) - Google Analytics