`
shappy1978
  • 浏览: 703414 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

Tesseract for Sikulix

    博客分类:
  • CI
 
阅读更多

// need to also select option 1 Jyphon even if you only want to install tesseract, if will popup msg to reuse the downloaded jar

// lib is download to /Users/xxx/Library/Applicatoin Support/Sikulix/SikulixTesseract/

 

最近收到 Yumiay 大大來信討論,OCR 該功能不能動......我想說應該不會啊,這功能雖然辨識度很差,但是用起來還蠻簡單的說
經過討論發現,原來此功能在 Sikuli 1.0.1 版的時候使用 鼎鼎大名的 Tesseract OCR,但是似乎有些 issue 存在
所以這功能預設是關閉的,管他有哪些issue, 庵就是要用 OCR 別攔我 ^^
接下來就是介紹如何開啟封印:

要使用 Tesseract OCR 功能必須要確定在安裝時有勾選~選項 5
Sikuli setup.jpg

確定有勾選之後安裝程式會下載 sikuli-tessdata.jar 檔案,再來要到安裝的目錄中刪除 libs 目錄,讓 Sikuli IDE (runIDE.cmd)重新建立tessdata目錄
Si del libs321.jpg

確認 libs 目錄裡面有 tessdata 目錄,給OCR 使用的字典資料庫,這很重要哦!!!
接下來解除OCR 封印,為蝦米該功能被封印呢? 答案請看 官方文件 ==> https://github.com/RaiMan/SikuliX-IDE/wiki/Release-Notes-IDE
間單來說~ OCR 有問題,這問題會在 1.1 的時候修正,預設OCR 是關閉的
所以你使用 .text() 功能都會得到 "Region.text: text recognition is currently switched off" 的錯誤訊息

Execute siku543.jpg

最後比較兩版本之間的OCR 結果
OCR 老問題~~ 1 和 l 分不清...中文支援....嘿嘿嘿(應該會很慘吧,需要中文的 tessdata 資料庫,我猜應該要吧)~~如果各位看官有玩的話分享一下 ^^

Compare siku5413.jpg

 
分享到:
评论

相关推荐

    Tesseract for Linux下载 附中英识别库

    **Tesseract for Linux:强大的OCR引擎** Tesseract是一款开源的光学字符识别(OCR)引擎,最初由HP开发,后来被Google接手并持续维护。在Linux操作系统中,Tesseract提供了高效且精准的文字识别功能,能够从图像中...

    tesseract稳定版 for windows

    # tesserocr是Python的一个OCR识别库,但其实是对tesseract做的一层Python API封装,所以它的核心是tesseract。 # 因此,在安装tesserocr之前,我们需要先安装tesseract。 # 1.tesseract下载 # 2.接下来,再安装...

    tesseract-ocr-for-php-master.zip

    **Tesseract OCR for PHP**是将Tesseract OCR引擎与PHP编程语言相结合的工具,使得开发者能够在PHP项目中方便地实现图像文字识别功能。Tesseract OCR是Google维护的一个开源项目,它能够从图像中识别出印刷体文本,...

    Tesseract-OCR-4.0 for windows

    "Tesseract OCR 4.0 for Windows" 是一个专为Windows操作系统设计的文本识别软件,由Google进行开发和维护。Tesseract OCR(Optical Character Recognition,光学字符识别)是一种强大的开源工具,用于从图像中提取...

    Tesseract installer for Windows

    The Mannheim University Library (UB Mannheim) uses Tesseract to perform text recognition (OCR = optical character recognition) for historical German newspapers (Allgemeine Preußische Staatszeitung, ...

    TesseractEngine3 for .net 3.01 release r638

    tesseract-ocr .net for tesseract 3.01 release r638 DLL) VC100 & .Net 4.0 Client Profile Data) downlaod tessdata: ...

    tesseract tesseract-3.04.00

    **Tesseract OCR 简介** Tesseract是一个开源的光学字符识别(OCR)引擎,由HP公司在1985年开发,并在2005年转交给Google维护。Tesseract 3.04.00是该软件的一个版本,它在识别精度和速度上都有显著的提升。OCR技术...

    tesseract-4.1.0最新版,tesseract下载,matlab

    **Tesseract OCR简介** Tesseract OCR(Optical Character Recognition,光学字符识别)是一款开源的文本识别引擎,由HP公司于1985年开发,并在2005年被Google接管并持续维护至今。它的主要功能是将图像中的文本...

    Tesseract-OCR.rar

    New there is a tesseract.spec for making rpms. (Thanks to Andrew Ziem for the help.) It might work with your OS if you know how to do that. If you are linking to the libraries, as Ocropus does, ...

    tesseract-ocr-w64-5.0.0+tesseract4.1.1

    **Tesseract OCR 引擎详解** Tesseract OCR(Optical Character Recognition)是一种强大的文本识别引擎,最初由惠普(HP)实验室在1985年研发。随着时间的推移,这个项目经历了许多演变,最终在2005年被Google接手...

    tesseract中文简体字库

    Tesseract OCR(Optical Character Recognition,光学字符识别)是一款开源的文本识别引擎,由HP公司开发,后来由Google维护。这个工具能够从图像中自动识别并转换文本,尤其在处理扫描文档、图片中的文字时非常有用...

    tesseract-ocr 4.0 for windows.zip

    **Tesseract OCR 4.0 for Windows:深度学习与图像识别的力量** Tesseract OCR(Optical Character Recognition,光学字符识别)是一种强大的文本识别引擎,最初由惠普公司开发,后来成为了谷歌的一个开源项目。它...

    Tesseract installer for Windows中文包

    Normally we run Tesseract on Debian GNU Linux, but there was also the need for a Windows version. That's why we have built a Tesseract installer for Windows. WARNING: Tesseract should be either ...

    Tesseract 数字识别库

    **Tesseract 数字识别库详解** Tesseract OCR(光学字符识别)是一款强大的开源OCR引擎,最初由HP开发,后来由Google维护。它主要用于从图像中提取文本,转换为可编辑和搜索的形式。在这个特定的场景中,我们关注的...

    Tesseract离线安装包(leptonica+tesseract+中英文训练包)

    Tesseract OCR(Optical Character Recognition,光学字符识别)是一个开源的OCR引擎,它能够从图像中识别并转换文本。Tesseract以其强大的识别能力、丰富的语言支持以及灵活的自定义训练功能,在各种场景下得到了...

    Java使用Tesseract4.0训练字库并且识别训练后的图片

    tesseract-ocr.exe文件要安装上,需要运行环境。 java文件使用:使用Tesseract方法可通过pom方式和jar包方式; 注意:使用前先查看“训练步骤”的那个文档,里面有详细说明,一定要查看;重要!!! 注意:使用前...

    tesseract-master.zip

    This package contains an OCR engine - libtesseract and a command line program - tesseract. Tesseract 4 adds a new neural net (LSTM) based OCR engine which ... See Tesseract Training for more information.

    TesseractOCR 训练集

    Tesseract OCR(Optical Character Recognition)是一款开源的文本识别引擎,由谷歌维护,它能够将图像中的文字识别为可编辑的文本。这个压缩包提供的“Tesseract OCR 训练集”包含了不同语言和功能的数据文件,分别...

Global site tag (gtag.js) - Google Analytics