`
linleran
  • 浏览: 21949 次
  • 性别: Icon_minigender_1
  • 来自: 福州
社区版块
存档分类
最新评论

有否java版的中文OCR

ocr 
阅读更多
目前项目有个业务,需要将扫描件的文本进行提取,扫描件是中文,市面是有没有比较好的中文OCR提供API,最好是java的,哪个厂商比较好,多少钱。当然如果有开源的最好。
关于java写的OCR好像讨论的很少,google上搜了下,发现基本都是c/c++的
开源的主要有:
tesseract-ocr:http://code.google.com/p/tesseract-ocr/
GOCR:http://jocr.sourceforge.net/
有个付费的:
javaocr:http://www.javaocr.com/
但以上都是只支持英文,这次项目里有个业务,需要提取扫描件的文本,不知道有没有厂商开发API,费用多少?
分享到:
评论

相关推荐

    使用Java开发的OCR程序 根据图像识别转换成中文

    在这个Java开发的OCR程序中,我们聚焦于如何使用Java来实现这一功能,特别是针对中文字符的识别。 首先,我们需要了解Java中的OCR库。Tesseract是一个广泛使用的开源OCR引擎,它支持多种语言,包括中文。在Java项目...

    Java调用OCR进行图片识别

    Java调用OCR进行图片识别 Java调用OCR进行图片识别是指使用Java语言通过Tesseract-OCR对图片进行识别的技术。下面是相关知识点的详细解释: 一、Tesseract-OCR简介 Tesseract-OCR是一个开源的OCR(Optical ...

    Java OCR 图像智能字符识别技术,可识别中文

    总的来说,Java OCR中文字符识别技术结合了图像处理、机器学习和自然语言处理等多个领域的知识,为自动化处理大量文本信息提供了有效工具。在实际开发中,我们需要根据具体需求选择合适的OCR库,并结合优化策略,以...

    Asprise-OCR-Java 真正破解版

    坛子里有破解版的Asprise-OCR-Java,其原理就是利用开启CloseWin.exe窗口扫描有没有Asprise弹出过期的窗口,更具信息框的标题栏来判断是否要关闭此信息窗口。2011年7月以后的使用版无论是点击确定还是关闭按钮,都要...

    Java调用OCR进行图片识别[归纳].pdf

    Java 调用 OCR 进行图片识别 Java 调用 OCR 进行图片识别是指使用 Java 语言调用 OCR(Optical Character Recognition,光学字符识别)技术来识别图片中的文字信息。这种技术可以将图片中的文字信息提取出来,并将...

    Java使用 清华文通OCR文件

    在这个场景中,我们关注的是清华文通OCR软件,这是一款高效且准确的图文识别工具,尤其适合处理中文文档。以下我们将深入探讨如何在Java环境中利用清华文通OCR实现文字识别。 首先,清华文通OCR提供了Windows平台上...

    Java 版 OCR印刷文字识别接口

    总的来说,这个Java版OCR印刷文字识别接口项目为初学者提供了一个很好的学习平台,通过Spring Boot框架简化了服务集成,使得开发者可以快速了解和实践OCR技术,而无需从零开始构建整个系统。同时,免费的测试权限...

    Tesseract-OCR java版

    **Tesseract OCR Java版**是将开源的Tesseract光学字符识别(OCR)引擎与Java环境相结合,用于在图像中识别和提取文字。Tesseract最初由HP开发,后来由Google维护,它具有高度的准确性和可扩展性,尤其适用于处理...

    JavaOcr图像文字识别工具

    在Java世界中,有许多开源库支持OCR功能,如Tesseract、Apache POI、PDFBox等。Tesseract是谷歌维护的一个OCR引擎,它提供了强大的文字识别能力,并且可以训练以识别特定的字体或格式。Apache POI和PDFBox则主要处理...

    基于JAVA开发的 OCR 神经网络源程序java_Ocr

    【OCR技术概述】 ...总的来说,这个项目为Java开发者提供了一个实践OCR技术的平台,通过研究源代码,不仅可以了解OCR的工作流程,还能加深对Java编程和神经网络的理解,有助于提升技能和创新能力。

    java-ocr工具及实现类

    总的来说,Java OCR工具结合Tess4J和Tesseract OCR引擎,为Java开发者提供了强大的文本识别能力,特别是在处理含有多种语言,尤其是简体中文的图像时。正确理解和使用这些工具,可以在各种场景下实现高效、准确的...

    java 验证码识别 OCR

    java 验证码识别 OCR。

    java百度OCR文字识别名片信息补充

    在本项目"java百度OCR文字识别名片信息补充"中,我们将讨论如何利用Java编程语言调用百度的OCR服务来提取名片上的文字信息。 首先,我们需要了解百度提供的OCR API。百度AI开放平台提供了多种OCR服务,包括通用文字...

    Aspose.OCR-for-Java-17.2

    Aspose.OCR-for-Java-17.2是一款专门针对Java平台开发的光学字符识别(OCR)库。OCR技术主要用于将图像中的文本转换为可编辑和可搜索的数据。这款库由Aspose公司提供,它允许开发者在Java应用程序中集成强大的文字...

    JAVA_OCR小工具_用了Asprise OCR包

    1. **引入库**: 下载Asprise OCR的Java版库文件,包括.jar和.dll,将.jar文件添加到项目的类路径中。 2. **配置环境**: 按照上述方法,将.dll文件放置到系统目录。 3. **编写代码**: 使用Asprise OCR提供的API,创建...

    Java实现ocr图片识别(PaddleOCR)飞桨

    在本项目中,我们将探讨如何利用Java集成PaddleOCR,一个由飞桨(PaddlePaddle)框架支持的开源OCR系统,来实现高效且精准的图像文字识别。 首先,PaddleOCR是百度公司推出的深度学习OCR工具,它具有轻量级、高精度...

    微软Azure OCR图像识别Java代码

    在这个场景中,我们将专注于如何使用Java来调用微软Azure的OCR API,实现图像中的中文文字识别。 首先,我们需要在Azure平台上注册一个账号并创建一个 Cognitive Services 资源,这将为我们提供一个API密钥和终结点...

    Java OCR 图像智能字符识别-文字识别Demo

    在这个"Java OCR 图像智能字符识别-文字识别Demo"项目中,我们看到的是一个利用Java实现的OCR系统,特别强调了其对中文字符的识别能力。 这个Demo的核心可能包含以下几个关键知识点: 1. **Tesseract OCR引擎**:...

    基于tesseract的多线程OCR服务器的JAVA实现

    2. **多线程处理**:使用Java的`ExecutorService`或`Thread`类创建线程池,当有新的OCR任务时,将其分配给空闲线程进行处理。 3. **Tesseract集成**:通过JNI(Java Native Interface)或Java的`ProcessBuilder`...

Global site tag (gtag.js) - Google Analytics