`
momostory
  • 浏览: 8219 次
文章分类
社区版块
存档分类
最新评论

6款优秀的免费OCR软件

阅读更多
   OCR 是英文Optical Character Recognition的缩写,意思为光学字符识别,通称为文字识别,它的工作原理为通过扫描仪或数码相机等光学输入设备获取纸张上的文字图片信息,利用各种模式识别算法分析文字形态特征,判断出汉字的标准编码,并按通用格式存储在文本文件中,由此可以看出,OCR实际上是让计算机认字,实现文字自动输入。它是一种快捷、省力、高效的文字输入方法。
    光学字符识别(OCR)软件,将所扫描的图像转换成PDF和Word等可编辑和可搜索的文档格式。在文档的转换过程中,OCR软件技术主要用来分析和比较带有数据库中所存字体的文档。虽然,OCR软件的识别准确率不可能达到100%,但是一些OCR软件包含拼写检查功能,可查出无法辨认的字。
本文对多款常用OCR软件的性能进行了多角度的对比,希望为用户在选择和使用OCR软件时候提供一些实用性参考。

OCR使用云脉Docs Matter
   作为偶尔使用的基本的OCR 工作,云脉Docs Matter的光学字符识别功能可以节省不少时间。
你可能忽略了它…叫做从图片中复制文本
[img]

[/img]
    ·将一个扫描或者保存的图片拖拽到云脉Docs Matter。你也可以试用Docs Matter导入功能将图片导入到Docs Matter。
    ·点击工具栏上的OCR转换按钮,就完成图片文字提取步骤,你可以将文字文字识别结果粘帖到像Word或记事本之类的任何程序。
云脉Docs Matter很好用,而且识别速度快,但是对于手写字符甚至模糊的字符识别不太理想。不过对于快速的任务,我非常支持云脉Docs Matter的剪辑和粘帖。

SimpleOCR
我使用微软的工具进行手写体识别时遇到的困难,可以在 SimpleOCR 找到可能的解决方案。不过这款软件对于手写体的识别只提供14天的免费试用,尽管机器打印的识别没有任何限制。

    • 这款软件可以设置直接从扫描仪读取或者通过添加页面(jpg、tiff、bmp 格式)。
    • SimpleOCR 在转换过程提供一些控制,包括文本选择、图片选择和文本忽略等功能。
    • 转换到文本时提供一个 确认阶段:用户可以使用一个内置的拼写检查工具对不符的地方进行更正。
    • 转换后的文件可以保存为 doc 或 txt 格式。
    SimpleOCR 对于通常的文本工作良好,但处理多个列的布局时会有所衰落。据我看来,微软的工具从精确度上来说要好于 SimpleOCR。

    TopOCR
   我正在说的才刚刚开始呢!TopOCR,与典型的 OCR 软件有所不同,是专为数码相机(至少300万像素)和带有摄像头的手机设计。就像 SimpleOCR,它有两个窗口界面--原始图像窗口和文本窗口。

    左侧窗口中从相机或扫描仪获取的图片转换为右侧窗口里面的文本格式。文本编辑器的功能很像写字板程序,可以使用微软的 文本转换语音 引擎。
    • 这款软件支持 JPEG、TIFF、GIF 和 BMP 格式。
    • 对图片进行亮度、色彩、对比度、去斑点、锐化等设置,可以提高图片的可读性。
    • 可以配置相机过滤设置来增强图片。
    • 转换后的文件可以保存为多种格式 – PDF、RTF、HTML 和 TXT 。
    • TopOCR 对于简单文本运行良好,不过对于多列文本通常会失效。
    • 这款软件对于混合页面(文本加图片)识别良好,并且只处理文本部分。
    • 这款软件可以处理11种语言。
    如何使相机读取取得最好的效果请阅读 如何使用 TopOCR 获得最好的效果。

    FreeOCR
   这款免费的 OCR 软件使用 Tesseract OCR 引擎。 Tesseract OCR 代码于1985到1995年间由惠普实验室开发,现在输入 Google。它被认为是最精确的开源 OCR 引擎之一。FreeOCR 是其底层代码的一个简单 Windows 界面。



• 它支持多种图片格式和多页面 TIFF 文件。
• 它可以处理 PDF 格式,并且兼容 TWAIN 设备比如扫描仪。
• FreeOCR 也有熟悉额双窗口界面以及容易理解的设置项。
• 在开始一键转换过程之前,可以调整图片的对比度增强可读性。
FreeOCR (v.2.03) 需要.Net 2.0 framework 支持。软件兼容 Windows XP/Vista,大小为 4.38MB,也可以从备选站点下载。
免费的 OCR 工具有它们自己的局限性。扫描图片也有清晰度、对比度以及字体清除的问题。
从一个普通用户的角度来看,100% OCR 精确度仍然是白日做梦。
尽管这些免费的工具处理打印文本足够了,但却不能处理一般潦草的手写文本。我个人喜欢使
用上述两款微软的产品作为辅助的 OCR 工具。

OCR 使用微软 OneNote 2007
   作为偶尔使用的基本的 OCR 工作,微软 OneNote 的光学字符识别功能可以节省不少时间。



• 将一个扫描或者保存的图片拖拽到 OneNote。你也可以使用 OneNote 剪辑 部分屏幕或者图片到 OneNote。
• 右击插入的图片选择 从图片中复制文本 。复制下来的识别文本保存到剪切板中,你可以粘贴到像 Word 或记事本之类的任何程序。
OneNote 非常的建议。但是它对于手写字符或者甚至模糊的字符识别不太理想。不过对于快速的任务,我非常支持 OneNote 的剪辑和粘贴。

OCR使用微软Office Document Imaging
另一个微软Office 家族中不常用的工具。它就在 开始 - 所有程序 – Microsoft Office –Microsoft Office 工具 – Microsoft Office Document Imaging.



使用 document imaging 工具进行 OCR 识别很悠闲,因为它只接受 TIFF (或者 MDI ) 格式。不过那并不太麻烦,因为任何图形应用程序都可以将图片转换为 TIFF。在下面的截图中,我使用微软画图板程序将 JPEG 转换为 TIFF。



• 在程序中打开文件 Microsoft Office Document Imaging – 文件 – 打开 。
• 点击那个小眼睛图标 – 使用 OCR 识别文本 。
• 点击 MS Word 图标 – 将文本发送到 Word 。
• 自动打开一个含有可编辑转换文本的 MS Word 文件。
• 另外,你也可以使用画图板程序选择特定区域并复制到剪切板,打开 MS Office
Document Imaging – 选择页面 –粘贴页面并复制选择部分进行OCR识别。
再次,MODI 处理印刷文本很不错,不过我的手写文本却遇到了“OCR 已执行但不能识别提交的文本”。当然,你可以试试自己的手写体。
那么,现在让我们离开微软家族,看看3款免费的称自己为OCR的软件…
  • 大小: 45.8 KB
  • 大小: 18.9 KB
  • 大小: 84.5 KB
  • 大小: 124.4 KB
  • 大小: 132.9 KB
  • 大小: 39.9 KB
  • 大小: 117.6 KB
分享到:
评论

相关推荐

    比方正、汉王更好用的ocr文字识别软件

    5. 自动排版和格式恢复:优秀OCR软件能尽可能保留原文档的布局和格式,使得转换后的文本易于阅读和编辑。 6. 用户友好的界面:简洁易用的界面设计能提高用户的工作效率,降低学习成本。 7. 扩展性与插件支持:提供...

    非常好用的ocr识别软件.rar

    6. 整合其他功能:一些OCR软件还集成了PDF转换、翻译、版面恢复等功能,提高工作效率。 压缩包中的“ocr识别”可能指的是该OCR软件的主要程序文件或者相关配置文件。使用时,用户通常需要解压这个文件,然后按照...

    识别看看 TryOCR 2.0 绿色便携版(免费优秀的国产OCR识别软件)

    识别看看 TryOCR 2.0 正式版(免费优秀的国产OCR识别软件) 识别看看常见问题: 1.问:“识别看看”能识别中文吗?“TryOCR”能识别中文吗? 答:“识别看看”2.0版本只支持英文文档识别,2.0版开始已经...

    最后一版天若免费OCR

    标题提到的“最后一版天若免费OCR”是一款广受欢迎的OCR软件,因其高效、易用而受到用户好评。 天若OCR,全名可能是“天若文字识别软件”,是一款免费的OCR工具,它能够帮助用户快速识别图像或截图中的文字,并允许...

    OCR图像识别软件OCR,提取图片文字,图片转文字

    6. **用户界面与兼容性**:一款好的OCR软件应该具备直观的用户界面,方便用户操作。同时,它需要支持多种操作系统,如Windows、MacOS或Android、iOS等,以满足不同用户的需求。 7. **后处理编辑**:识别后的文本...

    电脑软件离线OCR.rar实用

    - 多语言支持:优秀的OCR软件能识别多种语言的文本,包括中文、英文、日文、法文等。 - 图像预处理:调整图像质量,改善识别效果。 - 版面分析:理解文档布局,保持原文档的段落和格式。 - 批量处理:一次性处理...

    OCR文字识别(免费使用)

    5. **多种语言支持**:优秀的OCR软件不仅能识别简体中文,还可能包括繁体中文、英文、日文等多种语言,满足全球化的工作需求。 6. **文件格式兼容**:支持各种常见的图像格式,如JPG、PNG、PDF等,方便用户处理不同...

    MiniOcr抽取图片文字软件

    针对这一需求,一款名为"MiniOcr"的软件应运而生,专为界面设计人员和其他用户提供了高效、便捷的图片文字抽取解决方案。 MiniOcr是一款功能强大的OCR(Optical Character Recognition,光学字符识别)软件,其主要...

    OCR识别 Nicomsoft OCR

    Nicomsoft OCR引擎是一款专业级别的OCR软件开发工具包,它支持32位和64位操作系统,这使得它可以在各种不同的计算环境中无缝运行。该引擎特别之处在于其广泛的编程语言支持,包括Visual C++(VC)、Visual Basic(VB...

    文通OCR文字识别软件TH-OCRFREE_3987.com.zip

    文通OCR,全称TH-OCR,是一款来自国内的专业OCR软件,以其高效、精准的识别能力,在众多同类产品中脱颖而出。 文通OCR,作为一款中文OCR软件,特别针对中文字符进行了优化,能够识别简体、繁体乃至各种印刷体、手写...

    最新版树洞 OCR 文字识别工具(免费版)

    本文将深入探讨"树洞 OCR 文字识别工具"这一免费且精准的解决方案,它以其95%以上的识别准确率和无限制的使用次数,成为了众多办公人士的首选。 树洞 OCR 工具是一款专为CTF(Capture The Flag,网络安全竞赛)以及...

    MODI OCR安装包

    值得注意的是,虽然MODI OCR提供了强大的OCR功能,但随着技术的发展,市场上还有许多其他优秀的OCR软件,例如Adobe Acrobat的OCR功能、ABBYY FineReader等,这些软件也在不断优化识别精度和用户体验。用户在选择时应...

    清华文通TH-OCR_9.0 绿色版 破解版 part1

    TH-OCR 是清华大学自1985年就开始研发的,TH是TsingHua(清华)的缩写,TH-OCR代表北京清华紫光文通信息技术有限公司开发的OCR软件。在国家“863”计划支持下,持续了十多年的科研成果,从1.0版本开始已经升级到现在...

    煎鱼OCR v1.13_OCR_

    "煎鱼OCR v1.13"正是这样一款专为用户打造的轻量级OCR软件,其简洁易用的特性使得文字识别变得轻松便捷。 首先,煎鱼OCR v1.13的核心功能在于其强大的文字识别能力。它采用了先进的图像处理和深度学习算法,能够...

    天诺OCR文字识别-最好用的软件之一

    天诺OCR文字识别是一款高效的光学字符识别(OCR)软件,被赞誉为最优秀的OCR工具之一。光学字符识别技术是将图像中的文字转换成可编辑、可搜索的文本格式,极大地提高了工作效率,尤其对于处理大量纸质文档或扫描件...

    Tesseract一个免费的OCR引擎源码Google维护和开发

    Tesseract是一个免费的OCR引擎,OCR是Optical Character Recognition(光学字符识别)的缩写,它可以将印刷的或手写的文本、图像中的字符和文本转换成计算机可读的文本格式。Tesseract最初由美国康奈尔大学开发,现在...

    天若OCR.rar

    天若OCR作为一款优秀的OCR软件,其核心功能就是能够准确地从扫描件、图片或者屏幕截图中提取出清晰的文字,使得用户可以快速复制、编辑或保存这些信息,而无需手动输入。 首先,天若OCR的高识别率是其一大亮点。...

    天若OCR开源版V5.0.0

    开发者社区的贡献使得这款OCR软件在不断优化和完善,提供更好的用户体验。 "快速识别"是天若OCR的核心特性之一,意味着它能在短时间内准确地处理大量图像并完成文字识别。这得益于高效的算法和优化的处理流程,使得...

    免费全能OCR工具PandaOCR_2.67_OCR图片文字识别转换软件_pandaocr_

    PandaOCR以其高识别率和便捷的用户体验,在众多OCR软件中脱颖而出。 PandaOCR的核心功能在于它的文字识别能力。这款软件采用了先进的图像处理和机器学习算法,可以精确地识别出图像中的文字,包括各种字体、字号和...

    树洞OCR文字识别一款跨平台的OCR小工具

    7. **效率与准确性**:优秀的OCR软件应具备高识别准确率和快速处理能力。树洞OCR可能采用了先进的算法来提高这些性能指标,使得用户能高效地从图像中提取大量文本。 8. **用户界面**:对于跨平台应用来说,一个简洁...

Global site tag (gtag.js) - Google Analytics