`
wx1568016009
  • 浏览: 23327 次
文章分类
社区版块
存档分类
最新评论

四行Python代码,你也能从图片上识别文字!

阅读更多

图像识别、文字识别,这些都是现在比较火的东西,现在大部分的AI都有在做这些东西,那我们就过来了解一下吧!

只需要四行代码,完成从图片中读取图片中的文字!

准备工作: 

我们需要两个安装包,先来安装一下:

pip install pillow

640?wx_fmt=png

pip install pytesseract

640?wx_fmt=png

安装完之后,我们需要下载Tesseract-OCR这个软件,这里我已经将东西都打包好了放在百度云中,大家可以直接下载:

链接

https://pan.baidu.com/s/1osNf95ScZJYhtzsGFLtxaA

密码

npmn

打开安装包,一路next

640?wx_fmt=png

记录好自己的安装路径

640?wx_fmt=png

安装完之后找到tessdata目录下,将下载的chi_sim.traineddata文件放到该目录下。这样它就能识别中文了。

640?wx_fmt=png

之后,我们只剩下一个东西要配一下了,在pytesseract模块中pytesseract.py文件中去配置一下Tesseract-OCR的工作目录,这个时候我们可以通过刚刚pip安装的位置找到pytesseract.py文件,如下图:

640?wx_fmt=png

进入目录找到pytesseract.py文件并且打开它:

640?wx_fmt=png

将tesseract_cmd这个变量的值改成Tesseract-OCR的安装目录即可。

现在,我们在准备一张图片,用来识别,小编就用微信截图好了,放置在桌面文件夹上:

640?wx_fmt=png

开始代码:

到这里,我们所有的预备环境以及全部搭建好了,下面我们就开始来敲代码咯:

640?wx_fmt=png

from PIL import Image

import pytesseract

pic_content=pytesseract.image_to_string(Image.open('C:\\Users\\yuqing.wu\\Desktop\\all\\3.png'),lang='chi_sim')

print(pic_content)

我们来看看运行结果:

640?wx_fmt=png

结果还是比较准的。

大家也来试试吧!

像这样的图像识别还是挺重要、挺常用的,例如图片验证码等等,都是可以去完成的,就看大家怎么去用了!

640?wx_fmt=jpeg

感兴趣的扫个二维码吧!

分享到:
评论

相关推荐

    python识别提取图片jpg中指定位置的文字,并修改文件名为改文字

    在本项目中,我们主要探讨如何使用Python编程语言结合OCR(Optical Character Recognition,光学字符识别)技术来识别并提取图片中的文字,并根据提取到的文字信息来修改图片文件的名称。这个过程对于处理大量含有...

    python代码使用pyautogui截图并进行通过easyocr文字识别.py

    python使用pyautogui截图并进行文字识别.py

    python图片识别OCR源码

    Python图片识别OCR技术是计算机视觉领域的一个重要应用,它允许我们从图像中提取文本信息,这对于自动化处理、信息检索和数据分析等任务具有极大价值。在Python中,有许多库支持OCR(Optical Character Recognition...

    讯飞图片转文字ocr接口实例python3.X

    2. **导入SDK**:在Python代码中,导入讯飞OCR相关的模块。 ```python from iflytek.cloud import SpeechClient, Auth ``` 3. **配置认证信息**:使用appid和app_key初始化Auth对象,然后创建SpeechClient对象。...

    python 提取照片jpg/png的文字内容,手写文字识别度非常高,提供界面操作可以实现批量提取

    1. **Python OCR技术**:使用腾讯云的OCR接口,实现了从JPEG和PNG图片中准确识别文字,特别是手写文字,提高了文字提取的准确性。 2. **腾讯云服务**:利用腾讯云的API,开发者可以轻松接入其OCR服务,减少了自建...

    代码分享:基于python的文字识别和情感分析系统

    该系统结合了文字识别技术和情感分析算法,能够自动从图片中提取文本信息,并对其进行深入的情感分析,从而帮助用户更好地理解文本内容,并据此做出决策。 二、功能特点: 1、文字识别:系统采用先进的OCR(Optical ...

    python_python识别文字_python_场景文字识别_

    近年来,随着大量的互联网图片爆炸式增长,自然场景中的文字检测及识别成为文字识别乃至计算机视觉领域一个极其重要和广受关注的热点研究课题。在本课程设计中,将针对scikit-learn自带的数据集(手写数字样本),...

    win7 python3.6 调用百度AI进行 图片 文字 识别

    在本文中,我们将深入探讨如何在Windows 7操作系统上,使用Python 3.6版本调用百度AI的图像文字识别服务。这个过程涉及到的主要知识点包括Python编程、百度AI的API接口以及图像处理。 首先,我们需要了解Python 3.6...

    pythonOCR图片文字识别.zip

    在本例程中,“pythonOCR图片文字识别.zip”压缩包包含了一个使用Python进行OCR操作的示例项目。这个项目对于学习如何在Python环境中处理图像中的文字识别非常有帮助。 首先,我们来看“test01.py”,这应该是一个...

    基于python使用百度paddleocr实现图片文字识别与替换(源代码)

    作用:如果你需要对图片上的文字进行,那么本程序或许能帮到你,paddleocr是百度开源的免费的ocr库,识别效果非常不错,基本上常见的语言如中文、英文都能准确识别,当然其识别的置信度和图片质量也有一定关系,所以...

    基于PyQt5+Python实现的OCR文字识别系统源码(含GUI界面).zip

    基于PyQt5+Python实现的OCR文字识别系统源码(含GUI界面).zip基于PyQt5+Python实现的OCR文字识别系统源码(含GUI界面).zip基于PyQt5+Python实现的OCR文字识别系统源码(含GUI界面).zip基于PyQt5+Python实现的OCR文字...

    python百度paddle表格文字识别生成excel

    标题中的“python百度paddle表格文字识别生成excel”是一个关于使用Python编程语言,结合百度的PaddleOCR(PaddlePaddle深度学习框架)进行表格文字识别,并将识别结果转化为Excel文件的项目。这个项目旨在帮助用户...

    识别图片中的文字代码

    本话题主要聚焦于如何从图片中识别文字,也就是我们常说的OCR(Optical Character Recognition)技术。在本案例中,我们将利用百度云提供的SDK来实现这一功能。下面将详细介绍这个过程。 首先,我们要了解OCR技术的...

    python ocr识别文字识别图片百度ai.doc

    文本描述“python ocr识别文字识别图片百度ai.doc”进一步强调了我们将使用 Python 实现 OCR 文字识别,并且将使用百度 AI 平台来识别图片中的文字。 标签解释 标签“python 文字识别 ai”表明了我们将使用 Python ...

    python 声音识别,转换为文字。

    在Python编程环境中,声音识别并将其转换为文字是一项常见的任务,尤其在语音识别软件、智能助手和自动会议记录等场景中。本主题将深入探讨如何使用Python实现这一功能,主要涉及以下几个关键知识点: 1. **音频...

    17.将图像转换为文字 python代码实现

    在"chapter_17"这个压缩包文件中,可能包含了相关的Python代码示例、数据集、模型配置文件等资源,读者可以通过阅读和运行这些文件,进一步理解和实践图像转文字的深度学习方法。学习这个主题不仅可以帮助你掌握深度...

    批量文字识别_Python图片识别_批量_文字识别api_文字识别_

    本教程主要探讨如何使用Python编程语言结合百度API实现批量图片的文字识别,并将结果整理成Word文件。 首先,我们要了解批量文字识别的基本流程。这通常包括以下几个步骤: 1. **图像预处理**:在进行文字识别之前...

    python文字识别.rar

    4. 使用pytesseract进行识别:在Python代码中,你可以使用pytesseract模块的`pytesseract.image_to_string()`函数将图像转换为文字。例如: ```python import pytesseract from PIL import Image img = Image.open...

    Python文字识别

    在文字识别方面,OpenCV可以与Tesseract OCR(Optical Character Recognition,光学字符识别)结合使用,实现从图像中提取并识别文字。 首先,我们需要了解基本的图像预处理步骤。在文字识别中,预处理至关重要,...

    简单的车牌识别-python源码.zip

    在本资源中,"简单的车牌识别-python源码.zip" 是一个包含Python代码的压缩包,主要用于教授和学习车牌识别的基本概念和技术。车牌识别是计算机视觉领域的一个重要应用,广泛用于智能交通系统、停车场管理等场景。这...

Global site tag (gtag.js) - Google Analytics