`
xuanzhui
  • 浏览: 201475 次
  • 性别: Icon_minigender_1
  • 来自: 苏州
社区版块
存档分类
最新评论

Python识别身份证号码

OCR 
阅读更多

用到了两个重要的库,以下以MacOS系统为例

 

1. ImageMagick,用于对图片进行预处理

安装

brew install ImageMagick

 

再下载针对文本图片清理的脚本   textcleaner

增加可执行权限

chmod +x textcleaner

 

测试一下效果,原始图片



 

执行命令

./textcleaner -g -e normalize -f 50 -o 12 -s 2 id-test3.png user_id_cleaned.png

得到新图片


 效果非常明显。

 

2. pytesseract,用于识别文字

pytesseract依赖于Google tesseract-ocr

brew install tesseract

 

再安装 pytesseract

pip3 install pytesseract

 

识别代码

print(pytesseract.image_to_string(Image.open('user_id_cleaned.png')))

 

3. 完整代码

 

# -*- coding: utf-8 -*-
from PIL import Image
import pytesseract
import subprocess
import shlex

source_file = 'id-test3.png'
cmd = f'./textcleaner -g -e normalize -f 50 -o 12 -s 2 {source_file} user_id_cleaned.png'
print('cleaning image for text')
subprocess.run(shlex.split(cmd))

print('recognizing text from image')
print(pytesseract.image_to_string(Image.open('user_id_cleaned.png')))

 

 

 

 

 

 

  • 大小: 275.4 KB
  • 大小: 3 KB
分享到:
评论

相关推荐

    python版身份证识别算法

    Python版身份证识别算法是利用计算机视觉和机器学习技术来自动识别身份证件上的文字信息,尤其在现代社会中,这种技术有着广泛的应用,例如在银行开户、网络注册、酒店入住等场景。该算法通常包括图像预处理、字符...

    Python-CardOcr身份证识别OCR

    该项目利用了Python强大的图像处理库和OCR技术,使得程序能够高效准确地提取身份证上的关键信息,如姓名、性别、出生日期、地址以及身份证号码等。 首先,我们需要了解OCR(Optical Character Recognition)技术,...

    Python身份证识别系统源码,精准度很高.zip

    例如,系统可能预先定义好身份证号码的格式,然后通过比对识别出的文字与预设格式,进一步提高识别的准确性。 文件名"IDRecognition-main"暗示了这是项目的主目录,其中可能包含了源代码、训练数据、配置文件、模型...

    python ocr识别证件号码,识别验证码,调用摄像头

    3、运行IDrec.py,进行身份证识别 功能1:图片处理后识别 功能2:图片直接识别 功能3:视频在线识别 加: 1、中文文字识别(下载chi_sim.traineddata中文文字库:https://tesseract-ocr.github.io/tessdoc/Data-Files...

    python 身份证号码识别地区真伪(附图表)

    以下是一些关于如何使用Python来识别身份证号码真伪、获取年龄、性别以及地区的详细知识点。 1. **身份证号码结构**: - 中国居民身份证号码由18位数字组成,前6位代表行政区划代码,接着8位是出生日期码,第17位...

    opencv-python、pytesseract身份证识别,正面、反面

    使用opencv-python +pytesseract 身份证识别正反面,包含姓名、身份证号、性别、详细地址。 1、所需库:pytesseract.py 安装:pip3 install pytesseract pip3 install opencv-python==3.4.8.29 2、中文文字识别...

    Python+Opencv身份证号码区域提取及识别实现

    ### Python+OpenCV身份证号码区域提取及识别实现详解 #### 一、背景介绍 随着人工智能技术的发展,图像处理和模式识别技术在各个领域得到了广泛的应用。身份证号码的自动识别不仅能够提高工作效率,还能减少人为...

    根据身份证号判断出生日期和性别

    标题中的“根据身份证号判断出生日期和性别”指的是在编程中通过身份证号码(ID Number)来获取个人的出生日期和性别的技术。在中国,身份证号码是18位数字,其中包含了个人信息,包括地区代码、出生日期和顺序码等...

    python mxnet框架下机器学习识别身份证号码.zip

    在这个“python mxnet框架下机器学习识别身份证号码”的项目中,我们主要探讨的是如何利用MXNet实现对身份证号码的自动识别。这涉及到计算机视觉(CV)和自然语言处理(NLP)领域的交叉应用,因为身份证号码既包含...

    OCR身份证识别代码(基于Python代码)

    OCR身份证识别代码(基于Python代码)不采用任何第三方控件或代码。采用深度学习方法还有优化空间,特别适合需要发表小论文的人,可在本算法的基础上做微调,进一步完善,可显著提升识别效果。拍照的照片要正面,...

    Python识别身份证信息(有误差)

    该示例代码展示了如何使用 Python 和相关库识别身份证上的信息,涉及了图像预处理、图像校正、以及文字识别等多个关键步骤。通过这些步骤,可以有效提高识别的准确率。然而,在实际应用中,还需要针对具体情况进行...

    东信身份证阅读器Python开发包,支持自动读卡实现身份证信息提取

    3. **信息解析**:读取到的信息以二进制形式传输,开发包会将其解码为人类可读的文本格式,如姓名、性别、身份证号码等。 4. **错误处理**:在实际应用中,可能遇到设备未连接、读卡失败等情况,开发包应包含完善的...

    Python+Opencv身份证号码区域提取及识别实现 .zip

    前端时间智能信息处理实训,我选择的课题为身份证号码识别,对中华人民共和国公民身份证进行识别,提取并识别其中的身份证号码,将身份证号码识别为字符串的形式输出。现在实训结束了将代码发布出来供大家参考,识别...

    毕业设计:python基于深度学习的身份证识别考勤系统(源码 + 数据库 + 说明文档)

    毕业设计:python基于深度学习的身份证识别考勤系统(源码 + 数据库 + 说明文档) 相关工具及技术说明 3 2.1 B/S访问结构 3 2.2 VS Code简介 4 2.3 MySQL数据库 4 2.4 Python语言介绍 4 3 需求分析 5 3.1界面设计 5 ...

    Python+Opencv身份证号码区域提取及识别实现 1.zip

    前端时间智能信息处理实训,我选择的课题为身份证号码识别,对中华人民共和国公民身份证进行识别,提取并识别其中的身份证号码,将身份证号码识别为字符串的形式输出。现在实训结束了将代码发布出来供大家参考,识别...

    身份证批量识别 OCR身份证识别

    身份证批量识别 免费 身份证OCR 使用的是腾讯的识别引擎 百度盘链接:https://pan.baidu.com/s/1uTnkYXh8jBcaeda-JoQDuQ 提取码:jbkv

    QT+opencv+OCR 身份证号码,银行卡号识别

    QT+OpenCV+OCR 身份证号码与银行卡号识别技术是计算机视觉领域的一个重要应用,主要用于自动识别图像中的文字信息。在这个特定的项目中,我们看到一个利用QT图形界面库,OpenCV图像处理库,以及OCR(Optical ...

    win7 python3.6 调用百度AI进行 身份证信息 识别

    在本文中,我们将深入探讨如何在Windows 7操作系统上,使用Python 3.6版本调用百度AI的API来识别身份证上的信息,包括正面和反面。这涉及到图像处理、机器学习以及API调用等技术。 首先,我们需要了解的是百度AI的...

    基于深度学习 CTPN(定位) + DenseNet(识别) 的身份证识别系统python源码.zip

    基于深度学习 CTPN(定位) + DenseNet(识别) 的身份证识别系统python源码.zip基于深度学习 CTPN(定位) + DenseNet(识别) 的身份证识别系统python源码.zip基于深度学习 CTPN(定位) + DenseNet(识别) 的身份证识别系统...

Global site tag (gtag.js) - Google Analytics