最近研究C#相关的OCR技术,图像识别一般C和C++这种底层语言做的比较多,C#主要是依托一些封装好的组件进行调用,这里介绍三种身份证识别的方法。
一:调用大公司API接口,百度、云脉,文通科技都有相关的API介绍。
二:调用图像处理类库,EmguCV是OpenCV的一个跨平台的.Net封装,该封装也可以被编译到Mono平台和允许在Windows、Mac OS、Android、iPhone、iPad等多个平台上运行
三:调用Office2007 组件
一、证件识别API接口
以聚合数据中的API接口为例,因为官方API没有提供C#的调用方式,网址如下:证件识别接口
/// <summary> /// 上传图片 /// </summary> /// <returns></returns> public static string CardUpload() { try { string appkey = "网站自己申请的key"; //配置您申请的appkey HttpPostedFile file = HttpContext.Current.Request.Files[0]; string url = "http://api2.juheapi.com/cardrecon/upload"; var parameters = new Dictionary<string, string>(); parameters.Add("key", appkey); parameters.Add("cardType", "2"); string result = HttpPostData(url, 60000, "pic", file.InputStream, parameters); JObject info = JObject.Parse(JObject.Parse(result)["result"].ToString()); var cardInfo = new { name = info["姓名"], card = info["公民身份号码"] }; return cardInfo.ToJson(); } catch (Exception ex) { return ex.ToString(); } } /// <summary> /// Post调用API /// </summary> /// <param name="url">api地址</param> /// <param name="timeOut">访问超时时间</param> /// <param name="fileKeyName">文件参数名</param> /// <param name="file">文件流</param> /// <param name="stringDict">参数列表</param> /// <returns>结果集</returns> private static string HttpPostData(string url, int timeOut, string fileKeyName, Stream file, Dictionary<string, string> stringDict) { string responseContent; var memStream = new MemoryStream(); var webRequest = (HttpWebRequest)WebRequest.Create(url); // 边界符 var boundary = "---------------" + DateTime.Now.Ticks.ToString("x"); // 边界符 var beginBoundary = Encoding.ASCII.GetBytes("--" + boundary + "/r/n"); // 最后的结束符 var endBoundary = Encoding.ASCII.GetBytes("--" + boundary + "--/r/n"); // 设置属性 webRequest.Method = "POST"; webRequest.Timeout = timeOut; webRequest.ContentType = "multipart/form-data; boundary=" + boundary; //写入开始边界符 memStream.Write(beginBoundary, 0, beginBoundary.Length); // 写入文件 const string filePartHeader = "Content-Disposition: form-data; name=/"{0}/"; filename=/"{1}/"/r/n" + "Content-Type: application/octet-stream/r/n/r/n"; var header = string.Format(filePartHeader, fileKeyName, "card.jpg"); var headerbytes = Encoding.UTF8.GetBytes(header); memStream.Write(headerbytes, 0, headerbytes.Length); file.CopyTo(memStream); // 写入字符串的Key var stringKeyHeader = "/r/n--" + boundary + "/r/nContent-Disposition: form-data; name=/"{0}/"" + "/r/n/r/n{1}/r/n"; foreach (byte[] formitembytes in from string key in stringDict.Keys select string.Format(stringKeyHeader, key, stringDict[key]) into formitem select Encoding.UTF8.GetBytes(formitem)) { memStream.Write(formitembytes, 0, formitembytes.Length); } // 写入最后的结束边界符 memStream.Write(endBoundary, 0, endBoundary.Length); webRequest.ContentLength = memStream.Length; // 构造完毕,执行POST方法 var requestStream = webRequest.GetRequestStream(); memStream.Position = 0; var tempBuffer = new byte[memStream.Length]; memStream.Read(tempBuffer, 0, tempBuffer.Length); memStream.Close(); requestStream.Write(tempBuffer, 0, tempBuffer.Length); requestStream.Close(); var httpWebResponse = (HttpWebResponse)webRequest.GetResponse(); using (var httpStreamReader = new StreamReader(httpWebResponse.GetResponseStream(), Encoding.GetEncoding("utf-8"))) { responseContent = httpStreamReader.ReadToEnd(); } httpWebResponse.Close(); webRequest.Abort(); return responseContent; }
二、EmguCV类库调用
环境搭建
下载地址:EmguCV官网
在File类别下下载这个EXE,进行安装,安装后在目录下能找相应组件,还有些应用的案例。
C#进行识别,需进行图片二值化处理和OCR调用相关DLL可在我整理的地址下载:360云盘 提取码:89f4
dll文件夹中的dll引用到C#项目中,x64,x86,tessdata对应OCR识别的类库和语言库,我tessdata中已添加中文语言包,将这三个文件夹放入程序执行文件夹中。
Demo
自己做的小Demo如图:身份证图片是百度上下载的
相关代码如下:
using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System.Linq; using System.Text; using System.Windows.Forms; using Emgu.CV; using Emgu.CV.OCR; using Emgu.CV.Structure; using System.IO; namespace ImageManage { public partial class Form1 : Form { Image<Gray, Byte> imageThreshold; public Form1() { InitializeComponent(); } private void btn_convert_Click(object sender, EventArgs e) { //第一个参数是语言包文件夹的地址,不写默认在执行文件夹下 Tesseract _ocr = new Tesseract("", "chi_sim", OcrEngineMode.TesseractOnly); _ocr.Recognize(imageThreshold); String text = _ocr.GetText(); this.textBox1.Text = text; } private void pictureBox1_Click(object sender, EventArgs e) { OpenFileDialog of = new OpenFileDialog(); of.Title = "请选择图片"; if (of.ShowDialog() == DialogResult.OK) { string file = of.FileName; Image img = Image.FromFile(file); pictureBox1.Image = img; } Bitmap bitmap = (Bitmap)this.pictureBox1.Image; Image<Bgr, Byte> imageSource = new Image<Bgr, byte>(bitmap); Image<Gray, Byte> imageGrayscale = imageSource.Convert<Gray, Byte>(); imageGrayscale = randon(imageGrayscale); imageThreshold = imageGrayscale.ThresholdBinary(new Gray(100), new Gray(255)); this.pictureBox2.Image = imageThreshold.ToBitmap(); } /// <summary> /// 旋转校正 /// </summary> /// <param name="imageInput"></param> /// <returns></returns> private Image<Gray, Byte> randon(Image<Gray, Byte> imageInput)//图像投影旋转法倾斜校正子函数定义 { int nwidth = imageInput.Width; int nheight = imageInput.Height; int sum; int SumOfCha; int SumOfChatemp = 0; int[] sumhang = new int[nheight]; Image<Gray, Byte> resultImage = imageInput; Image<Gray, Byte> ImrotaImage; //20度范围内的调整 for (int ang = -20; ang < 20; ang = ang + 1) { ImrotaImage = imageInput.Rotate(ang, new Gray(1)); for (int i = 0; i < nheight; i++) { sum = 0; for (int j = 0; j < nwidth; j++) { sum += ImrotaImage.Data[i, j, 0]; } sumhang[i] = sum; } SumOfCha = 0; for (int k = 0; k < nheight - 1; k++) { SumOfCha = SumOfCha + (Math.Abs(sumhang[k] - sumhang[k + 1])); } if (SumOfCha > SumOfChatemp) { resultImage = ImrotaImage; SumOfChatemp = SumOfCha; } } return resultImage; } } }
三、Office 2007组件
该组件免费而且识别度比较高。
环境搭建
Office 2007组件MODI,需要安装Ofiice2007,且由于兼容性需要安装补丁,SP1或者SP2都行,补丁下载地址如下:
SP1下载地址 SP2下载地址
安装后控制面板–>卸载或更新程序–>选择Office2007–>选择更改–>选择添加或修复功能–>弹出下面界面,运行相应组件。
将Office工具–>Microsoft Office Document Imaging 下的工具运行
在C#项目中引用Com组件即可:
如果Office组件应用不是在本地程序而需要部署在IIS上,还需将应用程序的应用池的权限设置为如下图所示:程序应用池–>高级设置–>标识
Demo
StringBuilder sb = new StringBuilder(); MODI.Document doc = new MODI.Document(); doc.Create(fullFileName); MODI.Image image; MODI.Layout layout; doc.OCR(MODI.MiLANGUAGES.miLANG_CHINESE_SIMPLIFIED, true, true); // 识别文字类型 for (int i = 0; i < doc.Images.Count; i++) { image = (MODI.Image)doc.Images[i]; layout = image.Layout; sb.Append(layout.Text); }以上即一些C#进行身份证识别的方法,可根据自己项目的不同需求进行选用。
文章来源:http://www.cnblogs.com/kaoleba/p/5662575.html
相关推荐
身份证图片识别工具C#【标准版】是一款基于C#编程语言开发的应用程序,主要用于自动识别身份证上的文字信息,包括姓名、性别、出生日期、地址、身份证号码等关键字段。这款工具利用了光学字符识别(OCR)技术,可以...
标题中的"C#基于百度飞桨实现的身份证识别源代码"表明了这个项目是使用C#编程语言,并结合了百度的飞桨(PaddlePaddle)深度学习框架来开发的身份证识别系统。飞桨是中国首个开源的深度学习平台,提供丰富的模型库和...
在本项目"基于opencv+cnn的身份证识别.zip"中,我们关注的是利用计算机视觉库OpenCV和卷积...通过以上这些关键技术,"基于opencv+cnn的身份证识别"项目能够实现高效、准确的身份证自动识别,为各类应用场景提供便利。
idCard是一个开源的身份证识别系统,其目标是成为一个简单、高效、准确的非限制场景(unconstrained situation)下的身份证识别库。 相比于其他的身份证识别系统,idCard有如下特点: 它基于openCV这个开源库。这...
总的来说,"C#照片识别人脸截取成身份证比例的证件照"项目涵盖了人脸识别、图像处理、尺寸校准等多个关键技术,利用OpenCvSharp这一强大的图像处理库,实现了从原始照片到符合身份证要求的证件照的自动化转换。...
总结,实现C#身份证识别功能,开发者可以根据项目需求和资源选择合适的方法。调用API接口通常简单快捷,但可能涉及费用和稳定性问题;使用图像处理库如EmguCV则可以实现更复杂的识别逻辑,但需要更多的开发工作;而...
【二代身份证识别DEMO】是基于C#编程语言的一个示例项目,主要目的是演示如何进行二代身份证信息的自动识别和处理。在这个DEMO中,开发者可以了解到如何利用相关的SDK或库来实现身份证图像的捕获、解析以及关键信息...
本项目聚焦于“图片字符识别”、“字符识别”以及“身份证识别”,旨在通过图片处理技术来提取和识别身份证上的信息。以下是这些知识点的详细说明: 1. **图片字符识别**:这是计算机视觉领域的一个子领域,它涉及...
在身份证识别过程中,该工具可能运用了光学字符识别(OCR,Optical Character Recognition)技术,这是一种将图像中的文字转换为机器编码文本的技术。OCR技术通常包括预处理、特征提取、分类器设计和后处理等步骤。...
本项目是基于C#语言,利用Visual Studio 2017开发环境,结合阿里云云市场提供的身份证识别接口,实现对身份证正反面信息的自动识别。以下将详细讲解这个Demo的实现过程和技术要点。 1. **阿里云身份证识别服务** ...
【身份证识别程序】是一种利用计算机视觉和机器学习技术来自动解析和提取身份证图像中的关键信息的应用。这个程序基于Winform平台,提供了一个简洁的用户界面,允许用户通过拖放操作将身份证图片导入,随后程序会...
【C#身份证识别相关技术详解】 身份证识别技术在现代社会中有着广泛的应用,尤其是在身份验证、信息安全等领域。在C#环境中,实现身份证识别主要依赖于OCR(Optical Character Recognition,光学字符识别)技术,...
《基于WinCE6.0的C#身份证验证系统实现》开题报告的目的是构建一个能够验证身份证号码合法性的系统,该系统使用C#语言在Windows Embedded CE 6.0环境下运行。系统的主要功能包括身份证号码的省份验证、出生日期、...
百度OCR作为业界领先的人工智能技术,提供了强大的图像识别功能,特别是在身份证识别方面,能够准确地提取出身份证上的文字信息。 首先,我们需要了解什么是百度OCR。百度OCR(Optical Character Recognition,光学...
本项目“ValidationCodeRecognition_C#_车牌识别_车牌_车牌号识别_验证码识别_”是基于C#语言开发的一套识别系统,主要涵盖了验证码识别和车牌号识别两大功能。 首先,验证码识别是网络安全中的一个关键环节,用于...
在WinCE环境下,利用VS 2005及C#窗体程序设计开发一个身份证号码验证系统,包括身份信息验证及校验码验证,符合GB11643-1999标准。系统能正确识别身份证号码,并将识别成功的信息展示到窗体中,如身份证持有者的所在...
在本案例中,"华视二代身份证阅读器 C#开发包及例子"提供了针对这种硬件设备的C#编程接口和示例源码,使得开发者可以基于C#语言进行二次开发,实现自定义的应用程序功能。 C#是一种由微软公司推出的面向对象的编程...
标题中的"C#神思二代身份证读卡程序 demo"是指一个基于C#编程语言的示例程序,用于演示如何与神思二代身份证读卡设备交互。神思是一家专注于身份识别技术的公司,其二代身份证读卡器能够读取并处理中国第二代身份证...
【C#图片识别】是一种利用计算机视觉和光学字符识别(OCR)技术,从图像中提取文字内容的技术。在本项目中,重点是使用Asprise OCR工具包,这是一款专为C#开发的OCR库,能够读取图片上的数字、英文和符号。对于汉字...