`

php实现ocr文字识别

    博客分类:
  • php
阅读更多

 OCR的百度定义 (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法 将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成 文本格式,供文字处理软件进一步编辑加工的技术。

 

作为一个工程师,在实际编程中,可能需要把图片中的文字显示出来,这就需要用到ocr技术。因为php开发,所以优先选择php,找了php的ocr扩展测试了下,结果发现不可用(地址:http://sourceforge.net/projects/phpocr.berlios)? 网上也看了很多朋友的demo,基本上原理都是对图片分解成0,1矩阵,然后根据特征,转化成相应的字符串。测试几个都是不可行的。然后看到别人说PHP 搞OCR的很少,也不适合,语言效率太低,这种算法需要很高的效率。可以尝试C,MATLAB 等的OCR算法。搞matlab的玩OCR这类偏算法的很多。

 

无奈才虚学浅,不会C。无意中却发现百度有ocr的api提供:http://apistore.baidu.com/apiworks/servicedetail/146.html。

 

写了个玩下:

 

  1. <?php
  2. header("Content-type: text/html; charset=utf-8");
  3.  
  4. function curl($img){
  5.  
  6. $ch = curl_init();
  7. $url ='http://apis.baidu.com/apistore/idlocr/ocr';//百度ocr api
  8. $header = array(
  9. 'Content-Type:application/x-www-form-urlencoded',
  10. 'apikey:69c2ace1ef297ce88869f0751cb1b618',
  11. );
  12.  
  13. $data_temp = file_get_contents($img);
  14. $data_temp = urlencode(base64_encode($data_temp));
  15. //封装必要参数
  16. $data ="fromdevice=pc&clientip=127.0.0.1&detecttype=LocateRecognize&languagetype=CHN_ENG&imagetype=1&image=".$data_temp;
  17. curl_setopt($ch, CURLOPT_HTTPHEADER , $header);// 添加apikey到header
  18. curl_setopt($ch, CURLOPT_POST,1);
  19. curl_setopt($ch, CURLOPT_POSTFIELDS, $data);// 添加参数
  20. curl_setopt($ch, CURLOPT_RETURNTRANSFER,1);
  21. curl_setopt($ch , CURLOPT_URL , $url);// 执行HTTP请求
  22. $res = curl_exec($ch);
  23. if($res === FALSE){
  24. echo "cURL Error: ". curl_error($ch);
  25. }
  26. curl_close($ch);
  27. $temp_var = json_decode($res,true);
  28. return $temp_var;
  29.  
  30. }
  31.  
  32. $wordArr = curl('4.jpg');
  33. if($wordArr['errNum']==0){
  34. var_dump($wordArr);
  35. }else{
  36. echo "识别出错:".$wordArr["errMsg"];
  37. }

测试了几张图片,准确度还是蛮高的。百分百的话,是不现实的~

 

更多:http://www.webyang.net/Html/web/article_161.html

0
1
分享到:
评论

相关推荐

    PHP+百度AI OCR文字识别实现了图片的文字识别功能

    以下内容将详细介绍如何通过PHP语言与百度AI OCR服务结合实现图片文字识别的步骤: 1. 获取百度AI开放平台的三个关键信息 - 在开始前,需要在百度AI开放平台注册账号,以获取必要的API调用凭证,包括应用的APP_ID...

    百度OCR高精度文字识别利用php进行对接图片转换文字在线识别文字

    在本项目中,我们将探讨如何使用PHP语言对接百度OCR服务,实现在线文字识别和图片转文字的功能。 首先,我们需要了解百度OCR API的基本概念。百度OCR提供了多种类型的识别服务,包括通用文字识别、表格识别、身份证...

    Java 版 OCR印刷文字识别接口

    本文主要介绍一个基于Java的OCR印刷文字识别接口,该接口利用了阿里巴巴提供的API,并进行了优化,使其更易于理解和使用,特别适合初学者。 首先,我们要理解OCR的基本原理。OCR技术通过分析图像中的形状、线条和...

    php百度批量图片文字识别应用Ocr,获取需要的文字改文件名

    本项目是关于如何在PHP环境下利用百度的OCR API进行批量图片文字识别,并根据识别结果修改文件名的应用。 首先,我们要了解百度OCR服务。百度提供了丰富的OCR API,包括通用文字识别、表格识别、身份证识别等多种...

    基于腾讯云ocr识别接口做的识别工具(自动识别图片、证件、车牌、身份证等)

    首先,**腾讯云OCR接口**是腾讯提供的一个强大服务,它利用深度学习算法,提供了高精度的文字识别能力。接口涵盖了多种场景,包括通用文字识别、表格识别、手写文字识别、身份证识别、行驶证识别、驾驶证识别、营业...

    php图文识别OCR类

    这里我们将深入探讨如何在PHP中实现图文识别,主要基于提供的“php图文识别OCR类”。 首先,`OCR.class.php`文件是这个OCR类的核心,它可能包含了OCR的初始化、识别函数以及其他辅助方法。类中的关键方法可能包括`...

    可以直接使用的百度文字识别源代码(车牌识别)

    “OCR”是实现文字识别的技术手段,通常涉及到图像处理和深度学习算法;“车牌识别”则是应用领域,意味着此代码主要用于自动识别车辆的车牌号码。 【文件名称列表】 尽管只有一个文件名“百度文字识别”,但可以...

    百度Ocr识别 Tp5 实例

    百度Ocr识别 Tp5 实例,已完成基于Tp5使用的第三方库的封装,下载资源解压至extend, 解压后目录: 项目更目录/extend/Ai;控制器使用实例参考项目更目录/extend/Ai/demo.php

    html+php+百度ocr身份证识别上传返回数据,支持压缩保存缩率图

    在IT行业中,HTML、PHP和百度OCR技术的...综上所述,这个项目展示了如何整合前端HTML、后端PHP和云服务OCR技术,实现身份证拍照识别并进行有效数据管理。这样的系统在身份验证、实名认证等场景下具有很高的实用价值。

    百度OCR-身份证图片识别源码

    这项技术基于深度学习,具有高精度和快速响应的特点,尤其适用于身份证、营业执照、银行卡等证件的文字识别。 在身份证识别中,百度OCR能够准确识别身份证上的姓名、性别、出生日期、住址、身份证号码等关键信息。...

    按键精灵图像识别插件

    //识别所设定区域的文字,返回识别到的文字 SetDict("我的字库.mdb");//设置字库路径,支持数据库和文本2种格式,默认路径为插件同一目录,默认名称为default_Dict.txt SetFontColor("FF00ff");//设置要识别的文字...

    OCR文字识别.zip

    对于有一定基础或热衷于研究的人来说,可以在这些基础代码上进行修改和扩展,实现其他功能。【沟通交流】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。鼓励下载和使用,并欢迎大家互相学习,共同进步...

    PHP实现提取图片文字的示例代码,支持多张图片提取文字

    然后,我们定义了多张图片的路径,并遍历这些图片路径,调用OCR SDK提取图片文字,并输出提取的文字。 需要注意的是,OCR SDK需要从百度AI平台获取,需要先注册百度AI平台账号并创建OCR应用,然后获取API Key和...

    OCR:腾讯云OCR文字识别

    腾讯云OCR文字识别服务是一款高效、准确的光学字符识别(Optical Character Recognition,简称OCR)技术,它能够将图像中的文字自动转换为可编辑的文本格式。这款服务适用于各种场景,如身份证、营业执照、发票、...

    百度AI文字识别,各种接口

    首先,我们要理解什么是文字识别(OCR,Optical Character Recognition)。这是一种技术,能将图像中的打印或手写文字转换成机器可编辑的文本格式。百度AI的文字识别服务不仅限于简单的印刷体文字,还包括表格、手写...

    tesseract-ocr-for-php-master.zip

    **Tesseract OCR for PHP**是将Tesseract OCR引擎与PHP编程语言相结合的工具,使得开发者能够在PHP项目中方便地实现图像文字识别功能。Tesseract OCR是Google维护的一个开源项目,它能够从图像中识别出印刷体文本,...

Global site tag (gtag.js) - Google Analytics