摘要: 近日,阿里安全图灵实验室(Alibaba Turing Lab)的ATL Cangjie OCR算法在ICDAR2017的MLT(Competition on Multi-lingual scene text detection)自然场景多语言文本检测竞赛中刷新了世界最好成绩,以73.52%的Hmean排名第一。
原文地址:http://click.aliyun.com/m/43719/
近日,阿里安全图灵实验室(Alibaba Turing Lab)的ATL Cangjie OCR算法在ICDAR2017的MLT(Competition on Multi-lingual scene text detection)自然场景多语言文本检测竞赛中刷新了世界最好成绩,以73.52%的Hmean排名第一。(竞赛结果页面:http://rrc.cvc.uab.es/?ch=8&com=evaluation&task=1)
据了解,ICDAR(International Conference on Document Analysis and Recognition)具有OCR领域的奥斯卡盛会之称,是全球OCR领域公认最权威的比赛之一。
当前,OCR技术被广泛应用于多个领域。从名片、发票、银行卡等票据的数字化到室外街道商店索引,路标路牌识别;再到图片、视频文字内容理解与内容安全,OCR技术都发挥着越来越重要的作用。
阿里安全图灵实验室研究人员称,在技术上,文本检测和识别需要应付各种考验和挑战,如自然场景下光照的影响,物体的遮挡,文字大小、比例、角度的变化,图像视频中文字的模糊等等。ICDAR2017 MLT竞赛包含了中、日、韩、拉丁(英、法、德、意)、阿拉伯和孟加拉等9种语言,其图像采集自各种各样的场景,其中的文本的长度、字体、尺寸、颜色千变万化,同时还包含了许多真实场景的噪声包括光照、遮挡、倾斜、文字堆叠、文字镶嵌、透视变化等等,这对于OCR算法的适应能力更具挑战性。
为攻克这些难题,阿里安全图灵实验室的研究人员设计了基于深度学习的网络模型和算法。
据介绍,图灵实验室的研究人员在文字检测模型方面,采用深度卷积神经网络获得更深层的图像特征;并利用多尺度特征和非对称卷积核获得更好的感受视野,从而适应各种环境,各种大小、比例、角度的文字。此外,由于框架采用创新性的检测策略,因此相较于传统的RCNN-based方案,在检测速度上有很大提升。在文字识别模型,图灵实验室的研究人员在主流方案的基础上,做了全新的探索和研究,从而获得了更为有效的识别模型,在保证识别准确率的前提下,提高了识别效率。
阿里安全图灵实验室研究人员表示,ATL Cangjie OCR提供在线同步、异步通用OCR文字检测和识别服务,以及离线ODPS服务,为图片文字内容理解与内容安全提供强有力的技术支撑。该模型已经全面支撑阿里生态中的商品内容安全、业务安全、平台治理、评价、交互、认证等多个业务场景,同时,还通过阿里云盾-内容安全(绿网)产品,输出给第三方客户使用。
目前,ATL Cangjie OCR服务日均调用量几亿次,可为客户提供稳定的技术保障。
分享到:
相关推荐
GPT-5恐被叫停!马斯克、图灵奖得主等千名专家呼吁暂停超强AI研发
图灵奖 图灵奖 图灵奖 图灵奖 图灵奖 图灵奖图灵奖图灵奖图灵奖
图灵机器人通用操作手册说明书 本说明书对图灵工业机器人的构成、操作等内容进行了全面的说 明。请务必在认真阅读并充分理解的基础上操作本机器人。 维护手册中的图解,为了说明细节取下盖子或安全罩进行绘制,...
除了在计算机科学领域的贡献外,图灵还提出了一个关于机器智能的著名思想实验——图灵测试。在这个测试中,如果一台机器能够在对话中让人类无法分辨其真实身份(即无法判断对方是人还是机器),那么就可以认为这台...
其中,“图灵软件”被誉为最好的电子地图之一,深受用户喜爱。本文将深入探讨图灵软件的功能特性、优势以及如何在实际应用中发挥其最大价值。 首先,图灵软件的精准定位是其核心竞争力之一。通过结合全球卫星定位...
通过模仿游戏的概念,图灵提出了后来被称为“图灵测试”的思想实验。在这个测试中,如果机器能够成功地使询问者无法区分其与人类之间的差异,那么就可以认为这台机器具有某种程度上的“智能”。图灵测试成为了一个...
尽管如此,在这段时间内,图灵展现出了对科学的热情,尤其是在化学实验方面。 #### 对计算机科学的贡献 尽管“计算机科学创始人”这一称号在图灵生前并未被广泛认可,但他确实被认为是现代计算机理论的先驱之一。...
永恒的图灵:20位科学家对图灵思想的解构与超越 作者简介 · · · · · · S. 巴里·库珀(S. Barry Cooper) 本书付梓前不幸逝世。生前为利兹大学数理逻辑教授,欧洲“可计算性学会”主席,“图灵百年委员会”...
图灵生平简介 计算机之父图灵在世界科技世上有很高的地位,不只是因为他对人类的科学做出了巨大贡献,而且在那个战火纷飞的年代,他还曾经帮助盟军破译了德国的密码系统,很大程度上缓解了盟军的压力,也帮助盟军...
图灵机器人,全称为“Turing robot”,是一个融合了图灵测试理念的先进人工智能系统,旨在通过自然语言处理(NLP)、知识库管理和云计算技术,为开发者和合作伙伴提供高效、智能的语义理解和生成能力。这个系统的...
实验室下设的科学家或数学家命名的实验室,如香农实验室、高斯实验室、谢尔德实验室、欧拉实验室和图灵实验室,分别在大数据处理、数据库管理、网络安全、操作系统研发和嵌入式处理器架构等方面进行深入研究。...
图灵Nacos课堂笔记 Nacos是一个动态服务发现、配置管理和服务管理平台,提供了三个核心功能:动态服务发现、配置管理和服务管理。下面将对这三个功能进行详细介绍。 动态服务发现 Nacos提供了动态服务发现功能,...
"鱼鱼图灵识别"是一款专为按键精灵设计的插件,版本号为v1.02。这个工具主要用于图像识别,它能够帮助用户在自动化脚本执行过程中识别屏幕上的特定图像,从而实现更加智能化的控制和交互。在按键精灵的场景下,这种...
《图灵的秘密》是查尔斯·佩佐德(Charles Petzold)撰写的一部英文原著,深入探讨了计算机科学先驱艾伦·图灵(Alan Turing)的思想与成就。这本书对于理解图灵在计算机科学历史上的重要地位以及他对现代计算理论的...
在移动应用开发中,尤其是Android平台,支付功能是不可或缺的一部分。微信支付和支付宝因其广泛的用户基础,通常被视为首选的支付接口。然而,对于个人开发者来说,由于资质限制或审核流程繁琐,有时候无法直接使用...
### 图灵机概念详解 #### 一、图灵与图灵机 图灵机作为现代计算机科学的基础之一,其重要性不言而喻。这一理论模型由英国数学家阿兰·图灵(Alan Turing)于1936年提出,为理解和定义计算的本质提供了框架。图灵...