阅读更多

13顶
0踩

互联网

转载新闻 Google提交专利:在图片和视频中辨识文字

2008-01-06 16:26 by 副主编 QQbyte 评论(12) 有4820人浏览
2007年七月Google提交了一份专利,但直到近期才公布专利细节--用robots(网络机器人)读出并分析在图片和视频中的文字。这项(专利的) 申请将被Google拓展到搜索领域,使得图片和视频的内嵌的文字得以依赖其本身来查询,这是先前从没有做到的一个巨大进步。

Information Week认为Google Maps Street View(街道地图查看服务)的隐私问题将变得更加复杂化,就像YouTube视频通过其内嵌的文字将会变得可索引化。专利申请的完整拷贝“在图像中识别文字”在这里可以看到。

世界知识产权组织
来自: solidot.org
13
0
评论 共 12 条 请登录后发表评论
12 楼 KorbenZhang 2008-01-17 06:52
1.Google拥有专利
2.其他公司未必掌握此技术
暂时验证码可以使用
11 楼 comeon 2008-01-16 23:06
曾在前一家公司工作的时候,用到过国外某个技术公司提供的图像(包括文字)识别服务,不过,看了这篇新闻才知道被GOOGLE注册了专利。 呵呵,这种技术倒是挺有价值的。GOOGLE又领先了一步
10 楼 laiseeme 2008-01-15 09:16
看来以后验证码要改了,改成
猜猜图中是什么动物之类的
9 楼 hax 2008-01-15 01:44
验证码现在被明显滥用了,造成了用户体验的显著下降。
8 楼 zhishuren 2008-01-14 10:12
“看来以后验证码要改了,改成
猜猜图中是什么动物之类的”,真搞笑 (:
7 楼 抛出异常的爱 2008-01-08 14:13
中文验证码.....
6 楼 bookong 2008-01-07 17:01
引用
hilliate 2008-01-07 08:46
看来以后验证码要改了,改成
猜猜图中是什么动物之类的

每次都是一个谜语或脑筋急转弯……
5 楼 flymonk 2008-01-07 09:22
识别码其实可以改用手写繁体(比较潦草的那种)或者甲骨文,这个难度就比较大了
4 楼 whale 2008-01-07 09:12
真是厉害~
3 楼 mvmouse 2008-01-07 08:53
识别E文容易,中文的话就复杂很多吧
2 楼 hilliate 2008-01-07 08:46
看来以后验证码要改了,改成
猜猜图中是什么动物之类的
1 楼 rainshow 2008-01-06 20:49
不知道识别能力能达到什么程度?对于复杂验证码的识别不知道效果如何!

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • 这一年,这些书:2022年读书笔记

    Note: 以下 `markdown` 格式文本由 `json2md` 自动转换生成,可参考[JSON转Markdown:我把阅读数据从MongoDB中导出转换为.md了](https://blog.csdn.net/u013810234/article/details/113360229)了解具体的转换过程。...

  • 专利知识

    因为项目组要求整理专利方面的知识,为了完善自己的知识结果,在此整理一些相关的知识。 -------------------- 本文中的所有内容,全部来自于网络,参考链接: 手把手教你写专利申请书·如何...

  • 人工智能的动作来看这四家:百度、谷歌、微软、Facebook

    人工智能的动作来看这四家:百度、谷歌、微软、Facebook 人工智能已经成了兵家必争之地,但说句实在话,也都是准备的姿势。不过,瞭望未来的AI大战,积极的人才、设施、技术储备都是刚需。近日,美国《财富》杂志...

  • 产品读书《大数据时代:生活、工作与思维的大变革》

    谷歌每天在30亿条搜索指令中关注特定的一些检索词条,如“治疗咳嗽和发热的药物”、“流感吃什么好”等等,且并不关注词条的本身,重点在于关注特定的检索词条使用频率与流感在时间和空间上的传播之间的联系。谷歌...

  • 权威发布:新一代人工智能发展白皮书(2017)

    来源:机器人大讲堂指导单位、专家顾问及编写人员顾 问 潘云鹤 中国工程院院士指导单位 工业和信息化部信息化和软件服务业司 指导委员会 谢少锋 工信部信软司司长 李冠宇 工信部信软司副司长 徐晓兰 中国...

  • 信息检索习题

    3.中国专利法在1985年开始实施 4.在会议文献中,常用英文哪个单词表示“专题讨论会”。(单词首字母,请大写)Workshop 5.在CNKI平台下,“主题”检索的内容,不包含以下哪个?(作者) 6.一本印刷的检索工具,其...

  • Android开发项目计划书

    通过手机自带的摄像头进行文字拍照,传入照片后,系统对图片进行扫描,定位,分割,识别,将文字对应的简化字呈现在系统界面中,如图2-1所示。   图2-1 家字的文字演变 (2)能根据查找的文字进行简单的...

  • 中金人工智能报告:AI时代,10 年之后我们还能干什么?|71页完整报告

    随着 2016 年以来人工智能技术在视频分析领域的突破,我们认为视频监控行业正处在第三次重要的升级周期的开始阶段。 (3)智能化:我们认为这次升级主要包括:(a) 前端摄像机的智能化升级以支持结构化数据提取,...

  • 【转】Google Earth究竟是怎样工作的

    【转】Google Earth究竟是怎样工作的 2011-03-03 19:54 版权声明:转载时请以超链接形式标明文章原始出处和作者信息及本声明 http://lichong.blogbus.com/logs/32936586.html [更新]于09年01月23...

  • 《大数据时代:生活、工作与思维的大变革》读书笔记2

    一、第一部分03——更好:不是因果关系,而是相关关系 ...但是在大数据时代,借助着先进的计算技术和存储技术,我们发现,因果关系不再像以前那么重要,反而,一些我们一时得不出结论却能够反映问题的相关关系开...

  • 百度/谷歌/微软/Facebook 人工智能发展方向

    人工智能的动作来看这四家:百度、谷歌、微软、Facebook人工智能已经成了兵家必争之地,但说句实在话,也都是准备的姿势。不过,瞭望未来的AI大战,积极的人才、设施、技术储备都是刚需。近日,美国《财富》杂志...

  • 开发中积累的单词800

    上涨(advance的过去式和过去分词形式) 15, advice [ædˈvaɪs; əd'vaɪs] n. 建议;忠告;劝告;通知 16, advisor [əd'vaɪzɚ] n. 顾问;指导教师;劝告者 17, agent ['eɪdʒ(ə)nt] n. 代理人,代理商;药剂...

  • 大学生信息检索概论练习题

    3.中国专利法在1985年开始实施 4.在会议文献中,常用英文哪个单词表示“专题讨论会”。(单词首字母,请大写)Workshop 5.在CNKI平台下,“主题”检索的内容,不包含以下哪个?(作者) 6.一本印刷的检索工具,其...

  • 国内人工智能行业全梳理

    在东西方神话中,上古「智人」通过各种方法制造「人类」这一物种并赋予其智能;而到了中世纪的欧洲,古典哲学家们尝试着用机械符号处理的观点解释人类大脑的活动;直到 20 世纪 40 年代,来自数学,心理学,工程学,...

  • 走近人工智能

    人工智能 (Artificial Intelligence, AI) 是当前全球最热门的话题之一,是21世纪引领世界未来科技领域发展和生活方式转变的风向标,人们在日常生活中其实已经方方面面地运用到了人工智能技术,比如网上购物的个人化...

  • 原生js图片圆形排列按钮控制3D旋转切换插件.zip

    原生js图片圆形排列按钮控制3D旋转切换插件.zip

  • 类似c++数组的python包

    内含二维数组与三维数组,分别为list2nd,list3rd

  • 原生js颜色随机生成9x9乘法表代码.zip

    原生js颜色随机生成9x9乘法表代码.zip

  • 原生js实现图片叠加滚动切换代码.zip

    原生js实现图片叠加滚动切换代码.zip

  • 【Academic tailor】学术小裁缝必备知识点:全局注意力机制(GAM)TensorFlow

    【Academic tailor】学术小裁缝必备知识点:全局注意力机制(GAM) 注意力机制是深度学习中的重要技术,尤其在序列到序列(sequence-to-sequence)任务中广泛应用,例如机器翻译、文本摘要和问答系统等。这一机制由 Bahdanau 等人在其论文《Neural Machine Translation by Jointly Learning to Align and Translate》中首次提出。以下将详细介绍这一机制的背景、核心原理及相关公式。 全局注意力机制(Global Attention Mechanism, GAM)由 《Global Attention Mechanism: Retain Information to Enhance Channel-Spatial Interactions》提出,是一篇针对计算机视觉任务提出的方法。这篇文章聚焦于增强深度神经网络中通道和空间维度之间的交互,以提高分类任务的性能。与最早由 Bahdanau 等人提出的用于序列到序列任务的注意力机制 不同,这篇文章的重点是针对图像分类任务,并未专注于序

Global site tag (gtag.js) - Google Analytics