`

图片搜索

阅读更多

网站搜索引擎是如何实现图片搜索的?

 

抓取网页主要是关键字,抓取图片应该是alt,他有自己的数据库,抓取过后截取字符串进行归类,这是我想的哈,如何抓取好像是靠机器人蜘蛛程序

每张图片都必需添加alt信息,信息最好是精炼过的关键字,图片面后应该包含一些图片描述性的文字,图片应该带有链接,正文为缩略图,点击链接后显示大图。

网站的图片是非常耗费流量的,比如两天的时间博客有20G的访问流量,图片所在的目录upload占用了18.6G,而文章所在目录只用了1.3G流量,可见图片占用流量资源之巨大,这也就是很多人都喜欢将图片文件放在第三方免费网络相册的原因。那么将图片存储在自己的网站空间,反而可以利用搜索引擎的图片搜索给自己带来不少额外流量,这里的搜索引擎指的是Google的图片搜索,而不是百度,因为百度采用盗链机制,其图片搜索基本上不会给网站带来什么页面流量的。

每次上传图片时都定义了一个或几个关键字存在数据库里,库里每条记录的关键字都有对应的图片地址,搜索时输入这个关键字就可以找到这张图片。

用户向搜索引擎表达他的需求,搜索引擎理解用户需求,提供各不同的需求下的资源,这整个过程可统称为需求满足。简单说,就是除了基础文字相关性之外的rank工作,都属于需求满足的范畴,也就是说,提供给用户的检索结果,不仅仅要求在字面上是和用户输入的文字相关的,还要满足用户的各种不同需求。

用户通过query表达了自己的需求,而对于大部分query来说,尤其是具有隐含需求的query,仅仅字面匹配的查询结果未必能够满足其需求。目前我们的排序系统是主要是基于文本相关性这个维度的,权值体现了query中的termobj的相关程度,在这个体系下,相关的结果未必能够满足用户需求。

Image需求满足,按照不同的维度,可以划分为如下几个方面: a.需求识别

  b.资源建设  c.需求调权 d.结果组织与推荐 e.用户引导交互

需求满足要解决的核心问题:需求识别/资源建设/需求调权

需求的识别

识别query有哪些需求,以及需求的强弱,是最基础的工作。首先要有需求的体系,能完备的描述各种需求,其次是如何识别这些需求,把每个query的需求对应到这个体系中去。

基于统计的需求识别  通过对大量的数据统计分析,可以识别出query有哪些方面的共性。可供分析的数据很多,比如用户行为数据,点击反馈,检索结果等。

专名&需求词判断query中包含专名或者需求词等关键词,是最直接的方式。比如章鱼保罗头像,用户在query中显示的表达了头像方面的需求,其中就包含了尺寸方面的需求,头像是需要小尺寸的图,如右图所示,这时候出一张大的图片就不符合用户需求了

时效性需求:主要是通过用户检索量的突发以及资源数的突发来判断

检索量的突发,可以通过累积每个query的每天的用户检索频率,用连续多天的用户检索频率,计算当天检索量和历史比较,是否有突发,进而判断是否有时效性需求的强弱。资源数方面的判断,可通过类似的方式挖掘

识别出query有哪些需求,下一步的工作就是提供相应的资源

如何获得满足需求的资源,是需求满足的另一个核心问题。在资源上,通过某一个或者几个特征组合,能够把满足要求的资源和不满足要求的资源区分开,找到用户需求需要的资源,去掉不满足要求的资源,是主要的工作。

内容属性特征对于底层的物理特征,相对比较简单,包括尺寸,颜,格式,清晰度饱和度等,中层特征,有人与非人的,色    情图片的,整车的识别,手机图片的识别等;对于高层的语义特征,包括场景的识别,图片风格的识别,情感的识别,比如是室内还是室外,是否非主流风格等,都可以作为资源筛选的特征。

话题属性维度话题属性维度,是指动物,植物,帅哥,美女,军事,体育等等各种不同的话题,我们希望把图片能按照这样一个分类进行一个划分

时效性资源,可以很容易的通过收录时间来判断,和非时效性资源区分开

 

 

 

分享到:
评论

相关推荐

    android网络图片搜索源代码

    在Android开发中,网络图片搜索是一项常见的功能,它涉及到网络请求、数据解析、图片加载以及内存和磁盘缓存等多个方面。本项目“android网络图片搜索源代码”着重于实现这些核心功能,并针对性能进行了优化。 首先...

    PHP图片展示系统PicHome图片搜索引擎源码 v3.1 Beta版.rar

    欧奥PicHome的用途就是作为已有图库的展示门户,或者图片搜索引擎来使用。例如以下场景,某企业的宣传设计品是由设计部的几个人员管理。企业的其他部门和产品代理商遍布在全国各地,会经常需要获取产品各类设计素材...

    相似图片搜索原理源码-Java实现

    Google "相似图片搜索":你可以用一张图片,搜索互联网上所有与它相似的图片。 这种技术的原理是什么? 计算机怎么知道两张图片相似呢? 根据Neal Krawetz博士的解释,原理非常简单易懂。 我们可以用一个快速...

    AliPrice中国进口图片搜索-3.0.4.zip

    名称:AliPrice中国进口图片搜索 ---------------------------------------- 版本:3.0.4 作者:AliPrice.com 分类:商业购物 ---------------------------------------- 概述:AliPrice以图搜货神器可以让你轻松地...

    vb.net 网络图片搜索蜘蛛

    【VB.NET网络图片搜索蜘蛛】是一种使用VB.NET编程语言实现的简单程序,它能够自动在网络上爬取指定网站的图片资源。这个程序的核心功能是模仿蜘蛛爬虫的行为,遍历网页,寻找并下载其中的图像文件。对于初学者或对...

    网络图片搜索

    在IT行业中,网络图片搜索是一项重要的技术,它使得用户能够通过关键字轻松地在互联网上查找相关的图像资源。本文将深入探讨网络图片搜索的工作原理、关键技术及其应用。 首先,网络图片搜索的基本过程涉及到搜索...

    java图片搜索源码(初学者)

    在Java编程语言中,开发一个图片搜索应用是一个学习和实践的好项目。这个“java图片搜索源码(初学者)”的程序可能包含了实现文件搜索、图像处理和匹配的基础功能,适用于初学者熟悉Java的核心概念以及文件I/O和...

    动漫图片搜索下载,android app

    标题中的“动漫图片搜索下载,android app”表明这是一个专为Android设备设计的应用程序,主要功能是让用户能够搜索和下载动漫相关的图片。这个应用可能包含了丰富的动漫资源,涵盖了各种类型的动漫角色,满足用户对...

    基于图向量和向量数据库的图片搜索引擎

    基于图向量和向量数据库的图片搜索引擎 本项目实现原理如图所示,过程包括加载图片 -> 读取图片 -> 特征提取 -> 存储到向量数据库 -> 待检索图片 -> 在图片向量库中匹配出与待检索图片向量最相似的 top n个 -> 匹配...

    文件搜索,图片搜索

    在IT领域,文件搜索和图片搜索是日常工作中非常常见的需求,尤其对于大型组织和个人用户而言。这些功能使得用户能够高效地定位和管理大量的数据资源。本文将深入探讨这两个主题,并结合压缩包文件“DemoImg”来阐述...

    图片搜索引擎网站模板

    图片搜索引擎网站模板是一款绿色简洁的图片照片搜索网站模板下载。

    相似图片搜索原理 Java实现源码

    Google "相似图片搜索":你可以用一张图片,搜索互联网上所有与它相似的图片。 这种技术的原理是什么?计算机怎么知道两张图片相似呢? 根据Neal Krawetz博士的解释,原理非常简单易懂。我们可以用一个快速算法,...

    Google图片搜索器

    "Google图片搜索器"是一款基于Google搜索引擎的工具,专门用于搜索和查找互联网上的图像资源。这个工具可能包含了一些特定的功能,比如关键词输入、高级搜索选项、图像上传以进行相似图搜索,甚至可能支持批量下载等...

    图片搜索浏览程序

    【图片搜索浏览程序】是一种应用程序,它允许用户方便地搜索和浏览存储在本地或网络上的图像文件。这种软件通常具备高效检索和分类功能,让用户能够快速找到所需的图片。结合给出的标签“源码”和“工具”,我们可以...

    图片搜索(java实现)

    这是一个用pHash算法实现的图像搜索实例,供大家相互学习参考。

    百度图片搜索页的图片展示列表模块jquery效果

    模仿现在的百度图片搜索结果的一款效果,用户体验较好 鼠标悬停在图片列表上后,当前图片以当前位置固定居中,然后逐渐向外变大   使用方法: 1、将附件中的css样式以及js代码拷贝到你的网页中 ...

    表情大全源码,图片表情制作,QQ斗图生成,搜狗图片搜索-PC+移动自适应

    可以给自己网站吸粉,源码是自适应的手机也可以浏览! 源码集成了搜狗搜索图片接口,可以一键搜索百万图片,还有表情制作等模块

    百度图片搜索器

    "百度图片搜索器"是一款基于Web的图片搜索应用,它主要功能是帮助用户方便快捷地在互联网上查找和浏览各种图片资源。这个程序可能利用了百度搜索引擎提供的API接口,允许用户根据关键词、分类或者特定条件进行图片...

    毕设图片搜索引擎

    【毕设图片搜索引擎】是一个基于颜色直方图法的Java实现项目,旨在为用户提供一个简易的图片搜索功能。颜色直方图是图像处理领域中一种常见的特征提取方法,它通过统计图像中各颜色分量(如红、绿、蓝)的分布情况来...

    JAVA根据图片搜索原理实现 项目附带图片非常完整适合学习

    关键技术:"感知哈希算法"(Perceptual hash algorithm),它的作用是对每张图片生成一个"指纹"(fingerprint)字符串,然后比较不同图片的指纹。结果越接近,就说明图片越相似。

Global site tag (gtag.js) - Google Analytics