论坛首页 综合技术论坛

百度搜索开放平台的探索和研究

浏览 2477 次
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者 正文
   发表时间:2009-04-30   最后修改:2009-04-30
最近对百度新近推出的搜索开放平台做了一番的探索,归纳如下,欢迎各位拍砖:

1、百度搜索开放平台是一个面向站长和开发者的平台,是百度阿拉丁计划中的一部分。

2、用户注册:

    注册地址:http://alading.baidu.com/register.php

    除了正常的用户名密码外,还需要 身份证号码 和 身份证扫描件,而且必须要提供网站的验证信息,有两种验证方式选择: 一个是 元标记验证 ,另一个是html 页面验证方式.
  
    审核通过,会展示到百度网页搜索结果中,审核不通过,则会在平台中告知未生效原因。

    合作伙伴使用平台无需缴纳费用,但也无法从百度方面获取任何直接收益。

3、资源提交

    ·填写资源名称。
    ·填写更新周期,百度会参考这个时间间隔定期的去检查您所提供的xml数据是否改变。
    ·选择展示模板,选择完展示模板后,需根据模板对应的xml格式部署您的资源。
    ·可以对生效后的资源进行编辑,如果只是编辑资源名称,资源不会失效,继续按照原来的展示方式展示;如果编辑了更新频率、模板或者xml地址的任意一项或多项,则资源需要重新审核。

4、资源展示形式:
   目前看来资源不多,各位可以用百度搜索一下 "万年历" ,"中央电视台节目表"  "意甲积分榜" 等关键字,即可看到效果.


5、对提交资源数据的限制和要求:

    ·目前只接受“确定性”数据资源。“确定性”资源是指标准的、明确的,具有唯一值的数据,例如:“今日人民币汇率”、“本周NBA赛程”等。其它非标准性的数据,将今后逐步放开。
    ·不接受寻址类数据。
    ·数据资源质量需要高于业界同类数据的平均水平。
    ·对于数据,要求精确、全面,并且更新及时。
    ·对于服务,要求高度的稳定性,和快速的响应时间。
    ·一个资源最多能包含10000个数据。如果超过这个阈值,请以一个新资源的形式提交。


6、百度搜索开放平台对于站长或网站的好处:

    1) 指定关键词,更精确、更直接的影响目标用户;
    2) 指定排序位置,更统一、更全面的展现内容;
    3) 指定样式,更丰富、更恰当的适应资源本身,不局限于文字;
    4) 指定更新频率,与百度搜索结果保持及时同步。

7、竞争对手(Google)对比:
    
      从目前百度的展现形式来看,有点类似 Google 的 OneBox ,但 OneBox 的展现形式比百度多得多,而且目前已经涉及到很多领域了.Google OneBox的具体分类和形式可以参看以下链接:
       
     http://suourl.appspot.com/4wj

    Google OneBox 是Google最近一直在宣传的整合搜索的一种表现形式,它与百度这个开放平台最大的不同不在于展现形式,而且Goolge所有的统计数据都是自身收集的,而百度开放平台自身并不收集内容数据,而且从第三方获取数据从而进行展现的,貌似这是百度追赶Google OneBox 搜索最快的一种方式了。


8、个人对百度开放平台的一些看法:

    1)、百度作为在中国通用搜索领域占有70%以上的企业,通过在一定程度地开放自己的网页搜索结果给各大网站和网络应用供应商,可以刺激很大一部份互联网群体积极地为其提供专业以及高质量的数据资源,从而百度可以以非常廉价的成本获取到很多优质的数据源。这个对于提高用户搜索体验来说不能不说是个极好的途径。比如:太平洋网站群可以通过加入这个搜索开放平台,给百度搜索提供各地计算机硬件的报价,通过太平洋网站自身硬件报价渠道的优势,百度自身也能够提供很好的硬件报价的搜索服务了。

    2)、百度官方的说法:
       
      “百度阿拉丁平台的推出,是为解决现有搜索引擎无法抓取和检索“暗网”的信息而来。所谓“暗网”(Hidden Web)是指目前搜索引擎不能检索到的信息,百度认为大量的信息仍然处在 ‘未知世界’ 当中。”
      
      从百度的说法来看,可以认为阿拉丁平台计划是作为百度机器搜索的一个补充,它整合了自身爬虫,索引的数据以及把来自互联网上报的数据整合到自身的搜索结果上,这种获取互联网数据的方式有点类似于 “wiki” 和 “人肉搜索” ,但百度对其内容的要求会更严格而且会有人工校验的操作,所以估计百度最终想要在网页搜索结果里面展现的是 机器搜索 + 人工整理的结果,这样取得的效果应该会比单纯使用机器搜索要好,不能不说百度很好的利用了它在搜索领域的影响力来让各大站点“无偿”地给它提供资源。

    3)、该平台可能面对的积极人群:
        
        (1)、想要快速提高自身影响力的中小型站点;
        (2)、本身在某个领域上游但并未拥有绝对的领先地位的站点;
        (3)、提供专业的咨询、产业资讯、数据以及报告等的专业性的网站和公司,例如:艾瑞 等专业咨询和报告站点;
论坛首页 综合技术版

跳转论坛:
Global site tag (gtag.js) - Google Analytics