`
android_madness
  • 浏览: 39903 次
  • 性别: Icon_minigender_1
  • 来自: 福州
社区版块
存档分类
最新评论

(转)百度蜘蛛来你家了吗

阅读更多
如何查看百度蜘蛛是否来过我的网站,尤其对于长期不收录,百度快照不更新的新站来说,查看百度蜘蛛是否来过我的网站就很重要了,如果蜘蛛没有来,那就不要谈收录了,解决的办法就是尽快引开蜘蛛了,如果蜘蛛爬过了,要检查下网站是否存在一些百度不收录的原因,比如过度优化。以上都没有,就要等了,等百度大更新时,收录自然就有了!那么如何查看百度蜘蛛是否来过我的网站呢?


首先要查看服务器IIS日志,具体操作方法:记事本打开IIS日志内容,然后用ctrl+F查找baidu, 如果发现有Baiduspider 就说明百度蜘蛛爬行过,反之则没有。

      百度蜘蛛活跃时间一般是晚上凌晨。

      比如说:
[22/Apr/2010:06:30:56 -0700] "GET / HTTP/1.1" 200 10219 "-" "Baiduspider+(+http://www.baidu.com/search/spider.htm)"
66.249.68.229

  2008-06-19 00:25:03 W3SVC818374 222.214.218.36 GET /Server.aspx- 80 - 221.10.254.26 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0 21089

  如果你的网址是www.510379.com这就意味着百度蜘蛛在2010年-04-22 06:30:56 爬过,200 0 0 21089中的200协议代码代表了请求已完成也就是它发现这页并以入库了。
22/Apr/2010:06:30:56 -0700是日期,也就是蜘蛛来的日期和时间了。
GET /robots.txt 访问的页面 get表示获取
200表示抓取成功。有时会出现其他代码如:404 - 请求的网页不存在;503 - 服务器暂时不可用

Baiduspider+(+http://www.baidu.com/search/spider.htm)是百度蜘蛛了
66.249.68.229是蜘蛛的ip地址
以下是百度蜘蛛爬行检测代码意思:

  2xx 成功

  200 正常;请求已完成。

  201 正常;紧接 POST 命令。

  202 正常;已接受用于处理,但处理尚未完成。

  203 正常;部分信息 — 返回的信息只是一部分。

  204 正常;无响应 — 已接收请求,但不存在要回送的信息。

  3xx 重定向

  301 已移动 — 请求的数据具有新的位置且更改是永久的。

  302 已找到 — 请求的数据临时具有不同 URI。

  303 请参阅其它 — 可在另一 URI 下找到对请求的响应,且应使用 GET 方法检索此响应。

  304 未修改 — 未按预期修改文档。

  305 使用代理 — 必须通过位置字段中提供的代理来访问请求的资源。

  306 未使用 — 不再使用;保留此代码以便将来使用。

  4xx 客户机中出现的错误

  400 错误请求 — 请求中有语法问题,或不能满足请求。

  401 未授权 — 未授权客户机访问数据。

  402 需要付款 — 表示计费系统已有效。

  403 禁止 — 即使有授权也不需要访问。

  404 找不到 — 服务器找不到给定的资源;文档不存在。

  407 代理认证请求 — 客户机首先必须使用代理认证自身。

  410 请求的网页不存在(永久);

  415 介质类型不受支持 — 服务器拒绝服务请求,因为不支持请求实体的格式。

  5xx 服务器中出现的错误

  500 内部错误 — 因为意外情况,服务器不能完成请求。

  501 未执行 — 服务器不支持请求的工具。

  502 错误网关 — 服务器接收到来自上游服务器的无效响应。

  503 无法获得服务 — 由于临时过载或维护,服务器无法处理请求。
    根据这些可以多查看iis日志,研究蜘蛛爬行的路径,找出自己网站存在的问题,进而改正。相信好的网站会有好的排名。
分享到:
评论

相关推荐

    百度蜘蛛怎么培养

    揭秘百度蜘蛛的七大特性!想要做好百度优化就必须先养好百度蜘蛛!那么如何饲养百度蜘蛛呢?下面了解百度蜘蛛七大特性。

    百度蜘蛛爬行规则

    seo 百度蜘蛛爬行规则

    智者百度蜘蛛王(链接批量推送) v1224.zip

    智者百度蜘蛛王(链接批量推送)是一款百度链接推送软件,通过百度蜘蛛王(链接批量推送)您可以将大量的链接推送给百度蜘蛛进行抓取,目前软件支持主动推送和自动推送两种。 1、主动推送:通过百度token进行批量推送...

    百度蜘蛛的代码分析与饲养技巧

    研究se爬行规律对于网站优化意义重大,特别是对百度蜘蛛Baiduspider的研究。本文解释一下百度蜘蛛爬行后返回代码代表的具体含义:

    百度蜘蛛喜欢怎样的网站结构

    百度蜘蛛喜欢怎样的网站结构,在这里可以告诉你百度蜘蛛喜欢什么样的网站结构。

    2014劫持百度蜘蛛

    勾引蜘蛛, 让蜘蛛为我所用快速更新网站内容和快照,有很多网站在发布后, 百度谷歌的更新速度很慢, 很多内容页几天,半月甚至一个多月没有收录, 如何让百度, google的蜘蛛能够频繁光临和更新网站度? 一、如何让...

    百度蜘蛛爬行跟踪统计系统 PHP v1.0.rar

    这个系统利用PHP的特性来处理请求、处理数据并生成动态网页内容,以便显示百度蜘蛛的爬行信息。 2. **百度蜘蛛** 百度蜘蛛是百度搜索引擎的网络爬虫,它负责抓取互联网上的网页,并将这些网页的内容纳入百度的索引...

    百度强引蜘蛛程序易语言.zip

    标题中的“百度强引蜘蛛程序易语言”表明这是一个使用易语言编写的应用程序,目标是吸引搜索引擎,特别是百度的网络爬虫(蜘蛛)来提高网站的抓取频率和收录率。在SEO(搜索引擎优化)领域,这被称为“引蜘蛛”或...

    百度蜘蛛爬行跟踪统计系统 v1.0.zip

    【标题】"百度蜘蛛爬行跟踪统计系统 v1.0.zip"所代表的是一个用于监控和分析搜索引擎爬虫,特别是百度蜘蛛(Baidu Spider)活动的统计系统。这个系统可以帮助网站管理员了解百度蜘蛛如何抓取他们的网页,以及抓取的...

    JAVA搜索引擎之模仿百度蜘蛛

    在这个主题中,我们将探讨如何使用JAVA来创建一个类似于百度蜘蛛的搜索引擎。首先,我们需要理解百度蜘蛛(也称为网络爬虫)的工作原理。 百度蜘蛛是百度搜索引擎的重要组成部分,它的主要任务是遍历互联网上的网页...

    P9.GG引百度蜘蛛seo工具

    P9.GG引百度蜘蛛工具是一个专业引百度蜘蛛的工具,可以马上用马上来百度蜘蛛,不过收录不收录你网站还是要看你的内容是不是原创,这个工具改变不了这点。 要注意的是本软件是用易语言做的对360误报是会有的,大家...

    IVBD『限制百度蜘蛛抓取txt代码』

    "IVBD『限制百度蜘蛛抓取txt代码』"这个主题涉及到如何通过编写`robots.txt`文件来管理搜索引擎爬虫的访问权限。`robots.txt`是一种简单的文本文件,它告诉搜索引擎哪些页面可以抓取,哪些应避免抓取。在这个场景中...

    百度引蜘蛛程序12.6(正式版不闪退)

    【标题】"百度引蜘蛛程序12.6(正式版不闪退)" 是一款针对搜索引擎优化(SEO)的专业工具,其主要目标是吸引百度搜索引擎的爬虫(也称为“蜘蛛”)来更快地抓取和索引网站内容。在SEO领域,"引蜘蛛"是指通过特定方法...

    百度蜘蛛记录工具提供网站的PR值

    百度蜘蛛记录工具 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┫ ┃【使用前请您先阅读以下条款,否则请勿使用本站提供的文件!】 ┃ ┃ 1) 推荐使用:WinRAR V3.4以上版本解压本站软件 ┃ ┃ ...

    批量引百度蜘蛛

    本软件的主要作用是批量的把网站网址提交给百度,让百度来收录。每次更新完网站之后,就一键ping给百度,省时省事! 使用说明:点击软件界面上菜单里面的添加网址,就可以进行添加修改网址的操作,一行一个(不要有...

    精仿百度蜘蛛搜索源代码

    精仿百度源代码精仿百度源代码精仿百度源代码精仿百度源代码精仿百度源代码精仿百度源代码精仿百度源代码精仿百度源代码精仿百度源代码精仿百度源代码精仿百度源代码精仿百度源代码精仿百度源代码精仿百度源代码精仿...

    百度SEO蜘蛛精外链工具

    百度SEO蜘蛛精外链工具 【2020-02-26新增{数字}{字母}标签,可以推送泛域名】 1:永久免费,没有死链 2:支持批量刷网址 3:无弹窗无广告 【注:】不带http://效果更佳哦。 软件基于.NET4.0平台开发,如果软件无法...

    阿西百度蜘蛛爬行记录追踪系统

    总的来说,"阿西百度蜘蛛爬行记录追踪系统"是一个旨在提升网站搜索引擎可见性和收录率的工具,通过深入理解并利用其功能,网站管理员可以更有效地管理网站内容,以期在搜索引擎排名中获得更好的表现。

    记录百度GG蜘蛛访问你的网站的痕迹

    功能:记录蜘蛛爬行轨迹,一个星期内的按爬行时间完全记录,一个星期以前的记录时间(没有删除记录的功能,需要删除的请直接在数据库里面删除即可!). 利用main.asp可以直接一眼看出哪个页面被爬行的最多,利用robots.asp...

Global site tag (gtag.js) - Google Analytics