`
android_madness
  • 浏览: 40920 次
  • 性别: Icon_minigender_1
  • 来自: 福州
社区版块
存档分类
最新评论

(转)百度蜘蛛来你家了吗

阅读更多
如何查看百度蜘蛛是否来过我的网站,尤其对于长期不收录,百度快照不更新的新站来说,查看百度蜘蛛是否来过我的网站就很重要了,如果蜘蛛没有来,那就不要谈收录了,解决的办法就是尽快引开蜘蛛了,如果蜘蛛爬过了,要检查下网站是否存在一些百度不收录的原因,比如过度优化。以上都没有,就要等了,等百度大更新时,收录自然就有了!那么如何查看百度蜘蛛是否来过我的网站呢?


首先要查看服务器IIS日志,具体操作方法:记事本打开IIS日志内容,然后用ctrl+F查找baidu, 如果发现有Baiduspider 就说明百度蜘蛛爬行过,反之则没有。

      百度蜘蛛活跃时间一般是晚上凌晨。

      比如说:
[22/Apr/2010:06:30:56 -0700] "GET / HTTP/1.1" 200 10219 "-" "Baiduspider+(+http://www.baidu.com/search/spider.htm)"
66.249.68.229

  2008-06-19 00:25:03 W3SVC818374 222.214.218.36 GET /Server.aspx- 80 - 221.10.254.26 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0 21089

  如果你的网址是www.510379.com这就意味着百度蜘蛛在2010年-04-22 06:30:56 爬过,200 0 0 21089中的200协议代码代表了请求已完成也就是它发现这页并以入库了。
22/Apr/2010:06:30:56 -0700是日期,也就是蜘蛛来的日期和时间了。
GET /robots.txt 访问的页面 get表示获取
200表示抓取成功。有时会出现其他代码如:404 - 请求的网页不存在;503 - 服务器暂时不可用

Baiduspider+(+http://www.baidu.com/search/spider.htm)是百度蜘蛛了
66.249.68.229是蜘蛛的ip地址
以下是百度蜘蛛爬行检测代码意思:

  2xx 成功

  200 正常;请求已完成。

  201 正常;紧接 POST 命令。

  202 正常;已接受用于处理,但处理尚未完成。

  203 正常;部分信息 — 返回的信息只是一部分。

  204 正常;无响应 — 已接收请求,但不存在要回送的信息。

  3xx 重定向

  301 已移动 — 请求的数据具有新的位置且更改是永久的。

  302 已找到 — 请求的数据临时具有不同 URI。

  303 请参阅其它 — 可在另一 URI 下找到对请求的响应,且应使用 GET 方法检索此响应。

  304 未修改 — 未按预期修改文档。

  305 使用代理 — 必须通过位置字段中提供的代理来访问请求的资源。

  306 未使用 — 不再使用;保留此代码以便将来使用。

  4xx 客户机中出现的错误

  400 错误请求 — 请求中有语法问题,或不能满足请求。

  401 未授权 — 未授权客户机访问数据。

  402 需要付款 — 表示计费系统已有效。

  403 禁止 — 即使有授权也不需要访问。

  404 找不到 — 服务器找不到给定的资源;文档不存在。

  407 代理认证请求 — 客户机首先必须使用代理认证自身。

  410 请求的网页不存在(永久);

  415 介质类型不受支持 — 服务器拒绝服务请求,因为不支持请求实体的格式。

  5xx 服务器中出现的错误

  500 内部错误 — 因为意外情况,服务器不能完成请求。

  501 未执行 — 服务器不支持请求的工具。

  502 错误网关 — 服务器接收到来自上游服务器的无效响应。

  503 无法获得服务 — 由于临时过载或维护,服务器无法处理请求。
    根据这些可以多查看iis日志,研究蜘蛛爬行的路径,找出自己网站存在的问题,进而改正。相信好的网站会有好的排名。
分享到:
评论

相关推荐

    百度蜘蛛爬行规则

    这意味着,即使你的网站有桌面版和移动版,百度蜘蛛也会优先抓取移动版,因此优化移动版的用户体验变得尤为重要。 6. **页面加载速度**:页面加载速度直接影响百度蜘蛛的抓取效率。优化图片大小、压缩代码、使用CDN...

    百度蜘蛛怎么培养

    揭秘百度蜘蛛的七大特性!想要做好百度优化就必须先养好百度蜘蛛!那么如何饲养百度蜘蛛呢?下面了解百度蜘蛛七大特性。

    智者百度蜘蛛王(链接批量推送) v1224.zip

    智者百度蜘蛛王(链接批量推送)是一款百度链接推送软件,通过百度蜘蛛王(链接批量推送)您可以将大量的链接推送给百度蜘蛛进行抓取,目前软件支持主动推送和自动推送两种。 1、主动推送:通过百度token进行批量推送...

    批量引百度蜘蛛

    本软件的主要作用是批量的把网站网址提交给百度,让百度来收录。每次更新完网站之后,就一键ping给百度,省时省事! 使用说明:点击软件界面上菜单里面的添加网址,就可以进行添加修改网址的操作,一行一个(不要有...

    2014劫持百度蜘蛛

    勾引蜘蛛, 让蜘蛛为我所用快速更新网站内容和快照,有很多网站在发布后, 百度谷歌的更新速度很慢, 很多内容页几天,半月甚至一个多月没有收录, 如何让百度, google的蜘蛛能够频繁光临和更新网站度? 一、如何让...

    百度蜘蛛爬行跟踪统计系统 PHP v1.0.rar

    这个系统利用PHP的特性来处理请求、处理数据并生成动态网页内容,以便显示百度蜘蛛的爬行信息。 2. **百度蜘蛛** 百度蜘蛛是百度搜索引擎的网络爬虫,它负责抓取互联网上的网页,并将这些网页的内容纳入百度的索引...

    百度强引蜘蛛程序易语言.zip

    标题中的“百度强引蜘蛛程序易语言”表明这是一个使用易语言编写的应用程序,目标是吸引搜索引擎,特别是百度的网络爬虫(蜘蛛)来提高网站的抓取频率和收录率。在SEO(搜索引擎优化)领域,这被称为“引蜘蛛”或...

    百度蜘蛛的代码分析与饲养技巧

    ### 百度蜘蛛的代码分析与饲养技巧 在当今互联网时代,搜索引擎已成为人们获取信息的主要渠道之一。作为国内最大的搜索引擎,百度对网站排名的影响举足轻重。因此,研究百度蜘蛛(Baiduspider)的爬行规律对于提高...

    百度蜘蛛爬行跟踪统计系统 v1.0.zip

    【标题】"百度蜘蛛爬行跟踪统计系统 v1.0.zip"所代表的是一个用于监控和分析搜索引擎爬虫,特别是百度蜘蛛(Baidu Spider)活动的统计系统。这个系统可以帮助网站管理员了解百度蜘蛛如何抓取他们的网页,以及抓取的...

    百度引蜘蛛程序12.6(正式版不闪退)

    【标题】"百度引蜘蛛程序12.6(正式版不闪退)" 是一款针对搜索引擎优化(SEO)的专业工具,其主要目标是吸引百度搜索引擎的爬虫(也称为“蜘蛛”)来更快地抓取和索引网站内容。在SEO领域,"引蜘蛛"是指通过特定方法...

    JAVA搜索引擎之模仿百度蜘蛛

    在这个主题中,我们将探讨如何使用JAVA来创建一个类似于百度蜘蛛的搜索引擎。首先,我们需要理解百度蜘蛛(也称为网络爬虫)的工作原理。 百度蜘蛛是百度搜索引擎的重要组成部分,它的主要任务是遍历互联网上的网页...

    IVBD『限制百度蜘蛛抓取txt代码』

    "IVBD『限制百度蜘蛛抓取txt代码』"这个主题涉及到如何通过编写`robots.txt`文件来管理搜索引擎爬虫的访问权限。`robots.txt`是一种简单的文本文件,它告诉搜索引擎哪些页面可以抓取,哪些应避免抓取。在这个场景中...

    PHP模拟baidu蜘蛛抓取网站链接

    在这个场景中,我们关注的是如何使用PHP来模拟百度蜘蛛的行为,抓取指定网站的链接,并将这些链接保存到TXT文本中。这一过程涉及到多个PHP编程和网络爬虫的相关知识点。 首先,我们需要了解PHP的基础语法和网络请求...

    百度蜘蛛记录工具提供网站的PR值

    百度蜘蛛记录工具 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┫ ┃【使用前请您先阅读以下条款,否则请勿使用本站提供的文件!】 ┃ ┃ 1) 推荐使用:WinRAR V3.4以上版本解压本站软件 ┃ ┃ ...

    百度蜘蛛来访地址参考

    在探讨“百度蜘蛛来访地址参考”这一主题时,我们深入解析了百度蜘蛛的不同类型及其各自的功能,以及如何通过分析这些访问记录来优化网站的SEO策略。百度蜘蛛,作为百度搜索引擎的重要组成部分,负责抓取互联网上的...

    百度蜘蛛喜欢怎样的网站结构

    ### 百度蜘蛛偏好何种网站结构详解 #### 一、URL命名规则的重要性及优化建议 在探讨百度蜘蛛(即百度搜索引擎的爬虫)对网站结构的偏好时,首先需关注的是URL命名规则。一个良好的URL命名规则不仅能提高用户体验,...

    百度SEO蜘蛛精外链工具

    百度SEO蜘蛛精外链工具 【2020-02-26新增{数字}{字母}标签,可以推送泛域名】 1:永久免费,没有死链 2:支持批量刷网址 3:无弹窗无广告 【注:】不带http://效果更佳哦。 软件基于.NET4.0平台开发,如果软件无法...

    百度强引蜘蛛2024全渠道版

    2024可能代表软件的发布年份或者版本号,全渠道版可能意味着该工具支持多种方式或途径来提升网站在百度搜索结果中的排名。 【描述分析】 描述中同样提到"百度强引蜘蛛2024全渠道版",没有提供额外的具体信息。不过...

    精仿百度蜘蛛搜索源代码

    精仿百度源代码精仿百度源代码精仿百度源代码精仿百度源代码精仿百度源代码精仿百度源代码精仿百度源代码精仿百度源代码精仿百度源代码精仿百度源代码精仿百度源代码精仿百度源代码精仿百度源代码精仿百度源代码精仿...

Global site tag (gtag.js) - Google Analytics