`
jetway
  • 浏览: 484047 次
  • 性别: Icon_minigender_1
  • 来自: 武汉
社区版块
存档分类
最新评论

屏蔽搜索引擎的方法

阅读更多

屏蔽蜘蛛的方法|屏蔽搜索引擎的方法

Allow: /

二、禁止某个搜索引擎蜘蛛抓取目录文件,设置代码如下:
User-agent:
MsnbotDisallow: /

例如想禁止MSN的蜘蛛抓取就设为,

Msnbot代表MSN的蜘蛛,如果想禁止其他搜索引擎就更换蜘蛛名字即可,其他蜘蛛名字如下:
百度的蜘蛛:baiduspider
Google的蜘蛛: Googlebot
腾讯Soso:Sosospider
Yahoo的蜘蛛:Yahoo Slurp
Msn的蜘蛛:Msnbot
Altavista的蜘蛛:Scooter
Lycos的蜘蛛: Lycos_Spider_(T-Rex)

三、禁止某个目录被搜索引擎蜘蛛抓取,设置代码如下:
User-agent: *
Disallow: /目录名字1/
Disallow: /目录名字2/

 

 

Disallow: /目录名字3/

把目录名字改为你想要禁止的目录即可禁止搜索引擎蜘蛛抓取,目录名字未写表示可以被搜索引擎抓取。

四、禁止某个目录被某个搜索引擎蜘蛛抓取,设置代码如下:

User-agent: 搜索引擎蜘蛛名字     说明(上面有说明蜘蛛的名字)
Disallow: /目录名字/              说明(这里设定禁止蜘蛛抓取的目录名称)

例如,想禁目Msn蜘蛛抓取admin文件夹,可以设代码如下:

User-agent: Msnbot
Disallow: /admin/

五、设定某种类型文件禁止被某个搜索引擎蜘蛛抓取,
设置代码如下:
User-agent: *

Disallow: /*.htm   说明(其中“.htm”,表示禁止搜索引擎蜘蛛抓取所有“htm”为后缀的文件)

六、充许所有搜索引擎蜘蛛访问以某个扩展名为后缀的网页地址被抓取,
设置代码如下:
User-agent: *
Allow: .htmcontentnbsp;  说明(其中“.htm”,表示充许搜索引擎蜘蛛抓取所有“htm”为后缀的文件)

 

七、只充许某个搜索引擎蜘蛛抓取目录文件,设置代码如下:

User-agent: 搜索引擎蜘蛛名字     说明(上面有说明蜘蛛的名字)
Disallow:


您可以写一个Robots文件以限制您的网站全部网页或者部分目录下网页不被
收录。如:robots.txt上传之服务器根目录即可.robots.txt
全部屏蔽代码User-agent: * Disallow: /

分享到:
评论

相关推荐

    屏蔽一切搜索引擎的robots

    2. **技术调试**:在网站初期建设阶段或者进行重大改版时,屏蔽搜索引擎爬虫可以帮助避免因技术问题导致的内容错误索引。 3. **法律要求**:某些情况下,根据法律法规的要求,网站可能需要暂时不被搜索引擎收录。 #...

    搜索引擎营销-商盾的使用方法与恶意屏蔽.pptx

    综上所述,商盾作为搜索引擎营销中的一个重要工具,帮助广告主有效地管理他们的推广预算,避免无效点击造成的损失,同时通过精细化的屏蔽策略,确保推广效果的精准性和有效性。正确使用商盾,不仅可以提升广告投放...

    为什么淘宝网要屏蔽百度搜索引擎的抓取?.docx

    淘宝网屏蔽百度搜索引擎的抓取,这一策略背后有多重考虑,主要涉及用户信息保护、电商平台信誉维护、内部管理以及市场竞争等因素。 首先,保护用户信息和商业信息是首要原因。淘宝网作为C2C类型的电商平台,拥有...

    网站建好后短期内让搜索引擎收录的方法.docx

    以下是一些关于如何在短期内让新网站被搜索引擎收录的有效方法: 首先,避免使用过度流行的模板。许多新网站可能会选择使用CMS系统和现有的免费模板,但这可能导致网站设计的重复性过高。搜索引擎喜欢独特的内容,...

    百度、谷歌、搜狗、360、有道、yahoo搜索引擎关键字排名查询asp版本

    这些脚本可以帮助开发者或者SEO(搜索引擎优化)专家了解其网站或特定关键字在各大搜索引擎中的排名情况,从而优化网站内容,提升搜索引擎可见性。 1. **百度关键字排名查询** (`get_baidukey.asp`): 百度是中国...

    DiscuzX3全站内容外链仅对搜索引擎蜘蛛屏蔽,用户可见

    DiscuzX3 全站内容仅对搜索引擎蜘蛛屏蔽外链,用户可见 视频演示地址:https://www.zmt6.com/spider.html

    龙蛛搜索引擎 v2.1.2596.17577.rar

    提供用户企业级的搜索引擎服务。 4提供对站内页面搜索的支持,确保行业搜索的相关性。提供网页关键词、网址关键词等的筛选和屏蔽,可灵活的抓取网站的各类信息。为局域网、行业、垂直搜索提供最大限度的企业级支持。...

    搜索引擎代码

    E桶金行业搜索引擎系统(包含多线程客户端蜘蛛系统) V1.6 版发布! E桶金行业搜索引擎 特别适用于超大、中型信息门户、行业门户、电子商务等网站使用。 它是一款真正意义上的搜索引擎:具有自己的蜘蛛、分词、索引...

    飞猫、贼度、恰搜搜索合成搜索引擎(商业版)

    "飞猫、贼度、恰搜搜索合成搜索引擎(商业版)"是一款集合了多个搜索引擎功能的软件,旨在提供更全面、高效的搜索体验。通常这样的工具会整合不同的搜索引擎接口,如百度、谷歌、必应等,让用户在一个平台上就能获取...

    搜索引擎的工作原理应用.docx

    搜索引擎是互联网世界中不可或缺的一部分,它为用户提供便捷的信息获取途径。了解搜索引擎的工作原理对SEO(搜索引擎优化)至关重要,因为这直接影响到网站在搜索结果中的排名和可见性。本文将深入探讨搜索引擎的...

    网络书目控制搜索引擎开发

    传统的搜索引擎主要依赖于关键词匹配来抓取和建立数据库,这种方法虽然能够快速响应用户的查询请求,但却无法有效地过滤掉大量无关或低质量的信息。同时,软件自动生成的摘要往往难以准确描述信息资源的本质特征。另...

    北山软件简易搜索引擎 v2.0

    北山软件简易搜索引擎v2.0是一款专为用户设计的高效、易用的搜索工具,旨在帮助用户在海量信息中快速找到所需内容。这款搜索引擎具备无限分类和无限添加站点的功能,适应了网络信息爆炸时代的需求,能够灵活地管理和...

    人工智能-项目实践-搜索引擎-一个用于获取搜索引擎结果的库,可拓展,理论上能支持所有搜索引擎

    ###简介 一个用于爬行所有搜索引擎的库 搜索效果图: 效果图1 可以搜索zoomeye结果,10页内,需安装...防屏蔽 不使用api,可自定义每种搜索引擎延迟时间,单线程 易用 已经写好了几个常用搜索引擎配置,可直接使用

    Webinfo自动化搜索引擎系统 v1.41

    这个系统属于自动化的搜索引擎,它可以从一个网址列表开始,自动寻找这些网址的下一级网页。可以让中小网站也有有自己特色的搜索引擎。适合与于对某一指定领域里的网站进行搜索,比如建立一个内网的搜索引擎。 ...

    百度官方SEO搜索引擎优化指南V2.0版.docx

    2. **服务器稳定性**:确保服务器的稳定性和速度,避免选择那些可能屏蔽搜索引擎抓取的服务商。 3. **网站结构**:保持网站结构清晰,便于搜索引擎抓取和用户浏览。推荐扁平化的网站结构,减少从首页到内容页的层级...

Global site tag (gtag.js) - Google Analytics