robots.txt
是一个纯文本文件,当网络蜘蛛来抓取网站的时候,首先就是访问这个网站的robot.txt文件。所以网站管理者都会在robots.txt
文件中声明该网站中不想被robots
访问的部分,或者只允许指定的搜索引擎收录指定的内容。
很明显robot.txt对我们做seo来说是很重要的。
下面来看看应该怎么写robot.txt?
1、user-agent和Disallow是robot里面的俩个重要的函数。
2、robot.txt的编写及范本:
例如:
允许所有的robot访问
User-agent: *
Disallow:
或者也可以建一个空文件 “/robots.txt” file
禁止所有搜索引擎访问网站的任何部分
User-agent: *
Disallow: /
禁止所有搜索引擎访问网站的几个部分(下例中的01、02、03目录)
User-agent: *
Disallow: /01/
Disallow: /02/
Disallow: /03/
禁止某个搜索引擎的访问
(下例中的BadBot)
User-agent: BadBot
Disallow: /
只允许某个搜索引擎的访问(下例中的Crawler)
User-agent: Crawler
Disallow:
User-agent: *
Disallow: /
3、各大搜索引擎的蜘蛛名称
百度蜘蛛:baiduspider
google蜘蛛:googlebot
yahoo蜘蛛:slurp
alexa蜘蛛:ia_archiver
msn蜘蛛:msnbot
xaltavista蜘蛛:lycos_spider_(t-rex)
lycos蜘蛛:lycos_spider_(t-rex)
alltheweb蜘蛛:fast-webcrawler/
inktomi蜘蛛:slurp
4、<meta name="robots" contect="all|none|index|noindex|follow|nofollow">
其中的属性说明如下:
设定为all:文件将被检索,且页面上的链接可以被查询;
设定为none:文件将不被检索,且页面上的链接不可以被查询;
设定为index:文件将被检索;
设定为follow:页面上的链接可以被查询;
设定为noindex:文件将不被检索,但页面上的链接可以被查询;
设定为nofollow:文件将不被检索,页面上的链接可以被查询。
转帖请自觉加入SEO教程
文字链接(http://www.seowindows.com)
分享到:
相关推荐
1. "cpseo53.swf":这可能是第53节的SWF格式视频,主题可能涉及robot.txt的使用和优化,包括如何编写、设置禁止和允许爬取的规则,以及如何影响搜索引擎对网站的抓取和索引。 2. "下载说明.txt":通常包含下载和...
开源探路机器人Robot1.4 /* This Program is a robot ...在console下用robot yourworld.txt运行,所有程序都在Robot.c 下,压缩包里包含的几幅地图,直接双击robot.exe,程序使用内置的地图。详细情况请见上述的注释。
Robot Framework启动时,首先会读取测试套件(Test Suite)的配置文件,如`.robot`或`.txt`文件。这个过程涉及到`robot.running.model.TestSuiteBuilder`模块,它解析文件内容,构建测试套件和测试用例的层次结构。...
Robot Framework以其基于关键词的测试语法著称,这使得非程序员也能轻松编写测试用例。 至于“DragAndDropRobotSetup.exe”这个文件名,其中“DragAndDrop”可能暗示了工具支持拖放操作的测试,这对于测试图形用户...
"robot.rar"这个压缩包可能包含与机器人相关的资料或程序代码,比如"a.txt"文件可能就是一份关于机器人编程或者设计理念的文档。在这里,我们将深入探讨机器人技术的一些核心知识点。 首先,我们要理解机器人的定义...
$ npm install$ npm start -- instructions.txt$ node ./bin/robot.js instructions.txt指令格式模拟器仅接受.txt文件,每行只有一个命令。 可用的命令有: X,Y,方向位置(0,1,NORTH):将机器人放在桌子上。 ...
- **预处理**:读取测试数据文件(通常是`.robot`或`.txt`格式),解析成内部数据结构。 - **解析测试用例**:使用`robot.parsing`模块解析输入文件,生成`TestSuite`、`TestCase`、`Keyword`等模型对象。 - **...
本文将详细探讨标题为"ant-robotframework-0.2.jar.zip"的压缩包文件,以及其包含的"ant-robotframework-0.2.jar"和"ant.license.txt"两个子文件,深入解析它们的功能、用途和使用方法。 首先,Apache Ant是一个...
根据提供的文件信息,该文档主要关注ROS(Robot Operating System,机器人操作系统)中catkin构建系统下CMakeLists.txt文件的编写指南和相关知识点。 1. 概述(Overview) CMakeLists.txt是CMake构建系统处理软件包...
以下是对提供的"robotframework脚本编写规范.pdf"文件中提到的一些关键知识点的详细解释: 1. **测试集和脚本命名**: - 测试集(Test Suite)的文件名不超过20个字符,通常使用txt格式,且应具有描述性,易于理解...
License_Agreement_eng.txt和License_Agreement_jpn.txt是许可协议文件,其中列出了使用Fanuc ROBOT INTERFACE的法律条款和限制。开发者在使用SDK之前,必须仔细阅读并遵循这些条款,以确保合法合规地进行开发工作。...
通过使用此插件,用户无需手动编写或编辑这个文件,能够更方便地控制搜索引擎的索引范围,优化网站的SEO(搜索引擎优化)策略。 在易优CMS中安装"易优robots文件生成器插件"的步骤如下: 1. 首先,你需要解压下载...
RIDE 是 Robot Framework 的一个集成开发环境,提供了编写、运行和调试测试套件的图形界面。因此,ExcelLibrary 可以在 Python 3 环境下配合 RIDE 进行自动化测试工作,特别是在处理需要与 Excel 数据进行交互的场景...
"ant.license.txt"文件则包含了Ant框架的许可协议,这是开源软件项目中常见的组成部分,用于规定软件的使用、修改和分发条件。理解并遵循这些许可协议对于合法使用和贡献开源项目至关重要。 在实际使用中,开发者...
在实际使用`doraemon-robotframework`时,开发人员可以通过阅读`README`了解如何安装和初始化,通过`setup.py`或`pip`进行安装,然后在Robot Framework的测试脚本中引入库,利用提供的API进行测试编写。对于...
它的特点是使用关键字驱动的测试语法,使得测试用例易于编写和理解,尤其适合非编程背景的测试人员。Robot Framework支持多种库,这些库可以与不同的应用和技术接口,如Selenium用于Web应用测试,Appium用于移动应用...
此外,Robot Framework 支持数据驱动测试,它的测试数据格式直观且灵活,可以用纯文本文件(如`.txt`或`.robot`)存储,这使得测试数据的管理和维护变得简单。在2.7.5版本中,可能引入了更多对数据驱动测试的支持,...
这样,你就可以编写Ant任务,利用Robot Framework进行自动化测试了。 总的来说,"ant-robotframework-0.6.jar.zip"提供了一个便捷的方式,让Java开发者能够利用Ant执行Robot Framework的测试,从而提高项目测试的...
1. 编写用例清单,可以以 robot、txt、tsv 或者 html 格式编写用例。 2. 自动生成 HTML 格式的测试报告和日志。 3. 除了自带的类库外,还有很多的实用扩展类库。 4. 可以根据项目需要自定义一些关键字。 5. 可以使用...