<meta name="robots" content="noarchive">
以上的一段代码限制了所有的搜索引擎建立你的网页快照。如果我们需要仅仅限制一个搜索引擎建立快照的话,就可以像如下这样去写
<meta name="Baiduspider" content="noarchive">
需要注意的是,这样的标记仅仅是禁止搜索引擎为你的网站建立快照,如果你要禁止搜索引擎索引你的这个页面的话,请参照后面的办法。
第二种情况:禁止搜索引擎抓取本页面。
在SEO中,禁止搜索引擎抓取本页面或者是允许搜索引擎抓取本页面是经常会用到的。因此我们需要对这一部分重点做一次讨论。
为了让搜索引擎禁止抓取本页面,我们一般的做法是在页面的元标记中加入如下的代码:
<META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">
在这里,META NAME="ROBOTS"是泛指所有的搜索引擎的,在这里我们也可以特指某个搜索引擎,例如META NAME="Googlebot"、META NAME="Baiduspide"等。content部分有四个命令:index、noindex、follow、nofollow,命令间以英文的“,”分隔。
INDEX命令:告诉搜索引擎抓取这个页面
FOLLOW命令:告诉搜索引擎可以从这个页面上找到链接,然后继续访问抓取下去。
NOINDEX命令:告诉搜索引擎不允许抓取这个页面
NOFOLLOW命令:告诉搜索引擎不允许从此页找到链接、拒绝其继续访问。
根据以上的命令,我们就有了一下的四种组合
<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">:可以抓取本页,而且可以顺着本页继续索引别的链接
<META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">:不许抓取本页,但是可以顺着本页抓取索引别的链接
<META NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW">:可以抓取本页,但是不许顺着本页抓取索引别的链接
<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">:不许抓取本页,也不许顺着本页抓取索引别的链接。
这里需要注意的是,不可把两个对立的反义词写到一起,例如
<META NAME="ROBOTS" CONTENT="INDEX,NOINDEX">
或者直接同时写上两句
<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">
<META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">
这里有一个简便的写法,如果是
<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">的形式的话,可以写成:
<META NAME="ROBOTS" CONTENT="ALL">
如果是
<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">的形式的话,可以写成:
<META NAME="ROBOTS" CONTENT="NONE">
当然,我们也可以把禁止建立快照和对于搜索引擎的命令写到一个命令元标记中。从上面的文章中我们得知,禁止建立网页快照的命令是noarchive,那么我们就可以写成如下的形式:<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW,noarchive">
如果是对于单独的某个搜索引擎不允许建立快照,例如百度,我们就可以写成:
<META NAME=" Baiduspider" CONTENT="INDEX,FOLLOW,noarchive">
如果在元标记中不屑关于蜘蛛的命令,那么默认的命令即为如下
<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW, archive">
因此,如果我们对于这一部分把握不准的话,可以直接写上上面的这一行命令,或者是直接留空。
在SEO中,对于蜘蛛的控制是非常重要的一部分内容,所以希望各位看官准确把握这部分的内容。
分享到:
相关推荐
通过 `<meta name="Robots" content="...">` 可以控制搜索引擎机器人对页面的抓取行为,例如设置为 `noindex` 或 `nofollow` 来阻止搜索引擎收录该页面或者不跟随页面上的链接。 ### 小结 `<meta>` 标签虽然看似...
- 示例:`<meta name="robots" content="index, follow">` - **Revisit-After**: 建议搜索引擎重新访问页面的时间间隔。 - 示例:`<meta name="revisit-after" content="7 days">` - **Author**: 指定页面作者或...
<meta name="robots" content="index, follow, noarchive" /> <meta name="googlebot" content="noarchive" /> </head> ``` 1. **属性的使用** - `http-equiv` 属性类似于HTTP头部,用于向浏览器发送信息,如...
<meta name="robots" content="index, follow"> ``` 此示例允许搜索引擎索引当前页面,并跟随页面中的链接。 #### 四、WebApp特有的Meta标签 针对WebApp,还有一些特定的`<meta>`标签用于改善用户体验和外观: ###...
* 设置搜索方式:<META NAME="ROBOTS" CONTENT="VALUE"> 三、超链接和多媒体文件 * 发送E-mail:<A href="mailto://A@B.C">发送E-mail</A> * 插入多媒体文件:<embed src="file-url" width=value height=value ...
<meta name="robots" content="noarchive"> ``` 这里的`name="robots"`指示这是针对搜索引擎机器人的元标记,而`content="noarchive"`则告诉搜索引擎不要保存该页面的快照。 如果只想针对特定搜索引擎执行此操作,...
<meta name= "robots " content= "noindex "> <meta content= "text/html;charset=gb2312 " http-equiv= "content-type "> <title> Welcome To RptSystem </title> </head> <frameset name="fsthead" rows=...
<meta name="name" content="string"/> ``` 或 ```html <meta http-equiv="http-equiv-value" content="string"/> ``` 其中,`name`和`http-equiv`是属性,`content`是对应的值。 ### 二、属性解析 **a. name项...
<meta name="robots" content="noindex, nofollow"> ``` 5. `refresh`:用于设置页面自动刷新或跳转: ```html <meta http-equiv="refresh" content="5;URL='http://example.com/'"> ``` 在提供的`demo.html`...
<meta name="robots" content="index,follow" /> ``` **浏览器内核控制** ```html <meta name="renderer" content="webkit|ie-comp|ie-stand" /> ``` 例如,启用360浏览器的极速模式(webkit内核): ```html <meta...
- 示例:`<meta name="robots" content="noindex, follow">` - **Author (作者):** - 显示页面的作者或版权信息。 - 示例:`<meta name="author" content="zys666, zys666@21cn.com">` ##### 2. HTTP等效属性 ...
<meta name="robots" content="all"/> <meta name="author" content="韩世首"/> <meta name="keywords" content="PHP学习交流论坛"/> <link href="skin/default/css.css" rel="stylesheet" type="text/css"/> ...
<meta name="robots" content="noindex, nofollow"> ``` 这个元数据可以告诉搜索引擎不要索引这个页面或不要跟踪页面上的链接。 通过上述介绍,我们可以看到`<meta>`标签虽然不直接呈现于用户面前,但它对于网页...
#### 十三、机器人标签(`<meta name="Robots" content="...">`) **定义**:告诉搜索引擎爬虫如何处理当前页面。 **作用**:控制页面是否被索引以及链接是否被跟踪。 **示例**: ```html <meta name="Robots" ...
<meta name="robots" content="noindex, nofollow"> ``` - 可以设置不同的值来控制搜索引擎的行为,如`noindex`表示不让搜索引擎索引该页面,`nofollow`则表示不追踪页面中的链接。 4. **`name="author"`** - *...
此外,HTML文件应遵循一定的命名规范,如`<meta name="filename" content="index.html">`用于标识文件名,`<meta name="author-date" content="01jun09">`记录制作日期,`<meta name="author" content="华">`记录...
- 示例:`<meta name="Robots" content="index, follow">`,表示允许索引并跟随链接。 #### 2. `http-equiv`属性 `http-equiv`属性则模拟HTTP响应头,用于控制浏览器的行为。常见的`http-equiv`值及其含义如下: ...
- `<meta name="robots" content="index,follow/noindex,nofollow">`控制搜索引擎抓取和索引页面的方式。 了解并正确使用这些<head>标签,可以提升网页的可用性、搜索引擎排名以及跨平台的兼容性。在编写HTML文档...