Google SiteMap Protocol是Google自己推出的一种站点地图协议,此协议文件基于早期的robots.txt文件协议,并有所
升级。在Google官方指南中指出加入了Google SiteMap文件的网站将更有利于Google网页爬行机器人的爬行索引,这样将提高索引网站
内容的效率和准确度。文件协议应用了简单的XML格式,一共用到6个标签,其中关键标签包括链接地址、更新时间、更新频率和索引优先权。
Google SiteMap文件格式如下:
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
<url>
<loc>http://homepage.yesky.com</loc>
<lastmod>2005-06-03T04:20-08:00</lastmod>
<changefreq>always</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>http://homepage.yesky.com/300687.html</loc>
<lastmod>2005-06-02T20:20:36Z</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
</urlset>
XML标签
changefreq:页面内容更新频率。
lastmod:页面最后修改时间
loc:页面永久链接地址
priority:相对于其他页面的优先权
url:相对于前4个标签的父标签
urlset:相对于前5个标签的父标签
我将一句一句分解讲解这个xml文件的每一个标签:
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
这一行定义了此xml文件的命名空间,相当于网页文件中的<html>标签一样的作用。
<url>
这是具体某一个链接的定义入口,你所希望展示在SiteMap文件中的每一个链接都要用<url>和</url>包含在里面,这是必须的。
<loc>http://homepage.yesky.com</loc>
用<loc>描述出具体的链接地址,这里需要注意的是链接地址中的一些特殊字符必须转换为XML(HTML)定义的转义字符,如下表: 字符 转义后的字符
HTML字符 字符编码
and(和) & & &
单引号 ' ' '
双引号 " " "
大于号 > > >
小于号 < < <
<lastmod>2005-06-03T04:20:32-08:00</lastmod>
<lastmod>
是用来指定该链接的最后更新时间,这个很重要。Google的机器人会在索引此链接前先和上次索引记录的最后更新时间进行比较,如果时间一样就会跳过不再
索引。所以如果你的链接内容基于上次Google索引时的内容有所改变,应该更新该时间,让Google下次索引时会重新对该链接内容进行分析和提取关键
字。这里必须用ISO 8601中指定的时间格式进行描述,格式化的时间格式如下:
年:YYYY(2005)
年和月:YYYY-MM(2005-06)
年月日:YYYY-MM-DD(2005-06-04)
年月日小时分钟:YYYY-MM-DDThh:mmTZD(2005-06-04T10:37+08:00)
年月日小时分钟秒:YYYY-MM-DDThh:mmTZD(2005-06-04T10:37:30+08:00)
这里需注意的是TZD,TZD指定就是本地时间区域标记,像中国就是+08:00了
<changefreq>always</changefreq>
用
这个标签告诉Google此链接可能会出现的更新频率,比如首页肯定就要用always(经常),而对于很久前的链接或者不再更新内容的链接就可以用
yearly(每年)。这里可以用来描述的单词共这几
个:"always", "hourly", "daily", "weekly", "monthly", "yearly",具体含义我就不用解释了
吧,光看单词的意思就明白了。
<priority>1.0</priority>
<priority>是用来指定此链接相对于其他链接的优先权比值,此值定于0.0 - 1.0之间
还有</url>和</urlset>,这两个就是来关闭xml标签的,这和HTML中的</body>和</html>是一个道理
另外需要注意的是,这个xml文件必须是utf-8的编码格式,不管你是手动生成还是通过代码生成,建议最好检查一下xml文件是否是utf-8编码,最简单的方法就是用记事本打开xml然后另存为时选择编码(或转换器)为UTF-8。
登
陆Google提交你的SiteMap文件,让Google开始爬行吧打开http://www.google.com/webmasters
/sitemaps/链接,如果还没有注册或者登陆Google,就先用自己的帐号登陆Google,登陆后转到Your Sitemaps状态页面,可
以点击那个Add a Sitemap + 跳转到提交页面进行Sitemap文件的提交。建议文件放在你的站点根目录下。给Google提交你的
Sitemap URL后可以看见在列表里已存在,不过这时候还没有生效,必须过几个小时后Status栏变成OK表示正式生效,如果不是OK,可以查看
Google给出的状态标示解释看看是什么原因。
分享到:
相关推荐
JavaEE代码生成器是一款强大的开发工具,主要用于提升JavaEE应用的开发效率。它通过自定义模板和元数据,能够快速生成符合项目规范的Java源代码、配置文件以及相关的Web资源,帮助开发者免去大量重复的手动编码工作...
JavaEE代码生成器是一个实用工具,它旨在帮助Java开发者快速生成常见的JavaEE应用程序代码,从而提高开发效率。这个压缩包“JavaEE代码生成器.zip”很可能包含了一个或多个程序、库或者配置文件,用于实现自动化的...
2. **JSP(JavaServer Pages)**:JSP是JavaEE中的视图层技术,允许开发者在HTML中嵌入Java代码,实现动态网页生成。 3. **JDBC(Java Database Connectivity)**:JavaEE中的数据库交互主要通过JDBC实现,包括连接...
"类文件生成Java源代码"这部分描述可能意味着压缩包中包含了一些工具或者过程,用于将已经编译好的.class文件反编译回.java源代码。这对于理解已有的二进制代码、调试或者修改现有项目非常有帮助。通常,这种工具如...
JavaEE课程设计:票据管理系统源码 JavaEE课程设计:票据管理系统源码 JavaEE课程设计:票据管理系统源码 JavaEE课程设计:票据管理系统源码 JavaEE课程设计:票据管理系统源码 JavaEE课程设计:票据管理系统...
JavaEE 应用程序的运行需要一个支持JavaEE标准的应用服务器。常见的JavaEE应用服务器包括: - **GlassFish**:由Oracle提供的开源JavaEE应用服务器。 - **WildFly**(原名JBoss AS):Red Hat公司的开源应用服务器。...
Servlet可以处理HTTP请求,生成响应,并且能够动态生成网页内容。 2. **JSP(JavaServer Pages)**:JSP是一种基于Java的动态网页技术,允许在HTML页面中嵌入Java代码,使得网页内容可以与后端数据交互。 3. **EJB...
2. **Servlet技术**:Servlet是JavaEE中的服务器端组件,负责处理HTTP请求,生成响应。在大作业中,学生可能需要编写Servlet来处理用户请求,如登录验证、数据处理等。 3. **JSP(JavaServer Pages)**:JSP是一种...
JavaEE是Java企业版(Java Enterprise Edition)的简称,它是一个用于开发企业级应用程序的Java平台。这个平台包含了多个服务、APIs和协议,旨在帮助开发者构建可扩展、高性能、安全且可管理的网络应用程序。JavaEE...
Eclipse for JavaEE 图解教程 Eclipse 是一个功能强大且灵活的集成开发环境(IDE),尤其是在 Java Enterprise Edition(JavaEE)开发中。Eclipse for JavaEE 图解教程旨在快速帮助开发者学习使用 Eclipse for ...
【JavaEE技术体系详解】 JavaEE,全称为Java Platform, Enterprise Edition,是Oracle公司推出的用于构建企业级Web应用的标准框架。这个平台包含了多种技术,如Servlet、JSP、EJB、JMS、JPA等,旨在简化开发过程,...
根据提供的信息,我们可以总结出以下关于JAVAEE视频教程的关键知识点: ### 1. JAVAEE 学习资源概览 在标题“JAVAEE视频教程下载地址”以及描述“JAVAEE学习教程下载地址集合,还有外语、经济之类也在其中”中,...
JavaEE和Android是两个在IT领域中非常重要的平台,它们分别在服务器端和移动设备端发挥着关键作用。本文将对比分析JavaEE和Android在创建简单界面时的特点、技术和应用场景。 首先,JavaEE(Java Enterprise ...
JavaEE(Java Platform, Enterprise Edition)是Java平台上用于构建企业级应用的一套标准规范和API。这个"javaee_api.zip"文件包含的是JavaEE的官方英文版API文档,以ZIP格式压缩,对于开发者来说,这是一个非常重要...
【JavaEE大作业学籍管理系统】是一个基于JavaEE技术平台开发的学生信息管理应用,它主要用于高校或教育机构进行学生学籍信息的录入、查询、修改和管理。在本项目中,我们将探讨JavaEE架构下的核心技术和实现细节。 ...
在这个案例中,JSP和JavaBean需要理解HTTP请求的类型(GET, POST等),解析请求参数,并根据请求内容生成响应。 5. **数据库交互**:在线订购系统通常需要持久化数据,如存储用户信息、订单详情和商品信息。这需要...
JavaEE是Java企业版(Enterprise Edition)的简称,是一个用于开发和部署企业级应用程序的平台。这个"javaee.jar"文件很可能包含了JavaEE规范中定义的各种API,使得开发者能够构建分布式、多层的企业系统,例如Web...
在JavaEE中,JSP技术是用于编写动态网页的关键,它允许开发者将Java代码嵌入到HTML页面中,实现动态内容的生成。然而,直接在JSP页面上大量写入Java代码会导致代码难以管理和维护。因此,通常采用MVC(Model-View-...
javaEE概述