`
happmaoo
  • 浏览: 4472421 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论
阅读更多
<iframe align="center" marginwidth="0" marginheight="0" src="http://www.zealware.com/csdnblog336280.html" frameborder="0" width="336" scrolling="no" height="280"></iframe>

原来看到Google的Sitemap,不是很在意。虽然觉得这确实是搜索引擎偷懒的好办法,不用bot辛苦地去每个页面搜索了。但是要让用户主动提交内容,要有很大的号召力才行,否则很难成为标准。另外,创建Sitemap还挺麻烦的,一般的小站长估计不太容易学会。 事实上,Google的Sitemap也还不是很流行,特别在国内。

不过最近Google、微软与Yahoo最近达成协议,将使用统一的Sitemaps标准,所以原来使用范围仅局限Google网站管理员工具的sitemaps,也将被其他两家搜索引擎接受,而且未来或许会有更多搜索引擎采纳这个协议。看来站长们还是要会使用Sitemap,尽管目前在国内百度一家独大,其它三家合起来也是不可忽视的,该做的工作我们都得做呵呵。

目前Google用的Sitemap协议是0.84 ,而三家公司共同采用的将会是0.9版本,应该变化不大,暂时不用去理会它。

创建Sitemap小结:
1。创建Sitemap文件:
http://www.google.com/support/webmasters/bin/answer.py?answer=34654&hl=zh_CN
Sitemap就是个XML文件,很简单,你完全可以自己编辑完成,只要保证语法正确。但是如果站点内容比较多,不可能手动写这些内容,所以我们要用到Sitemap的自动生成器。这个是Google提供的:

http://www.google.com/webmasters/sitemaps/sitemap_generator

也有很多第三方提供的生成器,甚至有在线版的,听起来很诱人,但是我懒得一一去试用了,还是用官方版本的东西比较放心。

首先要写一个配置文件:mysite_config.xml
里面:
<site></site> base_url="http://www.mysite.com/"
store_into="/www/site1/root/sitemap.xml.gz"
verbose="1"
>

然后使用生成器脚本,这是个python写的软件,在命令行下运行命令很简单:python sitemap_gen.py --config=mysite_config.xml

呵呵,就会在/www/site1/root/目录下生成sitemap.xml.gz,用
gzip -d sitemap.xml.gz

解压缩,会在站点根目录生成sitemap.xml。生成器执行生成文件后,还会告诉Google,你的SiteMap更新了。

现在你可以试用http://www.mysite.com/sitemap.xml访问,如果正常说明创建成功。创建成功后,提交给Google(https://www.google.com/webmasters/tools/),或者在首页放个链接即可。

二。在写配置文件时有几个要注意的地方

首先静态网站很简单,指定一下目录路径,生成器就会很聪明地去遍历相应的目录了:

<directory></directory>path="/var/www/docroot"
url="http://www.example.com/"
default_file="index.html"
>

如果你的站点是动态网页,生成器没法得到每个地址(比如http://yoursite.com?articleid=234这种地址)因为这个工具是在命令行下运行,本地遍历目录而已,没有通过http连接来访问服务器。 所以你要在cofig.xml中利用apache的用户访问日志来得到动态url地址(有个问题,如果站点里有些动态网页没人访问,岂不是就不能加在sitemap里了? 我也不清楚呵呵)

找到以下部分:

<!-- ** MODIFY or DELETE **<br />"accesslog" nodes tell the script to scan webserver log files to<br />extract URLs on your site. Both Common Logfile Format (Apache's default <br />logfile) and Extended Logfile Format (IIS's default logfile) can be read.<br /><br />Required attributes:<br />path - path to the file<br />Optional attributes:<br />encoding - encoding of the file if not US-ASCII<br /> -->
<accesslog path="/etc/httpd/logs/mysite-access.log" encoding="UTF-8"></accesslog>

还有,有些网页你不想被Google搜索到,可以使用过滤器:

<filter action="drop" type="wildcard" pattern="*private*"></filter>
<filter action="drop" type="regexp" pattern="/\.[^/]*"></filter>

drop表示不列入Sitemap,第一条规则用的是通配符,表示所有包含private字符串的url都不列入Sitemap。第二条用的是正则表达式,表示不列出*nix系统下的隐藏文件或目录(文件/目录名为.abc)。




分享到:
评论

相关推荐

    Google SiteMap自动生成程序 -ASP源码.zip

    【Google Sitemap自动生成程序 - ASP源码】是一款基于ASP技术开发的工具,主要用于帮助网站管理员自动创建Google Sitemap文件。Google Sitemap是网站向搜索引擎提交的一种特殊格式的XML文件,它列出了网站上的所有...

    google Sitemap插件 for Oblog.rar

    4. **生成Sitemap**:保存设置后,插件会自动创建一个XML格式的Sitemap文件,文件名通常为`sitemap.xml`,这个文件包含了网站所有需要被搜索引擎抓取的页面。 5. **提交给Google**:最后,你需要将生成的Sitemap...

    了解siteMap(附:Google Sitemap 生成工具使用说明)

    Google提供了多种工具来帮助网站管理员创建和提交Sitemaps,其中一种常见的工具是Google Search Console。Search Console是Google提供的免费服务,旨在帮助网站管理员监控、维护其在Google搜索中的表现。它包含一个...

    google sitemap 自动生成器

    Google Sitemap 自动生成器是一款专门设计用来创建Sitemap的软件或在线服务。它能快速地扫描网站的所有页面,并自动整理出一个符合Google Sitemap规范的XML文件。通过使用这类工具,网站管理员可以省去手动编写XML...

    Laravel开发-sitemap Sitemap 生成工具

    在`.htaccess`或Nginx配置中,为Sitemap创建一个友好的路由,以便搜索引擎能方便地找到: ``` RewriteRule ^sitemap\.xml$ /index.php?_route_=sitemap [L] ``` 或者在`routes/web.php`中定义一个路由: ```...

    google sitemap, cse, analytics

    - **创建与提交**:可以通过在线工具、WordPress 插件或手动编写来创建 Sitemap,然后通过 Google Search Console 提交给 Google。 - **内容**:Sitemap 包括 URL、更新频率、优先级等信息,有助于搜索引擎理解...

    提取 sitemap 中的链接,利用百度、必应、谷歌 API 自动 推送至搜索引擎,提升网站收录速度

    创建并定期更新 sitemap 是优化网站 SEO(搜索引擎优化)的重要步骤。 接下来,我们要提取 sitemap 文件中的链接。这通常可以通过编程方式实现,例如使用 Python 的 `xml.etree.ElementTree` 库解析 XML 文件,遍历...

    Google SiteMap生成工具使用说明

    Google Sitemap生成工具是一款由Google官方提供的工具,旨在帮助网站管理员轻松创建并维护Sitemap。该工具支持多种平台,包括Windows和Linux,并且具备高度自定义功能,可以适应不同类型的网站需求。 #### 2.2 生成...

    源代码-Google SiteMap自动生成程序.zip

    【标题】"Google SiteMap自动生成程序"是一个用于创建XML Sitemap的源代码项目,它可以帮助网站管理员方便快捷地为搜索引擎生成站点地图。Sitemap是网站结构的重要组成部分,它提供了网站页面的完整列表,包括每个...

    ASP源码—Google SiteMap自动生成程序.zip

    在本压缩包中,"ASP源码—Google SiteMap自动生成程序.zip" 提供了一个利用ASP技术编写的Google Sitemap生成器。Google Sitemap是网站管理员向Google提交的一种XML格式的文件,它列出了网站的所有页面,帮助搜索引擎...

    [论坛社区]Google Sitemap生成器 v3.0 for phpwind 6.3.2_sitemap.zip

    Google Sitemap生成器则是一个自动化工具,能够自动生成这样的文件,节省手动创建的时间和精力。 【描述】中的内容与标题相同,再次强调了这是一个用于phpwind 6.3.2论坛系统的Google Sitemap生成器的版本号。 ...

    sitemap 生成工具 生成器

    5. 下载与提交:将生成的Sitemap文件下载到本地,然后通过Google Search Console或其他搜索引擎的提交工具将其提交给搜索引擎。 **Sitemap.exe 和 说明_Readme.html** "Sitemap.exe" 可能是该Sitemap生成工具的可...

    基于ASP的Google SiteMap自动生成程序.zip

    【标题】"基于ASP的Google SiteMap自动生成程序"指的是一个使用Active Server Pages(ASP)技术开发的应用程序,它的主要功能是为网站自动生成Google SiteMap。Google SiteMap是一种XML格式的文件,它包含了网站的...

    ASP论坛网站实例开发源码——Google Sitemap生成器实例开发.rar

    ASP论坛网站实例开发源码——Google Sitemap生成器实例开发是一个关于使用ASP语言构建的论坛网站功能扩展项目,主要目标是生成Google Sitemap文件。这个Sitemap生成器可以帮助搜索引擎更好地索引论坛内容,提高网站...

    Laravel开发-sitemap

    在Laravel框架中,生成Google Sitemap是提升网站SEO(搜索引擎优化)的重要步骤。Sitemap是一种XML文件,它列出了网站的主要页面和其他重要资源,帮助搜索引擎更好地理解和索引网站内容。下面将详细介绍如何在...

    ASP论坛网站实例开发源码——Google Sitemap生成器实例开发.zip

    ASP论坛网站实例开发源码——Google Sitemap生成器实例开发是一个专为ASP编程语言设计的项目,用于帮助网站管理员创建和维护Google Sitemap。Google Sitemap是网站与搜索引擎之间的一个重要桥梁,它允许搜索引擎更...

    Go-一个sitemap生成工具。支持baidu等国内sitemap格式。

    标题中的“Go-一个sitemap生成工具”指的是使用Go编程语言编写的一款软件,其主要功能是创建站点地图(Sitemap)。Sitemap是网站管理员为搜索引擎提供的一种文件,它列出了网站的所有重要页面,以便搜索引擎能够更好...

    老虎Sitemap生成器0.6.1

    1. **多格式支持**:老虎Sitemap生成器可能支持XML、HTML和TXT等多种Sitemap格式,每种格式都有其特定的应用场景,如XML格式是Google、Bing等搜索引擎推荐的格式,而HTML格式则更便于人类阅读。 2. **自定义设置**:...

    sitemap

    在IT领域,特定的工具如XML Sitemap Generator或Google的Sitemap Creator可以生成XML格式的站点地图,便于提交给搜索引擎。 2. **说明.txt**:这通常是包含软件或服务详细信息的文本文件。用户可以通过阅读这个文件...

    discuz3.2 3.0网站地图sitemap.xml自动生成自动更新

    3.2 和 3.0 版本提供的一种功能,允许管理员便捷地创建并维护站点的Sitemap.xml文件。这个功能使得每次网站内容更新时,Sitemap.xml会自动更新,确保搜索引擎能够迅速发现新内容,从而提高网站的可见性和排名。 ...

Global site tag (gtag.js) - Google Analytics