在线版的Googlesitemap文件生成器
而xml-sitemaps这个网站正是提供这样的服务,一个在线版的Google sitemap文件生成器,不过由于免费版的,所以最大只能索引500个页面,对于大型网站来说,这是远远不够的。如果你需要无限制版本,那么就需要支付14.99美元。
链接:http://www.xml-sitemaps.com
SiteMapBuilder.Net
SiteMapBuilder是Microsoft Visual Studio 2005 (简体中文版)的一个免费插件程序,用来自动生成站点地图文件Web.sitemap。
具体功能:
1、可以自动为解决方案中的每个Web项目,根据目录结构生成一个Web.sitemap文件。
2、以"APP_"、 "BIN"开头的目录中的文件不会添加到Web.sitemap文件中。
3、只有扩展名为"ASPX"、"HTML"和"HTM"的文件才会添加到站点地图文件中。
4、如果项目中已有Web.sitemap文件,SiteMapBuilder自动生成的SiteMapBuilder文件可以保留原来的设置。
SiteMapBuilder.Net v1.5在此下载
运行这个工具前,请确保您的电脑已经装好Microsoft .NET Framework。不然将无法使用。点击下载.Net Framework>>
Gsitemap
Gsitemap 让你可以创建一个可以被用于你的 Google 网站地图说明来改善你的网站索引的 Google 网站地图.该软件可以抓取你的整个网站通过使用过滤器排除某些部分,验证链接并且还可以使用一个内置的 FTP 客户端上传你完成的网站地图.其它的功能包括 Gzip 压缩,最新修改的默认值,改变频率和优先权,以及载入 XML 网站地图配置文件的功能
下载:天空软件下载
Gsitemap 0.97a绿色版
Google SiteMap文件生成工具 V1.0
程序需要.net1.1支持。本程序主要是将站点下的文件列举出来,并按照Google的标准,生成供Google搜索使用的SiteMap.xml文件,这样可以使Google能够更准确的对你的网站做Deep Search。
尽管Google也提供了用于生成SiteMap.xml文件的工具,但脚本必须运行在服务端,且受到语言环境的限制。对于一些如虚拟主机的用户可能无法实现。本程序通过在本地计算机上进行文件扫描的方式来列举出站点的所有文件,并生成XML文档。
使用说明:
你只需要填写站点在本机的目录和站点地址,设置权重、更新频率,或者只对某些文件类型进行扫描,设置完后,点击扫描,最后导出即可。
如你的站点为http://test.com/,该站点的文件在你本机上为c:webtest目录下,程序通过扫描webtest目录(包括子目录)下的文件来生成,如c:webtestindex.html,则变为http://test.com/index.html。
下载地址:硅谷动力
ASP代码版Sitemap生成器
<%
Server.ScriptTimeout=50000
' sitemap_gen.asp
' A simple script to automatically produce sitemaps for a webserver‚ in the Google Sitemap Protocol (GSP)
' by Francesco Passantino
' www.iteam5.net/francesco/sitemap
' v0.2 released 5 june 2005 (Listing a directory tree recursively improvement)
'
' BSD 2.0 license‚
' http://www.opensource.org/licenses/bsd-license.php
' 收集整理: 重庆森林@im286.com
' 部分修改: 独人向晚
session("server")="http://www.coosuo.com" '你的域名
vDir = "/" '制作SiteMap的目录‚相对目录(相对于根目录而言)
set objfso = CreateObject("Scripting.FileSystemObject")
root = Server.MapPath(vDir)
'response.ContentType = "text/xml"
'response.write "<?xml version='1.0' encoding='UTF-8'?>"
'response.write "<urlset xmlns='http://www.google.com/schemas/sitemap/0.84'>"
str = "<?xml version='1.0' encoding='UTF-8'?>" & vbcrlf
str = str & "<urlset xmlns='http://www.google.com/schemas/sitemap/0.84'>" & vbcrlf
Set objFolder = objFSO.GetFolder(root)
'response.write getfilelink(objFolder.Path‚objFolder.dateLastModified)
Set colFiles = objFolder.Files
For Each objFile In colFiles
'response.write getfilelink(objFile.Path‚objfile.dateLastModified)
str = str & getfilelink(objFile.Path‚objfile.dateLastModified) & vbcrlf
Next
ShowSubFolders(objFolder)
'response.write "</urlset>"
str = str & "</urlset>" & vbcrlf
set fso = nothing
Set objStream = Server.CreateObject("ADODB.Stream")
With objStream
'.Type = adTypeText
'.Mode = adModeReadWrite
.Open
.Charset = "utf-8"
.Position = objStream.Size
.WriteText=str
.SaveToFile server.mappath("/sitemap.xml")‚2 '生成的XML文件名
.Close
End With
Set objStream = Nothing
If Not Err Then
Response.Write("<script>alert('成功生成站点地图!');history.back();</script>")
Response.End
End If
Sub ShowSubFolders(objFolder)
Set colFolders = objFolder.SubFolders
For Each objSubFolder In colFolders
if folderpermission(objSubFolder.Path) then
'response.write getfilelink(objSubFolder.Path‚objSubFolder.dateLastModified)
str = str & getfilelink(objSubFolder.Path‚objSubFolder.dateLastModified) & vbcrlf
Set colFiles = objSubFolder.Files
For Each objFile In colFiles
'response.write getfilelink(objFile.Path‚objFile.dateLastModified)
str = str & getfilelink(objFile.Path‚objFile.dateLastModified) & vbcrlf
Next
ShowSubFolders(objSubFolder)
end if
Next
End Sub
Function getfilelink(file‚datafile)
file=replace(file‚root‚""‚1‚-1‚1)
file=replace(file‚"/"‚"/")
If FileExtensionIsBad(file) then Exit Function
if month(datafile)<10 then filedatem="0"
if day(datafile)<10 then filedated="0"
filedate=year(datafile)&"-"&filedatem&month(datafile)&"-"&filedated&day(datafile)
getfilelink = "<url><loc>"&server.htmlencode(session("server")&file)&"</loc><lastmod>"&filedate&"</lastmod><changefreq>daily</changefreq><priority>1.0</priority></url>"
Response.Flush
End Function
Function Folderpermission(pathName)
'需要过滤的目录(不列在SiteMap里面)
PathExclusion=Array("/blog"‚"/temp"‚"/_vti_cnf"‚"_vti_pvt"‚"_vti_log"‚"cgi-bin"‚"/admin"‚"/edu")
Folderpermission =True
for each PathExcluded in PathExclusion
if instr(ucase(pathName)‚ucase(PathExcluded))>0 then
Folderpermission = False
exit for
end if
next
End Function
Function FileExtensionIsBad(sFileName)
Dim sFileExtension‚ bFileExtensionIsValid‚ sFileExt
'modify for your file extension (http://www.googleguide.com/file_type.html)
Extensions = Array("asp"‚"png"‚"jpeg"‚"zip"‚"pdf"‚"ps"‚"html"‚"htm"‚"php"‚"wk1"‚"wk2"‚"wk3"‚"wk4"‚"wk5"‚"wki"‚"wks"‚"wku"‚"lwp"‚"mw"‚"xls"‚"ppt"‚"doc"‚"wks"‚"wps"‚"wdb"‚"wri"‚"rtf"‚"ans"‚"txt")
'设置列表的文件名‚扩展名不在其中的话SiteMap则不会收录该扩展名的文件
if len(trim(sFileName)) = 0 then
FileExtensionIsBad = true
Exit Function
end if
sFileExtension = right(sFileName‚ len(sFileName) - instrrev(sFileName‚ "."))
bFileExtensionIsValid = false 'assume extension is bad
for each sFileExt in extensions
if ucase(sFileExt) = ucase(sFileExtension) then
bFileExtensionIsValid = True
exit for
end if
next
FileExtensionIsBad = not bFileExtensionIsValid
End Function
%>
PHP代码版Sitemap生成器
程序代码
<?php
header('Content-type: application/xml; charset="GB2312"'‚true);
?>
<!--
@author Tobias Kluge‚ enarion.net
@version 0.2‚ 2005-06-05 17:40 PT
@status working
@update Aditya Naik‚ so1o@so1o.net
@Licence: LGPL
editor: MildSeven@im286.com
-->
<?php
$website = "http://my.xxxxx.com"; /* change this */
$page_root = "/usr/local/psa/home/vhosts/subdomains/my/httpdocs"; /* change this */
/* maybe change this: */
$changefreq = "weekly"; //"always"‚ "hourly"‚ "daily"‚ "weekly"‚ "monthly"‚ "yearly" and "never".
$priority = 0.8;
/* this sets the last modification date of all pages to the current date */
$last_modification = date("Y-m-d/TH:i:s") . substr(date("O")‚0‚3) . ":" . substr(date("O")‚3);
/* list of allowed directories */
$allow_dir[] = "web";
/* list of disallowed directories */
$disallow_dir[] = "admin";
$disallow_dir[] = "_notes";
/* list of disallowed file types */
$disallow_file[] = ".inc";
$disallow_file[] = ".old";
$disallow_file[] = ".save";
$disallow_file[] = ".txt";
$disallow_file[] = ".js";
$disallow_file[] = "~";
$disallow_file[] = ".LCK";
$disallow_file[] = ".zip";
$disallow_file[] = ".ZIP";
$disallow_file[] = ".CSV";
$disallow_file[] = ".csv";
$disallow_file[] = ".css";
$disallow_file[] = ".class";
$disallow_file[] = ".jar";
$disallow_file[] = ".mno";
$disallow_file[] = ".bak";
$disallow_file[] = ".lck";
$disallow_file[] = ".BAK";
/* simple compare function: equals */
function ar_contains($key‚ $array) {
foreach ($array as $val) {
if ($key == $val) {
return true;
}
}
return false;
}
/* better compare function: contains */
function fl_contains($key‚ $array) {
foreach ($array as $val) {
$pos = strpos($key‚ $val);
if ($pos === FALSE) continue;
return true;
}
return false;
}
/* this function changes a substring($old_offset) of each array element to $offset */
function changeOffset($array‚ $old_offset‚ $offset) {
$res = array();
foreach ($array as $val) {
$res[] = str_replace($old_offset‚ $offset‚ $val);
}
return $res;
}
/* this walks recursivly through all directories starting at page_root and
adds all files that fits the filter criterias */
// taken from Lasse Dalegaard‚ http://php.net/opendir
function getFiles($directory‚ $directory_orig = ""‚ $directory_offset="") {
global $disallow_dir‚ $disallow_file‚ $allow_dir;
if ($directory_orig == "") $directory_orig = $directory;
if($dir = opendir($directory)) {
// Create an array for all files found
$tmp = Array();
// Add the files
while($file = readdir($dir)) {
// Make sure the file exists
if($file != "." && $file != ".." && $file[0] != '.' ) {
// If it's a directiry‚ list all files within it
//echo "point1<br>";
if(is_dir($directory . "/" . $file)) {
//echo "point2<br>";
$disallowed_abs = fl_contains($directory."/".$file‚ $disallow_dir); // handle directories with pathes
$disallowed = ar_contains($file‚ $disallow_dir); // handle directories only without pathes
$allowed_abs = fl_contains($directory."/".$file‚ $allow_dir);
$allowed = ar_contains($file‚ $allow_dir);
if ($disallowed || $disallowed_abs) continue;
if ($allowed_abs || $allowed){
$tmp2 = changeOffset(getFiles($directory . "/" . $file‚ $directory_orig‚ $directory_offset)‚ $directory_orig‚ $directory_offset);
if(is_array($tmp2)) {
$tmp = array_merge($tmp‚ $tmp2);
}
}
} else { // files
if (fl_contains($file‚ $disallow_file)) continue;
array_push($tmp‚ str_replace($directory_orig‚ $directory_offset‚ $directory."/".$file));
}
}
}
// Finish off the function
closedir($dir);
return $tmp;
}
}
$a = getFiles($page_root);
echo '<?xml version="1.0" encoding="UTF-8"?>';
?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
<?
foreach ($a as $file) {
?>
<url>
<loc><? echo utf8_encode($website.$file); ?></loc>
<lastmod><? echo utf8_encode(date("Y-m-d/TH:i:s"‚ filectime($page_root.$file)). substr(date("O")‚0‚3) . ":" . substr(date("O")‚3));?></lastmod>
<changefreq><? echo utf8_encode($changefreq); ?></changefreq>
<priority><? echo utf8_encode($priority); ?></priority>
</url>
<?
}
?>
</urlset>
参数说明:
$website--你的域名
$page_root--你的站点的绝对路径
$changefreq--更新时间单位 "always"(始终)‚ "hourly"(小时)‚ "daily"(天)‚ "weekly"(星期)‚ "monthly"(月)‚ "yearly" "never"(从不)
$priority--更新频率
$allow_dir--允许列表的目录
$disallow_dir--禁止列表的目录
$disallow_file--禁止列表的文件类型
制作过程说明:
将以上代码复制到本地存为sitemap.asp或sitemap.php,上传到你的服务器网站的根目录下,运行一下就可以在你指定的目录中(建议最好是指定为根目录)自动生成一个sitemap.xml文件了。最后进入google提交页面:https://www.google.com/webmasters/sitemaps/login,有gmail的可以用gmail直接登录。登录后把生成的xml文件地址按步骤提交就可以了。注:你的网站如果增加了新的页面,可以在增加完后再运行一下sitemap.asp或sitemap.php,并再重新提交一下sitemap.xml文件,这样就可以保证sitemap.xml文件的不断更新了!
相关网址:
Google SiteMap官方生成器及其说明:http://sourceforge.net/project/showfiles.php?group_id=137793&package_id=153422
Google 的相关探索与研究:http://www.netbei.com/Article/zz/zz6/google/Index.html
一种手动制作分析制作SiteMap方法:http://blog.blogchina.com/hooligan/3609116.html
另一个PHP版的sitemap生成程序:
点击下载
运行界面:
==================================================================
自动生成符合GOOGLE要求的网站地图文件
Copyright Top flood
原作者 :
Kloh : TimeSplitters' Games; ImmortalPC :Immortal-PC
Laozei汉化整理 - IP查询、手机地理位置查询、身份证查询
注:
1.请把本程序放入网站根目录执行
2.程序执行前请修改如下参数(或常量)以符合你网站要求:
LIMITLIENPARFICHIER
LIMITLIENINDEXE
$ExtensionsAutorises
$DossiersInterdits
$FichiersInterdits
3.程序将把列表写入多个xml文件(如果你网页比较多的话)
4.sitemap(x).xml文件将写入根目录
URL列表(将写入sitemap)中。。。
./feed.php
./index.php
./error.php
./guestbook.php
./read.php
./tag.php
./tb.php
./view.php
./visit.php
9 行网址将被写入sitemap文件.
sitemap.xml文件生成完毕...
生成文件 sitemap.xml
全部生成完毕
分享到:
相关推荐
这三个平台都提供了相应的 Webmaster 工具,允许开发者提交新内容或更新的 URL。 对于百度,我们可以注册并使用百度站长平台的 API。在 API 文档中,会找到一个名为 "提交 URL" 的接口,通过 POST 请求将 sitemap ...
它是由Xenu's Link Sleuth开发者提供的,这个工具不仅仅是一个简单的sitemap生成器,还具备了强大的网站链接检查功能。通过全面扫描网站,Xenu可以发现死链、错误页面和其他可能影响用户体验和搜索引擎排名的问题。 ...
在选择sitemap生成软件时,应考虑以下几个因素: 1. 支持的搜索引擎:确保软件生成的网站地图符合百度、谷歌等主流搜索引擎的要求。 2. 功能完备性:是否可以自定义设置,如优先级、更改频率等。 3. 更新同步:软件...
生成sitemap后,将其提交到各大搜索引擎的webmaster工具中,如Google Search Console、Bing Webmaster Tools等,以加速索引过程。提交方式通常包括直接上传XML文件或添加sitemap的URL。 总的来说,创建和维护一个...
最近一直招关于站点地图的一些资料,翻了几遍百度和google后 '发现生成站点地图的工具的确比较多,但是易用性以及生成的效率和速度的确不怎么让人满意 '关于Asp生成站点地图的函数也不是很多且易用性不是很强 '所以...
使用这个插件有以下几个关键步骤: 1. 安装:下载名为"帝国CMS-sitemap插件"的压缩包后,将其解压并上传到帝国CMS系统的指定插件目录。然后,在后台管理界面激活并配置插件。 2. 配置:在帝国CMS后台,找到...
这个过程涉及到几个关键知识点,包括 Sitemap 的作用、搜索引擎的工作原理、API 推送以及如何利用百度、必应和谷歌的特定服务来加速网站被搜索引擎收录。 1. **Sitemap**:Sitemap 是一种网站结构的清单,它列出了...
5. **验证和提交**:使用在线工具或编程方式验证生成的XML Sitemap是否符合标准,然后将其提交给主要的搜索引擎,如Google、Bing等。 在C#中,可以使用System.Xml命名空间中的类来处理XML文档,如`XmlDocument`用于...
Sitemap 是一种帮助搜索引擎更好地理解和索引网站内容的工具。对于 Google 而言,一个有效的 Sitemap 可以提高网站的可见性和抓取效率。本文将详细介绍如何使用 ASP 代码创建一个专为 Google 设计的 Sitemap。 首先...
制作网站地图有以下几个关键步骤: 1. **收集网站URL**:首先,工具会遍历整个网站,抓取所有可访问的页面链接。这通常通过爬虫技术实现,确保包含所有内部链接,包括隐藏在下拉菜单或JavaScript中的链接。 2. **...
4. 提交搜索引擎:插件可能提供直接将Sitemap提交给各大搜索引擎的功能,如Google、Bing等,加速网站的索引速度。 5. 用户友好的界面:插件通常会提供一个直观的后台管理界面,允许用户轻松查看、编辑和管理Sitemap...
如果文件很大,可以自动拆分为几个小的Sitemap。主动推送功能可以支持任何网站(只要能提供符合格式的百度sitemap网站地图) 本系统共分三部分:一、 爬虫访问记录分析 二、 生成百度sitemap网站地图(商业版,可...
在SiteMapDemo中,我们可能会遇到以下几个重要的知识点: 1. **网站地图的概念**:网站地图是一种XML文件,列出一个网站的所有页面,提供页面URL、更新频率和优先级等信息。这对于搜索引擎爬虫理解网站的结构至关...
这些工具涵盖搜索引擎优化(SEO)、关键词分析、流量监测、竞争对手研究等多个方面。本文将深入探讨几种重要的站长工具,包括它们的功能、使用方法以及如何帮助提升网站性能和排名。" 【标签】: "SEO, 关键词查询, ...
在提供的压缩包文件名称列表中,我们看到以下几个文件: - `LICENSES.chromium.html`:这通常包含与Chromium相关的许可信息,Chromium是Google Chrome浏览器的基础开源项目,可能意味着生成器使用了Chromium的部分...
结合这些信息,我们可以讨论以下几个IT知识点: 1. **Apache Wicket**:这是一个用于构建Web应用程序的Java框架,它采用模型-视图-控制器(MVC)架构模式,以组件为基础,使得界面和业务逻辑分离,易于测试和维护。...
这个工具可能具有用户友好的界面,只需几步操作就能将网站的新内容提交给百度,无需手动编写代码或者设置复杂的服务器配置。 使用这样的工具对于网站管理员来说具有多方面的益处:首先,它可以确保内容的即时性,...
站点地图,也称为sitemap,是网站优化的重要组成部分,它为搜索引擎提供了一个清晰的导航结构,帮助搜索引擎更好地理解和索引网站内容。本压缩包中的“站点地图自动爬取生成工具.exe”是一个实用工具,旨在简化这一...
7. **流量统计**:类似Google Analytics,这个工具可能集成了访问统计功能,包括访问量、独立访客、页面浏览次数、访问来源、用户行为路径等数据,为决策提供数据支持。 8. **安全监测**:网络安全至关重要,工具...
接下来,我们将详细介绍几种常见的SEO优化工具及其使用方法。 #### 内容与结构工具 1. **搜索引擎抓取内容模拟器** - **简介**: 此工具能够模拟搜索引擎蜘蛛(爬虫)抓取指定网页的过程,展示出被爬取的文本、...