`
hudeyong926
  • 浏览: 2035067 次
  • 来自: 武汉
社区版块
存档分类
最新评论

实现蜘蛛捕捉的PHP代码

    博客分类:
  • SEO
阅读更多

SEO(Search Engine Optimization),汉译为搜索引擎优化,为近年来较为流行的网络营销方式,主要目的是增加特定关键字的曝光率以增加网站的能见度,进而增加销售的机会。分为站外SEO和站内SEO两种。SEO的主要工作是通过了解各类搜索引 擎如何抓取互联网页面、如何进行索引以及如何确定其对某一特定关键词的搜索结果排名等技术,来对网页进行相关的优化,使其提高搜索引擎排名,从而提高网站 访问量,最终提升网站的销售能力或宣传能力的技术。

 

很多做seo的, 经常会问为什么我的页面没有被收录,为什么我的快照还是上个星期的,怎么百度还不更新我的站点。这些都是刚入门问的问题。做seo的人都知道,知道搜索引 擎的规律很重要。你要知道蜘蛛是否来过你的站点,什么时候来 过,是哪家蜘蛛。这些都有利于你针对性的做优化。

很多服务器支持蜘蛛爬行日志,但是大部分站长都是虚拟机,有的空间并不支持记录蜘蛛爬行。这时候就需要我们编写代码来记录蜘蛛的活动规律。

在网上找了很多的代码都不能正确使用,或者功能不完善。

只要自己研究起来。总结出一下一套代码,百分百保证使用。

<?php
function get_naps_bot(){
	$useragent = strtolower($_SERVER['HTTP_USER_AGENT']);

	if (strpos($useragent, 'googlebot') !== false){
		return 'Googlebot';
	}
	if (strpos($useragent, 'msnbot') !== false){
		return 'MSNbot';
	}
	if (strpos($useragent, 'slurp') !== false){
		return 'Yahoobot';
	}
	if (strpos($useragent, 'baiduspider') !== false){
		return 'Baiduspider';
	}
	if (strpos($useragent, 'sohu-search') !== false){
		return 'Sohubot';
	}
	if (strpos($useragent, 'lycos') !== false){
		return 'Lycos';
	}
	if (strpos($useragent, 'robozilla') !== false){
		return 'Robozilla';
	}
	return false;

}

function nowtime(){
	$date=date('Y-m-d.G:i:s');
	return $date;
}

$searchbot = get_naps_bot();
if ($searchbot) {
	$tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']);
	$url=$_SERVER['HTTP_REFERER'];
	$file='robotslogs.txt';
	$time=nowtime();
	$data=fopen($file,'a');
	$PR='$_SERVER[REQUEST_URI]';
	fwrite($data,'Time:$time robot:$searchbot URL:$tlc_thispage\n page:$PR\r\n');
	fclose($data);
}
?>

以上代码比网上流传的版本多了个记录搜索引擎请求页面记录,可以看到蜘蛛每次来爬取的是那个页面。更加利于分析蜘蛛对网站的权重以及对不同栏目和页 面的青睐。

Seo最终的是从实际出发,用数据说话,而不是凭空想象。一切优化的基础都是数据,一切优化的目的也是为了得到数据。

分享到:
评论

相关推荐

    Java实现蜘蛛纸牌代码

    【Java实现蜘蛛纸牌代码】是一个典型的编程项目,它涉及到计算机科学中的游戏开发、图形用户界面(GUI)设计以及算法实现等多方面知识。蜘蛛纸牌是一款流行的经典单人纸牌游戏,通常由Windows系统内置,玩家需要通过...

    java实现的蜘蛛纸牌源代码

    【Java实现的蜘蛛纸牌源代码】是一种基于Java编程语言开发的桌面游戏,它复现了经典的蜘蛛纸牌玩法。这种游戏通常包括排列和消除纸牌以完成关卡的目标。在给定的压缩包中,有两个主要部分:打包发布的可执行文件和...

    jQuery蜘蛛纸牌电脑版游戏代码.zip

    jQuery蜘蛛纸牌电脑版游戏代码下载地址jQuery实现Windows扑克牌小游戏代码,使用jQuery基于CSS3制作的WINDOWS7系统电脑自动的蜘蛛纸牌游戏基于jquery实现的蜘蛛纸牌电脑版HTML5源码-Javascript...-... 2022年3月20日 ...

    搜索引擎蜘蛛捕捉php版

    Spider是搜索引擎的一个自动程序。... 搜索引擎派出“蜘蛛”程序...搜索引擎的“蜘蛛”同一天会对某些网站或同一网页进行多次爬行,知道蜘蛛的运动规律,对于更新网页、了解搜索引擎收录的收录情况等等有相当重要的作用。

    蜘蛛纸牌完整代码+成品

    2. **模型层**:这部分代码实现了蜘蛛纸牌的游戏逻辑,包括发牌、移牌、洗牌等规则,以及判断游戏是否胜利的条件。 3. **视图层**:这部分代码负责展示游戏界面,包括牌桌布局、用户交互元素(如按钮、文本框)等,...

    java蜘蛛纸牌源代码

    【标题】"java蜘蛛纸牌源代码"是一个关于使用Java编程语言实现的蜘蛛纸牌游戏的项目。这个项目不仅包含了源代码,还提供了所需的图片资源和可执行程序,使得用户可以直接运行并理解游戏的实现过程。 【源代码】在...

    搜索引擎蜘蛛捕捉asp.net版

    "搜索引擎蜘蛛捕捉asp.net版"这个标题暗示了我们将探讨如何在ASP.NET环境中实现搜索引擎爬虫的功能。 搜索引擎蜘蛛,也称为网络爬虫或Web机器人,是自动遍历互联网并抓取网页的程序。它们是搜索引擎索引网页内容的...

    蜘蛛纸牌游戏代码

    而“laitespider”可能是一个Java源代码文件,包含了蜘蛛纸牌游戏的主要实现代码。 总的来说,这个项目不仅锻炼了学生对Java编程的掌握,还提升了他们的问题解决能力、文档撰写能力和项目管理技巧。通过这样的课程...

    网络蜘蛛核心源代码

    虽然给定的代码片段展示了一个基于C#的网络请求处理框架的一部分,但网络蜘蛛的实际实现涉及更广泛的组件和技术。理解这些核心逻辑对于开发高效且符合道德规范的网络蜘蛛至关重要。无论是使用Java、C#还是其他编程...

    蜘蛛劫持跳转代码.xmind

    蜘蛛劫持跳转代码

    Java-蜘蛛纸牌源代码

    【Java-蜘蛛纸牌源代码】是一个用Java编程语言实现的蜘蛛纸牌游戏的源代码。这个项目包含了一些核心的类和资源文件,使得开发者能够理解游戏的逻辑并可以直接将其集成到自己的Java项目中。 首先,`Spider.java`是...

    蜘蛛纸牌java代码

    Java代码实现的蜘蛛纸牌项目不仅是一个有趣的编程练习,也能够帮助开发者提升面向对象编程、图形界面设计和算法设计的能力。通过分析和理解这个项目,我们可以学习到如何将复杂的游戏逻辑转化为清晰的代码结构,以及...

    JavaScript实现蜘蛛纸牌

    JavaScript实现蜘蛛纸牌游戏是一种利用Web技术开发的桌面游戏,主要依赖于JavaScript语言来处理游戏逻辑、用户交互以及页面渲染。下面将详细讲解这个话题的相关知识点。 1. JavaScript基础: JavaScript是Web开发...

    java swing实现蜘蛛纸牌

    在这个“java swing实现蜘蛛纸牌”的项目中,开发者使用Swing来创建了一个经典的蜘蛛纸牌游戏。接下来,我们将深入探讨Java Swing在游戏开发中的应用,以及蜘蛛纸牌游戏的基本规则和实现原理。 首先,Java Swing...

    php网站蜘蛛爬行记录代码+文章系统

    标题中的“php网站蜘蛛爬行记录代码+文章系统”表明这是一个关于PHP编程的项目,主要功能包括监控网站上的搜索引擎蜘蛛爬行活动以及提供一个文章管理系统。这个系统可能用于记录搜索引擎如百度、Google等的爬虫访问...

    Java 蜘蛛牌游戏 课程设计 java蜘蛛牌源代码

    Java蜘蛛牌游戏是一款经典的桌面游戏实现,它结合了编程技术与游戏逻辑,是学习Java编程过程中一个很好的实践项目。本项目提供了完整的源代码,无需额外配置,即可直接运行,为初学者提供了一个直观的学习平台。 ...

    蜘蛛纸牌源代码

    【标题】"蜘蛛纸牌源代码"涉及到的是一个基于Java编程语言实现的简化版蜘蛛纸牌游戏。在计算机科学和编程领域,蜘蛛纸牌是一种广受欢迎的单人纸牌游戏,而在这里,它被作为Java课程设计的一个项目,旨在帮助学生理解...

    网络蜘蛛源代码

    网络蜘蛛源代码,你块下

Global site tag (gtag.js) - Google Analytics