`

如何区分访问者是访客还是爬虫-转

    博客分类:
  • php
阅读更多

为了提高网页的用户体验, 我们经常会做一些对搜索引擎不太友好的事情, 但某些情况下这并不是无法挽回的, 可以通过向自然人和搜索引擎机器人显示不同的内容来提供好的用户体验和 SEO.

听说本方法会触犯搜索引擎的一些操作原则, 有可能被被各搜索引擎处罚, 甚至删除网站. 所以我刚刚已经撤下这样的处理, 直到确定. 有魄力的朋友可以继续使用, 但后果自负. :(

本博客的首页和存档页面以列表的形式显示文章, 在访客点击展开文章时才加载文章的内容. 因为文章的内容部分包含了大量的文字和图片, 需要大量的加载时间和流量. 尽快地向访客展示网页可以挽留大量的来访者. 而对于手机用户来说, 加载时间和流量则更为重要.

一般来说, 网站的首页是搜索引擎访问最多的页面, 应该尽可能的向它们展示有意义的内容, 但是要以列表的形式显示文章的话, 访客和搜索引擎只能获取到文章标题信息. 文章内容或者摘要 (尤其是文章的第一句) 对于 SEO 来说是极其重要的, 所以我们要设法向爬虫发送这些内容.

 

好, 我们可以通过 User Agent 来判断访问者是否为爬虫, 如果是, 则以一般形式显示文章, 否则以列表形式显示文章列表. 可以用以下的 PHP 方法判断是否为爬虫:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
function is_crawler() {
	$userAgent = strtolower($_SERVER['HTTP_USER_AGENT']);
	$spiders = array(
		'Googlebot', // Google 爬虫
		'Baiduspider', // 百度爬虫
		'Yahoo! Slurp', // 雅虎爬虫
		'YodaoBot', // 有道爬虫
		'msnbot' // Bing爬虫
		// 更多爬虫关键字
	);
	foreach ($spiders as $spider) {
		$spider = strtolower($spider);
		if (strpos($userAgent, $spider) !== false) {
			return true;
		}
	}
	return false;
}

这是我使用的方法, 各爬虫以访问评论由高到低进行排序. 然后通过下面的的方法向爬虫和自然人显示不同的内容:

1
2
3
4
5
<?php if(is_crawler()) {
	// 向搜索引擎显示的内容
} else {
	// 向自然人显示的内容
} ?>

细心的朋友可能已经发现本站的首页显示和搜索引擎中的快照有点不一样. 是的, 要的就是这种效果.

PHP 处理方法上文已经提及, 其他语言处理相仿...

 

原文链接:http://www.neoease.com/show-diff-between-crawlers-and-guests/

分享到:
评论

相关推荐

    网站获取访客QQ

    在这个场景中,爬虫可能是用来访问网站并收集与访客QQ相关的信息。它会遵循HTML链接,模拟用户浏览行为,抓取页面内容。为了获取QQ号,爬虫可能需要解析JavaScript代码,因为许多网站会通过JavaScript动态加载或隐藏...

    php 向访客和爬虫显示不同的内容

    一些搜索引擎反对人为区分不同访问者以提供不同内容,认为这属于SEO作弊行为。如果网站采用这种做法,可能会受到搜索引擎的处罚,甚至网站被删除。因此,使用这种方法需要慎重考虑,并随时关注搜索引擎的政策变化。...

    qq空间访客提取软件

    "QQ空间访客提取软件"是一款专为QQ空间设计的工具,它可以帮助用户快速获取访问过他们空间的QQ号码,进而可能生成这些访客对应的QQ邮箱地址。这种软件在市场上的应用主要是数据分析、营销推广或者个人隐私关注等方面...

    QQ空间访客提取应

    QQ空间访客提取是一个涉及到网络数据抓取与分析的技术,主要目标是从QQ空间获取到访问者的信息。在QQ空间这个社交平台上,用户可以查看谁访问了自己的个人主页,但原始的数据通常并不提供批量导出或者自动化获取。...

    QQ空间访客监控采集(绝对免费无毒)

    本话题涉及的是一个名为“QQ空间访客监控采集”的工具,它声称是绝对免费且无毒的,用于追踪并收集特定QQ空间的访问者信息。这款软件通过持续监控目标QQ空间,能够定期更新访客记录,帮助用户了解谁访问了他们的空间...

    2024QQ空间访客监控采集

    本话题涉及的是一个名为“QQ空间访客监控采集”的工具,它声称是绝对免费且无毒的,用于追踪并收集特定QQ空间的访问者信息。这款软件通过持续监控目标QQ空间,能够定期更新访客记录,帮助用户了解谁访问了他们的空间...

    网站访客qq统计网页获取qq系统

    网站访客QQ统计技术是一种网络营销工具,通过特定的编程手段,可以收集并分析访问者在网站上的行为数据,其中最重要的一项就是获取访客的QQ号码。这种技术在商业环境中具有很高的价值,因为它可以帮助企业了解潜在...

    哒哒qq空间访客采集

    【标题】"哒哒qq空间访客采集"是一款专门针对QQ空间访客信息进行抓取与分析的软件工具。这款工具的主要功能是帮助用户获取他们的QQ空间被哪些人访问过,从而实现对潜在客户的定向营销或者数据分析。 【描述】"哒哒...

    QQ空间访客采集器V3.5+注册机

    总结起来,QQ空间访客采集器V3.5是一个用于获取和分析QQ空间访问信息的工具,可能涉及到网络爬虫技术、数据挖掘和社交网络分析。然而,与之相关的注册机使用需谨慎,应支持正版软件并遵守相关法规。在享受技术带来的...

    QQ空间访客提取器

    在互联网社交环境中,了解自己的空间访客有助于用户掌握关注者信息,分析社交影响力,或者对潜在的兴趣群体进行分析。这款软件适用于个人用户想要追踪互动情况,也可能被市场营销人员用于了解目标用户群体的行为习惯...

    访客提取器

    这些访客信息可以是潜在消费者的标识,对于商家来说,它们可以用来进行精准推广,比如推送定制广告、发送营销邮件等,从而提高广告投放的效果和转化率。 QQ空间作为中国最大的社交网络平台之一,拥有大量的活跃用户...

    phpmyvisites

    - **详细的报告**: 提供详细的访问者统计报告,包括访问次数、独立访客、页面浏览量、搜索引擎排名等。 - **访问路径分析**: 分析用户的浏览路径,了解用户在网站上的活动轨迹。 - **搜索引擎分析**: 显示哪些...

    网页计数器源码(php版).rar

    网页计数器是一种常见的网站统计工具,用于记录访问者浏览特定网页的次数。在这个名为"新势力网络网页计数器源码(php版).rar"的压缩包中,我们得到了一套基于PHP语言实现的网页计数器源代码。本文将深入探讨与PHP...

    统计网站总访问量 实例

    为了解决这个问题,一种常见的方法是引入唯一访问者(Unique Visitors)的概念。这是指在一定时间范围内,访问网站的独立用户数量,通常通过Cookie技术实现。当用户首次访问网站时,服务器会在用户的浏览器中设置一...

    Filtering_and_Analyzing_Your_Data

    过滤器可以让我们确定各种事项,例如新访客与回访访客的区分,由特定营销活动发起的访问,以及确定访问者是内部员工还是外部访客。如果选择不对web活动文件应用任何过滤器,那么分析软件将分析所有数据。 然而,...

    php 判断访客是否为搜索引擎蜘蛛的函数代码

    在网站开发过程中,区分访问者是否为搜索引擎蜘蛛是非常重要的。这一技术可以帮助网站在被搜索引擎收录时提供特定的内容或者统计搜索引擎蜘蛛的访问情况。通常情况下,搜索引擎蜘蛛会发送一个特殊的HTTP头部信息,...

    易语言-Post免登陆QQ空间查询好友空间访客

    2. **参数设置**:根据接口文档,设置必要的参数,可能包括好友的QQ号码、访问者的身份验证信息等。 3. **数据解码**:QQ空间返回的数据可能是加密或编码的,需要进行解码或解析才能得到可用的信息。 4. **错误处理*...

Global site tag (gtag.js) - Google Analytics