微软(BING)完全不遵守robots规则
以下是我的robots文件
User-agent: *
Disallow: /
结果在我的日志里却发现有大量的:
[26/Aug/2009:15:23:02 +0800] "GET /xxxxxx HTTP/1.0" 302 165 "-" "msnbot/2.0b (+http://search.msn.com/msnbot.htm)" 65.55.106.115
[26/Aug/2009:15:23:08 +0800] "GET /xxxxxx HTTP/1.0" 302 165 "-" "msnbot/2.0b (+http://search.msn.com/msnbot.htm)" 65.55.106.155
[26/Aug/2009:15:23:29 +0800] "GET /xxxxxx HTTP/1.0" 302 165 "-" "msnbot/2.0b (+http://search.msn.com/msnbot.htm)" 65.55.106.137
[26/Aug/2009:15:23:30 +0800] "GET /xxxxxx HTTP/1.0" 302 165 "-" "msnbot/2.0b (+http://search.msn.com/msnbot.htm)" 65.55.207.95
[26/Aug/2009:15:23:31 +0800] "GET /xxxxxx HTTP/1.0" 302 165 "-" "msnbot/2.0b (+http://search.msn.com/msnbot.htm)" 65.55.106.159
[26/Aug/2009:15:23:34 +0800] "GET /xxxxxx HTTP/1.0" 302 165 "-" "msnbot/2.0b (+http://search.msn.com/msnbot.htm)" 65.55.106.211
[26/Aug/2009:15:23:59 +0800] "GET /xxxxxx HTTP/1.0" 302 165 "-" "msnbot/2.0b (+http://search.msn.com/msnbot.htm)" 65.55.106.227
[26/Aug/2009:15:23:59 +0800] "GET /xxxxxx HTTP/1.0" 302 165 "-" "msnbot/2.0b (+http://search.msn.com/msnbot.htm)" 65.55.106.227
[26/Aug/2009:15:23:59 +0800] "GET /xxxxxx HTTP/1.0" 302 165 "-" "msnbot/2.0b (+http://search.msn.com/msnbot.htm)" 65.55.106.232
[26/Aug/2009:15:23:59 +0800] "GET /xxxxxx HTTP/1.0" 302 165 "-" "msnbot/2.0b (+http://search.msn.com/msnbot.htm)" 65.55.106.182
从日志来看,bing算法相当差,爬行的频率相当高。
这对于我这种动态的应用简直就是一个噩梦,无奈只能强行屏蔽
服务器使用的是nginx。
在配置文件中,添加如下代码:
if ($http_user_agent ~ (msnbot) )
{
return 404;
}
没想到大名鼎鼎的微软,居然也如此无赖
再次来到bing.com
输入
site:我的服务器的域名
可以看到已经没有快照了,虽然有大量的地址。。。。
分享到:
相关推荐
nginx开机自启动配置文件,在[CentOS 7.6 64位]系统下运行正常。 编译安装nginx后,将该配置文件放在服务器的/usr/lib/systemd/system/目录下,然后启动nginx服务。
本文将详细探讨如何通过系统层面和Nginx配置层面的优化,使Nginx能够轻松应对上万甚至十万级别的并发访问。 首先,从系统层面进行优化: 1. **调整同时打开文件数量**:使用`ulimit -n`命令设置系统最大文件描述符...
本文将深入探讨如何通过Nginx配置文件来设置一级域名和二级域名,以及如何利用Nginx的反向代理功能。 首先,了解一级域名和二级域名的概念至关重要。一级域名是互联网上顶级的域名,如.com、.org、.net等。二级域名...
本书第一部分首先讲述了Nginx服务器的功能、模块管理和进程管理,然后讲述Nginx如何处理请求,在这个基础之上再认识Nginx提供的服务器的名字,Nginx服务器最大的焦点在于高并发和反向代理,在不多却足够使用的模块...
本书第一部分首先讲述了Nginx服务器的功能、模块管理和进程管理,然后讲述Nginx如何处理请求,在这个基础之上再认识Nginx提供的服务器的名字,Nginx服务器最大的焦点在于高并发和反向代理,在不多却足够使用的模块...
Nginx 1.14.2是该软件的一个特定版本,它包含了一系列的改进和优化,旨在提升性能和安全性。 其次,PHP(Hypertext Preprocessor)是一种开源的服务器端脚本语言,尤其适合Web开发,可以嵌入到HTML中。在这里,我们...
本书第一部分首先讲述了Nginx服务器的功能、模块管理和进程管理,然后讲述Nginx如何处理请求,在这个基础之上再认识Nginx提供的服务器的名字,Nginx服务器最大的焦点在于高并发和反向代理,在不多却足够使用的模块...
在Mac上安装Nginx的过程中,我们通常会借助Homebrew这一强大的包管理工具。Homebrew是Mac OS系统下的一个开源包管理器,它允许用户轻松地安装、管理和更新各种开源软件,包括Nginx。以下是详细的步骤: 1. **安装...
决战Nginx 技术卷:高性能Web服务器部署与运维
以下是关于Nginx服务器屏蔽与禁止屏蔽网络爬虫的方法的详细说明: 首先,我们可以通过Nginx的配置文件来识别并阻止特定类型的网络爬虫。这通常涉及到对`http_user_agent`头字段的检查,该字段包含了发送请求的用户...
安装完毕后,我们需要编辑Nginx的配置文件,通常位于`/etc/nginx/nginx.conf`或`/etc/nginx/sites-available/`目录下,创建一个新的虚拟主机配置。例如,创建一个名为`myweb.conf`的文件,并添加以下内容: ``` ...
Nginx屏蔽指定接口的操作方式主要涉及到编辑Nginx配置文件,在合适的server块中添加location块,并在其中使用return指令返回错误码,如403禁止访问。具体操作步骤如下: 1. 打开Nginx的主配置文件nginx.conf。通常...
【标题】"nginx-rtmp+ffmpeg——livepush.war包" 涉及到的是一个实时流媒体处理的解决方案,结合了Nginx-RTMP模块和FFmpeg工具,以及一个名为`livepush.war`的应用程序。这个组合常用于将RTSP视频流进行转换和分发。...
nginx代理 从入门到实践 详细讲解分析,入门到精通,满足企业部署,反向代理,静态资源部署,并发
《Nginx Cookbook: Recipes for High Performance》这本书聚焦于如何利用Nginx实现高性能的网络服务。Nginx是一款流行的开源Web服务器,以其高效的性能、反向代理、负载均衡和内容缓存等功能著称。本资源包含了一份...
【架构设计:负载均衡层设计方案(2)——Nginx 安装1】 在构建复杂的IT系统时,负载均衡是确保服务稳定性和可扩展性的重要组成部分。Nginx作为一个流行的高性能反向代理服务器和负载均衡器,其在架构设计中的角色...
《实战Nginx取代Apache的高性能Web服务器》一书,主要探讨了如何利用Nginx这一现代、高性能的Web服务器来替代传统的Apache服务器,以提升网站的运行效率和响应速度。Nginx以其异步非阻塞的I/O模型、模块化设计以及...
nginx:alpine离线镜像包,使用docker load -i nginxalpine.tar
在Java面试中,Nginx是一个经常被提及的技术点,特别是在高级面试中,因为它在分布式系统、高并发和负载均衡中的重要角色。本面试专题主要围绕Nginx的基础概念、功能特性、配置与优化以及其在Java应用中的作用展开。...