`

设置apache日志记录蜘蛛爬行 转自百度HI

阅读更多

apache日志为什么不记录百度蜘蛛?这个问题相信很多初学者都基本碰到了,apache日志默认是不记录百度蜘蛛、谷歌和各大搜索引擎的蜘蛛程序的,但只需要修改一个地方就可以解决这个问题,现在就直接将答案写出来:
比如曾经有个朋友在百度知道中提问:
<IfModule log_config_module>
LogFormat “%h %l %u %t \”%r\” %>s %b \”%{Referer}i\” \”%{User-Agent}i\”" combined
LogFormat “%h %l %u %t \”%r\” %>s %b” common
<IfModule logio_module>
LogFormat “%h %l %u %t \”%r\” %>s %b \”%{Referer}i\” \”%{User-Agent}i\” %I %O” combinedio
</IfModule>
CustomLog “logs/access.log” common
</IfModule>
这是我目前的设置,不记住主机名
哪位给我提供个范本 记录访问明细和主机头记录蜘蛛的

1、打开httpd.conf文件找到以下部分:
LogFormat “%h %l %u %t \”%r\” %>s %b \”%{Referer}i\” \”%{User-Agent}i\”" combined

LogFormat “%h %l %u %t \”%r\” %>s %b” common

LogFormat “%{Referer}i -> %U” referer

LogFormat “%{User-agent}i” agent

具体有关LogFormat的用法请参照:

2、接着我们继续向下移动,找到虚拟主机配置段,也就是VirtualHost段,这个是由你自己来配置的。本站的虚拟主机的日志文件是这样设置的:
如果你想记录百度蜘蛛的访问全称,就按色部分设置:

CustomLog /var/html/faq/logs/linux520-access.log combined

如果不想记录百度蜘蛛的头部分,则如下设置:

CustomLog /var/html/faq/logs/linux520-access.log common

按照以上设置一下,看看你的日志文件是否发生变化了。

 

文章了链接源自:http://hi.baidu.com/vbkan/blog/item/8629fa01c17ae5107aec2c41.html

分享到:
评论

相关推荐

    PHP版蜘蛛爬行记录器

    1. **日志分析**:记录器首先会读取服务器的访问日志文件,通常是Apache或Nginx的日志。这些日志包含了每次HTTP请求的信息,包括请求的URL、时间戳、HTTP状态码、用户代理等。 2. **用户代理识别**:通过对用户代理...

    Apache Log的每日一个日志文件及选择性记录设置

    ### Apache Log的每日一个日志文件及选择性记录设置 #### 概述 在实际运维过程中,Apache服务器的日志文件可能会因为访问量过大而变得异常庞大,这不仅占用大量磁盘空间,还会影响日志分析的效率。为了解决这一...

    Apache日志分析手册

    Apache日志分析手册详细介绍了如何在Linux环境下利用Apache服务器的访问日志来分析和诊断问题。在生产环境中,服务器的运行状况往往可以通过日志文件得到反映,特别是在发现访问量异常、响应缓慢或出现错误信息时。...

    天智Apache日志查看器 v1.5.zip

    使用天智Apache日志查看器时,用户应先确保计算机上已经安装了Apache服务器,并且正确配置了日志记录设置。然后,通过软件导入Apache的日志文件,或者设置自动监测日志目录,以便实时查看日志信息。根据需求,可以...

    天智Apache日志分析器

    Apache日志分析是运维人员和网站开发者日常工作中不可或缺的一部分,它可以帮助我们理解网站的访问情况,检测潜在的问题,以及优化网站性能。"天智Apache日志分析器"是一款专为这项任务设计的工具,由VC++编程语言...

    如何按日期生成apache日志文件及限制apache日志文件大小

    - **按时间滚动**:例如,错误日志设置为`ErrorLog "|/data/apache/bin/rotatelogs 日志存放目录/%Y%m%d_error.log 86400 480"`,这会每天创建一个新的日志文件,并且可以根据需要设置480分钟(8小时)的时间偏移。...

    网站蜘蛛记录器 v1.3

    网站蜘蛛记录器是由蓝途工作室独立开发的又款免费程序.主要功能是记录各大搜索引擎对网站采集情况.实时记录百度,谷歌蜘蛛的爬行轨迹,分析.达到更好的优化网站的目的。程序模块:系统首页:管理员登陆后台首页,显示...

    APACHE日志分析工具

    很多apache日志分析工具都是要安装到服务器上的,而且安装非常麻烦,于是我写了一个单机版(exe,Windows),方便大家分析apache访问日志,绿色版的,直接解压就可以用。 功能: 1、导入apache访问日志; 2、访问...

    apache日志切割

    Apache日志切割是网络管理员维护服务器的重要操作,它有助于管理和分析服务器的日志数据。日志文件通常会随着时间的推移而不断增长,大型日志文件不仅占用存储空间,还可能导致查看和搜索特定信息变得困难。因此,...

    Web应用安全:apache日志配置.pptx

    在kali,访问日志被记录在”/var/log/apache2/”中,在这个文件夹中三个后缀名为“.log”的文件中(windows则保存在后缀名为“.txt”的文件中)。 日志文件 查看日志文件 apache日志配置 远程主机IP E-mail(常为空白...

    apache日志分析系统免费版V1.6

    Apache日志分析系统免费版V1.6是一款专为管理和解析Apache服务器日志设计的工具。这个系统能够帮助用户深入理解网站的访问情况,提供详细的数据统计和分析,包括但不限于访问量、用户行为、热门页面、来源IP、浏览器...

    apache日志分析系统awStats完全教材

    # 原始日志记录设置 # CustomLog logs/access_log.log common env=!image-request # 新的日志记录设置 CustomLog "|bin/cronolog.exe logs/access_%Y%m%d.log" common env=!image-request ``` 通过这种方式,每个...

    debian apache日志服务器配置

    最后,在Apache服务器配置文件中调整日志设置。打开`/etc/apache2/sites-enabled/000-default`(或你的默认站点配置文件),找到日志部分,修改为: ```apache CustomLog "|/usr/bin/logger -p local5.info" ...

    apache日志分割

    Apache,作为最流行的开源Web服务器,会产生大量的访问日志,这些日志记录了所有客户端请求的详细信息。随着时间的推移,单个日志文件可能会变得非常庞大,不仅占用大量磁盘空间,而且在查询或分析时会变得效率低下...

    Web应用安全:apache日志配置.docx

    在Web应用安全领域,理解并正确配置Apache日志是至关重要的,因为这些日志提供了关于服务器活动、潜在攻击和性能问题的关键信息。本文将深入探讨Apache日志配置,帮助读者掌握如何管理和分析这些日志。 一、Apache...

    查看apache日志

    - `ErrorLog`:用于指定错误日志的文件位置,记录Apache运行过程中遇到的所有错误信息。 - `LogLevel`:控制日志记录的详细程度,可选择`crit`(关键)、`error`(错误)、`warn`(警告)、`notice`(通知)、`...

    百度强引蜘蛛程序易语言开源

    标题中的“百度强引蜘蛛程序”是指一种利用易语言编程实现的搜索引擎优化工具,主要目的是为了提高网站在百度搜索引擎中的排名。易语言是一种基于中文的编程语言,它以直观的汉字编程语法为特色,旨在降低编程门槛,...

    shell 处理apache日志入库

    shell 处理apache日志入库 awk分析apache日志为*.sql文件 sqlplus写入oracle

    基于hadoop平台的pig语言对apache日志系统的分析

    标题 "基于Hadoop平台的Pig语言对Apache日志系统的分析" 涉及到的主要知识点包括Hadoop、Pig语言以及Apache服务器日志的处理。以下是对这些关键概念的详细解释: 1. Hadoop平台: Hadoop是Apache软件基金会开发的...

Global site tag (gtag.js) - Google Analytics