`
canofy
  • 浏览: 831113 次
  • 性别: Icon_minigender_1
  • 来自: 北京、四川
社区版块
存档分类
最新评论

找访问日志中404的url地址

阅读更多
查找服务器上访问日志中出现了404的记录,并把地址替换成web可访问的方式,最后并发送邮件

重点:
这里主要应用了sed的正则表达式来进行查找替换,也用到了分组
发送邮件使用了email命令(mail命令貌似被禁了,发不出邮件,email命令应该需要装个什么东东吧,反正是在线下的服务器上没看到这个命令)进行发送,这个网上介绍的似乎很少,
用公司的邮箱发送不出去,到最后问了系统的管理员才知道是服务器把公司的smtp服务器直接给屏蔽掉了,最后只要用的是另外的邮箱发送,需要用户名和密码,没有直接使用mail命令简单。

日志格式:
211.139.190.202 - - [24/May/2009:10:11:33 +0800] GET /fggamedown/soh/soh?df=x&t=1&fr=qq&posid=5012 HTTP/1.1 404 763 - - - 10.45.46.238
211.137.69.234 - - [24/May/2009:10:11:41 +0800] POST /fggamedown/zyw/zyw001/ HTTP/1.1 404 763 - - - -
211.139.190.202 - - [24/May/2009:10:13:41 +0800] GET /fggamedown/zyw/zyw003/zyw003.jpg HTTP/1.1 404 763 http://wap.soso.com/game/index.jsp?sid=vshvjZDa/ayXmdFJoYat3g==&key=%E5%B0%84%E5%87%BB&paramBrand=sonyeric&pno=10 - - 10.45.2.41
211.139.190.202 - - [24/May/2009:10:13:53 +0800] GET /fggamedown/soh/soh?df=x&t=1&fr=qq&posid=5012 HTTP/1.1 404 763 - - - 10.45.46.238
211.138.172.201 - - [24/May/2009:10:14:10 +0800] POST /fggamedown/szm/szm002/ HTTP/1.1 404 763 - SAMSUNG-SGH-X628/1.0/WAP2.0 Profile/MIDP-2.0 Configuration/CLDC-1.1/*MzU3NzExMDAwMjkzMTI3 UP.Browser/6.2.3.3.c.1.101 (GUI) MMP/2.0 - -
211.137.59.23 - - [24/May/2009:10:14:26 +0800] GET /fggamedown/soh/soh004/more.jsp?sid=yqyyl1iUpZiXmdFJoYat3g==&key=%E8%B5%9B%E8%BD%A6&pB=&rB=%E8%AF%BA%E5%9F%BA%E4%BA%9A&format=jar&pid=1&title=%E6%9E%81%E5%93%81%E9%A3%9E%E8%BD%A6%E7%94%9F%E6%AD%BB%E5%8D%A1%E6%9C%AC%E8%B0%B7%28EA%E6%AD%A3%E7%89%88%29 HTTP/1.1 404 778 - - - 10.200.183.128
211.137.59.23 - - [24/May/2009:10:17:53 +0800] POST /fggamedown/soh/soh004/index.jsp?sid=yqyyl1iUpZiXmdFJoYat3g==&key=%E8%B5%9B%E8%BD%A6&paramBrand=&total=29 HTTP/1.1 404 778 - - - 10.200.183.128
211.137.69.234 - - [24/May/2009:10:23:32 +0800] POST /fggamedown/brw/brw001/ HTTP/1.1 404 763 - - - -
211.94.164.200 - - [24/May/2009:10:43:25 +0800] GET http://59.151.101.81:80/fggamedown/086/086003/download.do?op=download&bid=001&gid=086003&cid=007&id=16473&site=&posid=120&fmt=jad HTTP/1.1 404 778 - LENOVO-i921/240A - 10.92.250.3


shell脚本
lastday=`date --date="1 day ago" +%Y-%m-%d`;
accesslog_path=/var/log/accesslog;
log_name=${accesslog_path}"/"localhost_access_log.$lastday.txt;

grep -e "1.. 404" ${log_name}|sed -n 's/^.*T.\(\/.*ja[rd]\).*HTTP.*$/http:\/\/192.168.1.1\1/p'>/usr/local/tomcat-5.0.28/webapps/webdav/error404_monitor.txt;


email -f "***@126.com" -s "test" -n "name" -r "smtp.126.com" -u "***" -i "***" -m login "***@gmail.com"</usr/local/tomcat-5.0.28/webapps/webdav/error404_monitor.txt



最后的结果类似如下:
http://192.68.1.1/fggamedown/076/076001/sghx_SEK700.jad
http://192.68.1.1/fggamedown/076/076001/sghx_n7370.jar
http://192.68.1.1/fggamedown/076/076001/sghx_E398.jar
分享到:
评论

相关推荐

    php当访问你不想让他看的URL网址时,就返回个404,即禁止访问某些PHP页面的方法.zip

    在上述代码中,`is_banned_page()`是一个假设存在的函数,用于检查当前请求的URL是否在禁止访问的列表中。如果在,则返回404状态并显示错误信息。 ### 2. 使用.htaccess文件 Apache服务器可以通过`.htaccess`配置...

    nginx网站访问日志可视化

    总的来说,"nginx网站访问日志可视化"项目展示了如何利用Python的处理能力、数据库的存储优势,以及pyecharts的可视化特性,从Nginx日志中挖掘有价值的信息,并以直观的方式呈现出来。这不仅对于系统运维人员监控和...

    iis日志分析和tomcat日志分析(python语言)

    Tomcat日志包括标准输出、错误输出以及访问日志,提供了关于应用运行情况的详细信息。访问日志通常遵循自定义的格式,比如Common Log Format(CLF)或Combined Log Format,记录了每个HTTP请求的详细信息。通过分析...

    Nginx日志管理介绍

    通过访问日志,你可以得到用户地域来源、跳转来源、使用终端、某个URL访问量等相关信息;通过错误日志,你可以得到系统某个服务或server的性能瓶颈等。因此,将日志好好利用,你可以得到很多有价值的信息。 参数明细...

    web服务器的访问日志

    这些日志文件包含了诸如客户端IP地址、请求时间、请求的URL、HTTP状态码(如200表示成功,404表示未找到)、发送的数据量以及用户代理等信息。通过对这些数据进行分析,我们可以获取以下重要知识点: 1. **流量统计...

    Nginx自定义访问日志的配置方式

    通过访问日志,你可以得到用户地域来源、跳转来源、使用终端、某个URL访问量等相关信息。 日志的重要性不言而喻,一般来说我们开发过程中会为每个项目定义自己的日志格式以及存储路径。 就我们普通的JAVAWEB项目来说...

    搜索引擎蜘蛛访问日志查看器

    搜索引擎蜘蛛访问日志查看器是一款专门用于分析搜索引擎爬虫活动的工具,对于网站优化和SEO策略的制定至关重要。它能够帮助网站管理员了解搜索引擎如何与他们的网站互动,揭示爬虫访问频率、抓取的页面以及可能遇到...

    含有ip访问记录日志文件

    日志文件的格式和内容因应用而异,但常见的IP访问日志通常包括以下字段: 1. **日期和时间**:访问发生的精确时间,通常按照特定的时间格式记录。 2. **IP地址**:访问者的网络IP地址,可以用来追踪访问来源。 3. *...

    Apache访问日志分析(含源代码)

    Apache访问日志是记录Web服务器活动的重要记录,包含着丰富的信息,如客户端IP地址、请求时间、请求资源、响应状态码、用户代理等。对于网站管理员来说,分析这些日志有助于了解网站的流量情况、用户行为、性能瓶颈...

    Node.js-基于express的访问日志记录器

    Express访问日志记录器的主要目标是捕获并记录每个HTTP请求的关键信息,如请求方法(GET、POST等)、URL、响应状态码、响应时间、客户端IP地址、用户代理等。这些信息对于调试、性能优化以及安全分析都极其有用。 ...

    Python程序设计:python apache日志分析.pptx

    在这个任务中,我们将使用Python来处理Apache的访问日志,找出访问次数最多的IP地址。 Apache是全球最广泛使用的Web服务器,它的跨平台特性和强大的稳定性使其成为首选。Apache提供了访问日志(access_log)和错误...

    IIS日志中获取访客真实IP的解决方案

    ### IIS日志中获取访客真实IP的解决方案 #### 背景介绍 在网络环境中,获取客户端的真实IP地址对于安全审计、流量分析等非常重要。然而,在使用负载均衡器(如HAProxy)的情况下,直接从后端服务器(例如运行IIS的...

    Apache日志分析:获取IP地址

    在IT行业中,日志分析是一项重要的任务,它可以帮助我们理解系统的运行情况,找出问题的根源,优化性能。本文将深入探讨如何使用C#语言来分析Apache服务器的日志,特别是从中提取IP地址信息。 Apache日志是记录...

    C#后台访问url请求结果

    - **url** (字符串类型):表示要访问的目标URL地址。 - **pars** (字符串类型):如果请求方式为POST,则此参数表示要发送的数据(通常为JSON格式);如果请求方式为GET,则此参数会被添加到URL后面作为查询字符串的...

    iis日志分析工具_网站日志分析器_蜘蛛访问记录查看器

    在IIS服务器的运行过程中,会生成详细的日志文件,这些日志文件记录了所有HTTP请求的详细信息,包括访问者的信息、请求的URL、响应状态码、访问时间等。这些数据对于网站管理员来说非常重要,可以帮助他们了解网站的...

    秋式IIS日志分析器,IIS日志分析器

    在IIS运行过程中,它会记录详细的访问日志,这些日志包含了各种与网站交互的信息,如访问者IP地址、访问时间、请求的URL、HTTP状态码等。对这些日志进行分析,可以帮助管理员了解网站的运行状况,识别潜在的安全问题...

    定时访问URL

    在定时访问中,URL是程序要定时访问的目标地址。 3. **定时任务(Cron Job)**:在许多编程语言和操作系统中,都可以设置定时任务来执行特定的函数或脚本。例如,在Linux系统中,我们可以使用Crontab命令来设置定时...

    JSP使用URLRewirte实现url地址伪静态化

    当用户访问伪静态URL时,URLRewriteFilter会根据配置文件中的规则将请求重定向到相应的动态处理程序。在JSP中,你可以通过Servlet或者控制器来处理这些请求。例如,一个简单的Servlet可以是这样的: ```java ...

Global site tag (gtag.js) - Google Analytics