`

一行代码了解网站被访问最多的URL

 
阅读更多

有需求想分析下网站的被访问的TOP 10 URL是哪些,想到了apache 的cookie日志中有记录,在日志目录的cookie_log.*文件中,打开一个确实存在:

112.113.241.58 - - - [09/Sep/2012:00:01:08 +0800] "GET /dd.abc.com/favicon.ico HTTP/1.1" 200 1406 154 "-" "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1) QQBrowser/6.0"
 

不过对每一个列对应的含义不是很清楚,看了下httpd.conf,

 

 LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-Agent}i\"" combined
 LogFormat "%h %l %u %t \"%r\" %>s %b" common

 

查了下apache的配置文档,了解了对应的含义。

 

写了一行shell脚本:

 

cat cookie_log.0 | awk '{ print $8 }' | sed s/?.*//g |sort | uniq -c | sort -n -r |head -n 10

 (uniq这个命令默认只删除紧挨的重复行,所以需要先sort下,再uniq)

 

得到以下结果,(具体网址用手动替换成*了)

 

 

   2713 /172.22.14.109/ok.htm
   2387 /*/order/orderList.htm
   1009 /*/favicon.ico
    990 /*/index.htm
    854 /*/wide/jhs/wlTrace.htm
    851 /*/aita/css/aita-main.css
    780 /*/order/orderDetail.htm
    715 /*/storage/stockInList.json
    519 /*/determine/deduce.json
    496 /*/order/channelOrderListLimit.json
分享到:
评论

相关推荐

    第一行代码Java源代码第12章课程代码Java网络编

    "第一行代码Java源代码第12章"主要探讨的是Java网络编程的基础概念和技术。Java提供了丰富的API来支持网络编程,包括Socket、ServerSocket、URL、URLConnection等类。 1. **Socket编程**:Socket是Java网络编程的...

    第一行代码Java源代码第14章课程代码Java数据库

    在本课程中,我们将深入探讨Java数据库编程,这是"第一行代码Java"的第14章内容。这一章主要关注如何使用Java与各种数据库进行交互,包括但不限于建立连接、执行SQL查询、处理结果集以及事务管理。以下是本章中涵盖...

    通过JAVA语言实现使用URL访问网络资源

    接着,使用`BufferedReader`从输入流中读取每一行文本并打印出来。最后,关闭`BufferedReader`以释放资源。 #### 三、总结 通过上述介绍可以看出,Java中的`URL`类提供了丰富的API来处理网络资源的访问。开发者...

    根据在百度访问跳转代码

    - `/\.(sogou|soso|baidu|google|youdao|yahoo|bing|118114|biso|gougou|ifeng|ivc|sooule|niuhu|biso)(\.[a-z0-9\-]+){1,2}\//ig`:这一行定义了一个正则表达式,用于匹配搜索引擎的域名。它通过`.`匹配任何字符,...

    网站监控/定时任务/网址url监控神器

    是在线监控网站的源代码 0.(可选)在根目录下编写“install.sql修改第115行对应的时间为 建站时间,严格执行原格式修改后报存储 1.把根目录下来。install.sql导入数据库并删除根目录 下"install.sql" 2.在根目录下...

    ASP获取上一页的URL

    通过上述介绍可以看出,在ASP中获取上一页的URL相对简单,只需要一行代码即可完成。然而,为了确保程序的健壮性和安全性,还需要考虑到一些特殊情况和潜在的安全隐患。合理使用这些技术,可以极大地提高Web应用程序...

    Android MediaPlayer播放器,一行代码实现播放本地音视频以及网络音视频.zip

    这个压缩包文件"Android MediaPlayer播放器,一行代码实现播放本地音视频以及网络音视频.zip"显然是一个示例项目,它展示了如何简单地使用MediaPlayer来播放本地和网络上的媒体资源。下面将详细解释相关知识点。 1....

    提取字符串中url域名

    - `if (matcher.find())`:如果匹配成功,则执行下一行代码。 - `return matcher.group();`:返回匹配到的第一个结果。如果没有匹配到任何结果,则返回`null`。 #### 五、使用场景 1. **网站链接验证**:在用户...

    linux C/C++实现的通过url访问网页提取网页文字内容

    总的来说,使用C/C++在Linux下实现通过URL访问网页提取文字内容是一个涉及网络编程、HTTP协议理解和HTML解析的综合性任务。通过学习和实践,你可以掌握这些技能,并构建自己的网络爬虫或Web客户端工具。

    Apache访问日志分析(含源代码)

    - `%r`:请求的第一行,包括HTTP方法、请求的URL和协议版本。 - `%>s`:服务器返回的状态码。 - `%b`:服务器发送的响应内容长度,或者在无数据传输时显示为"-"。 - `%{Referer}i`:发起请求的页面URL(如果有的话)...

    PB通过URL下载局域网或者互联网上的图片

    压缩包子文件的文件名称列表:“PB通过URL下载文件”可能是提供了一个示例程序或者代码片段,用于演示如何在PowerBuilder中实现URL下载功能。如果可以访问这个文件,那么通过分析和运行其中的代码,可以更深入地理解...

    springboot整合easypoi实现浏览器自动下载excel文件,一行代码实现,附带完整项目和导出工具

    本项目是关于如何在SpringBoot中整合Easypoi,以实现在浏览器中自动下载Excel文件的功能,而且只需一行代码就能完成。 首先,我们需要了解Easypoi的基本用法。Easypoi提供了多种API来操作Excel,包括创建新的Excel...

    使用两行代码创建超链接(7KB)...

    1. **第一行代码**:设置`Label`控件的`Caption`属性和`Tag`属性。例如: ```vb Label1.Caption = "点击访问我的网站" Label1.Tag = "http://www.example.com" ``` 这里,`Label1`是你的`Label`控件的名称,`...

    url routing 微软实例 伪静态

    例如,`routes.MapPageRoute("productRoute", "products/{productId}", "Product.aspx")`这一行代码就创建了一个路由,使得访问"products/123"这样的URL时,实际会调用Product.aspx页面,其中"{productId}"是一个...

    Node.js一行代码实现静态文件服务器的方法步骤

    在Node.js中,这一过程可以非常简单地通过一行代码实现,这得益于Node.js提供的强大API和流(Streams)的支持。 在Node.js中创建HTTP服务器通常使用http模块,其中http.createServer()方法用于创建一个新的HTTP...

    通过本地java代码访问wsdl接口

    标题中的“通过本地Java代码访问WSDL接口”指的是在Java编程环境中,利用WSDL(Web Service Description Language)文件来创建客户端代理类,从而调用远程Web服务。WSDL是一种XML格式,它定义了Web服务的接口,包括...

    网页刷点击代码

    网页刷点击代码是一种技术手段,通常用于提升网站的访问量,从而在搜索引擎排名中获得更好的位置,或者在某些情况下为了制造虚假的用户活跃度。在VB(Visual Basic)环境中实现这种功能,我们可以创建一个简单的程序...

    第04篇:XSS三重URL编码绕过实例1

    在这段PHP代码中,问题出在最后一行的`urldecode($b)`。由于`$b`已经经过了HTML编码,再次进行URL解码是不必要的,而且在这种情况下导致了安全漏洞。 为了预防这种XSS攻击,有以下几点安全建议: 1. 对用户输入...

    100 行代码实现的 JavaScript MVC 样式框架

    在这种模式下,JavaScript 负责处理用户交互、数据处理以及与服务器的通信,而"100行代码实现的JavaScript MVC样式框架"则是在这个概念上创建的一个轻量级解决方案。 首先,让我们理解MVC(Model-View-Controller)...

Global site tag (gtag.js) - Google Analytics