有需求想分析下网站的被访问的TOP 10 URL是哪些,想到了apache 的cookie日志中有记录,在日志目录的cookie_log.*文件中,打开一个确实存在:
112.113.241.58 - - - [09/Sep/2012:00:01:08 +0800] "GET /dd.abc.com/favicon.ico HTTP/1.1" 200 1406 154 "-" "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1) QQBrowser/6.0"
不过对每一个列对应的含义不是很清楚,看了下httpd.conf,
LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-Agent}i\"" combined
LogFormat "%h %l %u %t \"%r\" %>s %b" common
查了下apache的配置文档,了解了对应的含义。
写了一行shell脚本:
cat cookie_log.0 | awk '{ print $8 }' | sed s/?.*//g |sort | uniq -c | sort -n -r |head -n 10
(uniq这个命令默认只删除紧挨的重复行,所以需要先sort下,再uniq)
得到以下结果,(具体网址用手动替换成*了)
2713 /172.22.14.109/ok.htm
2387 /*/order/orderList.htm
1009 /*/favicon.ico
990 /*/index.htm
854 /*/wide/jhs/wlTrace.htm
851 /*/aita/css/aita-main.css
780 /*/order/orderDetail.htm
715 /*/storage/stockInList.json
519 /*/determine/deduce.json
496 /*/order/channelOrderListLimit.json
分享到:
相关推荐
"第一行代码Java源代码第12章"主要探讨的是Java网络编程的基础概念和技术。Java提供了丰富的API来支持网络编程,包括Socket、ServerSocket、URL、URLConnection等类。 1. **Socket编程**:Socket是Java网络编程的...
在本课程中,我们将深入探讨Java数据库编程,这是"第一行代码Java"的第14章内容。这一章主要关注如何使用Java与各种数据库进行交互,包括但不限于建立连接、执行SQL查询、处理结果集以及事务管理。以下是本章中涵盖...
接着,使用`BufferedReader`从输入流中读取每一行文本并打印出来。最后,关闭`BufferedReader`以释放资源。 #### 三、总结 通过上述介绍可以看出,Java中的`URL`类提供了丰富的API来处理网络资源的访问。开发者...
- `/\.(sogou|soso|baidu|google|youdao|yahoo|bing|118114|biso|gougou|ifeng|ivc|sooule|niuhu|biso)(\.[a-z0-9\-]+){1,2}\//ig`:这一行定义了一个正则表达式,用于匹配搜索引擎的域名。它通过`.`匹配任何字符,...
是在线监控网站的源代码 0.(可选)在根目录下编写“install.sql修改第115行对应的时间为 建站时间,严格执行原格式修改后报存储 1.把根目录下来。install.sql导入数据库并删除根目录 下"install.sql" 2.在根目录下...
通过上述介绍可以看出,在ASP中获取上一页的URL相对简单,只需要一行代码即可完成。然而,为了确保程序的健壮性和安全性,还需要考虑到一些特殊情况和潜在的安全隐患。合理使用这些技术,可以极大地提高Web应用程序...
这个压缩包文件"Android MediaPlayer播放器,一行代码实现播放本地音视频以及网络音视频.zip"显然是一个示例项目,它展示了如何简单地使用MediaPlayer来播放本地和网络上的媒体资源。下面将详细解释相关知识点。 1....
- `if (matcher.find())`:如果匹配成功,则执行下一行代码。 - `return matcher.group();`:返回匹配到的第一个结果。如果没有匹配到任何结果,则返回`null`。 #### 五、使用场景 1. **网站链接验证**:在用户...
总的来说,使用C/C++在Linux下实现通过URL访问网页提取文字内容是一个涉及网络编程、HTTP协议理解和HTML解析的综合性任务。通过学习和实践,你可以掌握这些技能,并构建自己的网络爬虫或Web客户端工具。
- `%r`:请求的第一行,包括HTTP方法、请求的URL和协议版本。 - `%>s`:服务器返回的状态码。 - `%b`:服务器发送的响应内容长度,或者在无数据传输时显示为"-"。 - `%{Referer}i`:发起请求的页面URL(如果有的话)...
压缩包子文件的文件名称列表:“PB通过URL下载文件”可能是提供了一个示例程序或者代码片段,用于演示如何在PowerBuilder中实现URL下载功能。如果可以访问这个文件,那么通过分析和运行其中的代码,可以更深入地理解...
本项目是关于如何在SpringBoot中整合Easypoi,以实现在浏览器中自动下载Excel文件的功能,而且只需一行代码就能完成。 首先,我们需要了解Easypoi的基本用法。Easypoi提供了多种API来操作Excel,包括创建新的Excel...
1. **第一行代码**:设置`Label`控件的`Caption`属性和`Tag`属性。例如: ```vb Label1.Caption = "点击访问我的网站" Label1.Tag = "http://www.example.com" ``` 这里,`Label1`是你的`Label`控件的名称,`...
例如,`routes.MapPageRoute("productRoute", "products/{productId}", "Product.aspx")`这一行代码就创建了一个路由,使得访问"products/123"这样的URL时,实际会调用Product.aspx页面,其中"{productId}"是一个...
在Node.js中,这一过程可以非常简单地通过一行代码实现,这得益于Node.js提供的强大API和流(Streams)的支持。 在Node.js中创建HTTP服务器通常使用http模块,其中http.createServer()方法用于创建一个新的HTTP...
标题中的“通过本地Java代码访问WSDL接口”指的是在Java编程环境中,利用WSDL(Web Service Description Language)文件来创建客户端代理类,从而调用远程Web服务。WSDL是一种XML格式,它定义了Web服务的接口,包括...
网页刷点击代码是一种技术手段,通常用于提升网站的访问量,从而在搜索引擎排名中获得更好的位置,或者在某些情况下为了制造虚假的用户活跃度。在VB(Visual Basic)环境中实现这种功能,我们可以创建一个简单的程序...
在这段PHP代码中,问题出在最后一行的`urldecode($b)`。由于`$b`已经经过了HTML编码,再次进行URL解码是不必要的,而且在这种情况下导致了安全漏洞。 为了预防这种XSS攻击,有以下几点安全建议: 1. 对用户输入...
在这种模式下,JavaScript 负责处理用户交互、数据处理以及与服务器的通信,而"100行代码实现的JavaScript MVC样式框架"则是在这个概念上创建的一个轻量级解决方案。 首先,让我们理解MVC(Model-View-Controller)...