`
lz1130
  • 浏览: 408511 次
  • 性别: Icon_minigender_1
  • 来自: 福建
社区版块
存档分类
最新评论

WEB日志的一般性分析

阅读更多
转自:http://www.sunnyu.com/?p=8

随着网站正式运行,我们可以通过通用的免费日志分析工具比如awstats获得一些实际访问网站的信息,例如每天ip量,pv量,用户所用的的浏览器,用户所用的操作系统等,但是有时候希望通过手工方式从WEB日志文件中获得一些信息,下面列出了一些最近一段时间我经常在用的命令

获得访问前10位的ip地址
cat access.log|gawk '{print $1}' |sort|uniq -c|sort -nr |head -10

访问次数最多的文件或页面
cat access.log|gawk '{print $11}'|sort|uniq -c|sort -nr

通过子域名访问次数,依据referer来计算,稍有不准
cat access.log | awk '{print $11}' | sed -e ' s/http:\/\///' -e ' s/\/.*//' | sort | uniq -c | sort -rn | head -20

列出传输大小最大的几个文件
cat www.access.log |awk '($7~/\.php/){print $10 " " $1 " " $4  " " $7}'|sort -nr|head -100

列出输出大于200000byte(约200kb)的页面以及对应页面发生次数
cat www.access.log |awk '($10 > 200000 && $7~/\.php/){print $7}'|sort -n|uniq -c|sort -nr|head -100

如果日志最后一列记录的是页面文件传输时间,则有列出到客户端最耗时的页面
cat www.access.log |awk '($7~/\.php/){print $NF " " $1 " " $4  " " $7}'|sort -nr|head -100

列出最最耗时的页面(超过60秒的)的以及对应页面发生次数
cat www.access.log |awk '($NF > 60 && $7~/\.php/){print $7}'|sort -n|uniq -c|sort -nr|head -100

列出传输时间超过 30 秒的文件
cat www.access.log |awk '($NF > 30){print $7}'|sort -n|uniq -c
分享到:
评论

相关推荐

    Web日志文件的异常数据挖掘算法及其应用

    :从数量化角度给出了异常数据的一般性定义,以Web服务器日志文件数据为依据,讨论了挖掘异常数据的方法和途径;给出了基于距离的单指标的离散统计法和综合统计法,并结合校园网作了实际的分析处理。结果表明,该...

    基于Web日志的数据挖掘技术在Web机器人识别中的研究.pdf

    Web日志挖掘作为数据挖掘的一个重要分支,未来的研究方向包括提高挖掘算法的效率和准确性,更好地处理大规模数据集,以及利用新算法和模型来应对日志数据的多样性和复杂性。此外,随着大数据和云计算技术的发展,...

    基于Web日志的数据挖掘研究.pdf

    但是,由于Web日志数据的复杂性和海量性质,传统的数据库管理工具很难有效对其进行分析。 数据挖掘技术的引入能够解决这一问题。数据挖掘是从大量数据中提取或“挖掘”隐藏信息的过程,它的系统结构一般包括用户...

    基于Web日志挖掘应用研究

    ### 基于Web日志挖掘应用研究 #### 引言 随着互联网技术的迅猛发展,Web已经成为全球信息交流的核心平台。在这个过程中积累了大量...未来,随着数据分析技术和人工智能的发展,Web日志挖掘将在更多领域发挥重要作用。

    ELK日志分析系统

    进行日志处理分析的一般流程包括: 1. **日志集中化管理**:首先,需要通过各种方式将分散在不同地方的日志文件集中起来。 2. **日志格式化并输出到Elasticsearch**:接着,使用Logstash对原始日志进行格式化处理,...

    13-ELK日志分析系统.pdf

    Kibana则是为ELK提供前端数据展示的工具,它提供了友好的日志分析Web界面,可以帮助用户汇总、分析和搜索重要数据日志。在ELK架构中,Kibana从Elasticsearch集群中查询数据并生成图表,然后将这些图表返回给浏览器...

    基于云计算环境的web数据挖掘技术分析.pdf

    它通过分析服务器上的用户访问日志,理解用户行为,以改善站点结构或为用户提供更专业的服务。这种挖掘技术通常涉及一般访问追踪模式和个性化记录追踪。通过追踪分析用户访问记录,可以优化网站结构,增加用户满意度...

    Web应用安全:Nginx日志配置文本.docx

    Nginx作为一款广泛应用的Web服务器,其日志功能对于故障排查和性能分析起着关键作用。本文将深入探讨Nginx的日志配置,包括访问日志(access_log)和错误日志(error_log),以及如何定制日志格式和管理日志文件。 首先...

    日志分析工具loganalyzer3.6.5+中文语言包

    总的来说,Loganalyzer 3.6.5 结合中文语言包,为中文用户提供了一个强大的日志分析平台,既具备专业性又具有易用性。无论是进行日常运维,还是应对突发问题,这款工具都能成为你得力的助手。掌握 Loganalyzer 的...

    系统启动记录日志例子

    总之,系统启动记录日志是系统健康运行的保障,通过对日志的细致分析,我们可以及时发现问题,优化系统性能,确保服务的稳定性和可靠性。在实际操作中,合理配置日志级别,定期清理和归档日志,也是运维工作的重要...

    web测试要点分析.docx

    ### Web测试要点分析 随着信息技术的发展,Web应用系统已经成为企业与个人进行信息交流的重要平台。在Web应用系统的设计与开发过程中,确保其稳定可靠、安全高效地运行是至关重要的。本文将详细介绍Web测试中的关键...

    console日志助手

    在现代Web开发中,`console.log`等控制台日志方法是调试和追踪代码运行状态的重要工具。然而,随着项目规模的扩大和复杂性的增加,本地查看控制台日志变得越来越不方便。"console日志助手"应运而生,它旨在将网页上...

    web项目log4j简单案例

    - `INFO`:一般性信息,如系统启动、用户操作等。 - `WARN`:警告信息,表示可能的问题但程序仍可继续运行。 - `ERROR`:错误信息,表示程序无法正常执行,但系统还能部分工作。 - `FATAL`:严重错误,导致系统...

    C#,WPF日志管理 C#编程--项目常用日志保存

    在IT行业中,日志管理是软件开发中的一个重要环节,它对于调试、监控系统运行状态以及问题排查至关重要。...在实际项目中,还需要考虑日志的性能优化、安全性和合规性等方面,确保日志系统既实用又可靠。

    log4net日志dll

    - 配置通常在项目的配置文件(如Web.config或App.config)中进行,包括定义日志输出的appender(如控制台、文件、数据库等)和layout(日志格式)。 2. **基本概念** - **Logger**: 日志记录器,负责实际的日志...

    js日志

    在Web应用中,有效的日志记录可以帮助开发者更好地理解程序的运行状态,尤其是在复杂的应用场景下。本文将深入探讨JS日志的相关知识点,包括其重要性、常见方法以及如何利用工具进行更高效的日志管理。 1. **日志的...

    AD域管理web版

    8. **监控与日志记录**:为了追踪和诊断问题,Web AD域管理工具应集成日志记录功能,记录所有操作以便审计和故障排查。同时,实时监控系统性能和事件,能提前预警潜在的问题。 9. **扩展性与兼容性**:一个优秀的...

Global site tag (gtag.js) - Google Analytics