`

linux下常用分析日志命令(1)

阅读更多

grep是一个很强大的命令。这里我们主要来讲使用grep命令来分析网站日志的方法和技巧。

1、合并网站日志

使用ls查看下待合并的日志

合并网站日志

  1. cat *.log >example.log #合并后缀名为log的日志文件,你也可以合并指定的日志

2.拆分我们想要的日志文件

比如拆分百度蜘蛛的日志文件

  1. grep "Baiduspider+" example.log >baiduspider.txt

比如拆分404错误日志

  1. grep "404" example.log >404.txt

还可以同时拆分百度和谷歌的蜘蛛。

这里我们使用的是egrep来实现这一功能。

  1. egrep "Baiduspider+|Googlebot" example.log >spider.txt

3、我们还可以结合awk命令来格式话我们的日志文件

awk倾向于分析一行中的字段,我们需要来看一下网站的日志格式

我们截取百度蜘蛛访问的来源IP、时间、抓取的URL、返回码和抓取的大小。

  1. grep "Baiduspider+" example.log |awk '{print $1 "\t" $4 "\t" $7 "\t" $8 "\t" $9 "\t" $10}' >Baiduspider.txt

这里使用[tab]是为了导入excel文件中更加方便你的分析。

更新:可以不用[tab]来格式化日志,直接选择空格作为分隔符就好。

如何使用命令删选不重复的URL的,由于很多日志的参数设置不一样,具体到详细命令命令会有所不同
首先我们还是要知道蜘蛛抓取你的URL位置在你的日志记录行的位置,拿上面的图为例子

如图,由于每条记录的时间戳等不一样,我们不能直接使用sort命令去重,再者我们需要的只是蜘蛛抓取的URL这个参数,那么我们就直接拎出$7这个URL参数后再去重。

如我们要计算蜘蛛抓取的不重复URL个数

  1. cat access.log |grep Baiduspider+ |awk '{print $7}'|sort -u|wc

要把蜘蛛抓取的不重复URL导出来,就可以去掉wc后加上>baiduspiderurl.txt等就可以了

  1. cat access.log |grep Baiduspider+ |awk '{print $7}'|sort -u  >baiduspiderurl.txt

我们还可以在导出的时候自动给每个URL加上抓取的次数

  1. cat access.log |grep Baiduspider+ |awk '{print $7}'|sort |uniq -c  >baiduspiderurl.txt

摘自:http://www.gnbase.com/thread-2-1.html

分享到:
评论

相关推荐

    linux 查看日志常用命令

    ### Linux查看日志常用命令详解 #### 一、`cat`命令 `cat`命令是Linux中最常用的文本处理工具之一,具有多种用途,包括显示文件内容、从键盘创建文件以及合并多个文件等。 - **主要功能**: - **显示整个文件**: ...

    Linux系统中查看日志的常用命令

    # free -m # 查看内存使用量和交换区使用量 # df -h # 查看各分区使用情况 # du -sh <目录名> # 查看指定目录的大小 # grep MemTotal /proc/meminfo # 查看内存总量 # grep MemFree /proc/meminfo # 查看空闲内...

    Linux常用命令 shell 常用命令

    ### Linux常用命令详解 Linux作为一款强大的开源操作系统,其核心优势之一在于丰富的命令行工具,这些工具能够高效地完成各种任务,从简单的文件操作到复杂的系统管理。下面将详细介绍Linux中的一些常用命令,涵盖...

    linux常用命令大全.pdf

    ### Linux常用命令大全 #### 一、文件管理 1. **查看目录与文件** - **ls**: 用于列出当前目录下的文件和子目录。常用选项包括: - `-l`: 以长格式显示文件详细信息,如权限、所有者、大小等。 - `-a`: 显示...

    linux常用命令学习日志

    Linux 命令学习日志 Linux 命令是 Linux 操作系统中的一系列命令,用于管理和维护系统。这些命令可以在 Shell 中执行,以实现各种操作,如文件管理、进程管理、网络管理等。下面是 Linux 命令学习日志中的重要知识...

    Linux下db2常用命令总结

    本文将深入探讨Linux下DB2的常用命令,帮助开发者更好地理解和操作DB2数据库。 1. **安装与启动DB2** - `sudo rpm -ivh db2_v11.5_linux_x86_64.rpm`:在Linux上安装DB2的RPM包。 - `db2start`:启动DB2实例。 -...

    UNIX Linux网络日志分析与流量监控

    UNIX/Linux网络日志分析与流量监控是网络管理员和安全分析师必备技能之一。该技能不仅有助于实时监控系统运行状态,还能在系统遭受攻击或出现故障时,通过分析日志文件快速定位问题,以及在安全事件发生后进行取证...

    Linux常用命令文档和命令大全

    本压缩包文件"Linux常用命令文档和命令大全"包含了两份宝贵的资源,分别是"Linux命令大全(修改版).chm"和"Linux学习笔记.doc",它们都是深入理解和熟练掌握Linux操作系统的宝贵资料。 "Linux命令大全(修改版).chm...

    Linux中常见的日志文件和命令.rar

    在Linux操作系统中,日志文件和相关命令是系统管理和故障排查的重要工具。这些记录着系统运行情况、程序错误以及安全事件的信息,对于诊断问题、优化性能以及确保系统稳定性至关重要。以下将详细介绍一些常见的Linux...

    车载常用linux命令+火车/高铁/公交车行业+车载linux系统测试常用命令,用于测试职位或运维技术支持职位

    本文将详细介绍车载Linux系统中常用的一些命令,这对于测试职位或运维技术支持人员来说至关重要。 1. `ls` 和 `ls -l`: `ls` 命令用于列出目录中的文件和子目录,而`ls -l`则提供更详细的信息,包括文件权限、所有...

    linux常用命令大全

    在深入探讨Linux常用命令之前,我们首先应当理解Linux操作系统的核心理念与优势,它是一个免费、开源的操作系统,因其稳定性和安全性而广泛应用于服务器领域。掌握Linux命令行是每一位IT专业人士的必备技能,以下是...

    linux常用的经典命令

    监控日志命令 1. 在当前目录搜索指定文本:`find ./ -type f -name "*.log" | xargs grep "DEBUG"` 该命令用于在当前目录下搜索指定的日志文件,并在其中搜索包含“DEBUG”关键字的行。 2. 监控 Tomcat 日志:`cd...

    Linux常用命令大全

    本资料“Linux常用命令大全”详细汇总了Linux环境中最常用的命令,旨在为用户提供全面的学习参考。 1. 文件和目录管理: - `ls`:列出目录内容,可以使用 `-l` 显示详细信息,`-a` 显示所有文件,包括隐藏文件。 ...

    Linux最常用命令.pdf

    常见的系统目录如“/root”是系统管理员的主目录,“/bin”存放常用的命令,“/etc”存放系统配置文件,“/home”为用户主目录,“/var”存储日志和系统运行时的数据,“/opt”用于安装额外软件,“/dev”包含系统...

    常用Linux命令.pdf

    标题《常用Linux命令.pdf》指的是该文档是关于Linux操作系统中常见命令的总结指南。Linux系统是类Unix系统中的一种,广泛应用于服务器、桌面计算机、超级计算机等领域。该文档中的内容应当包括基础命令、文件系统...

    linux 常用命令集锦

    了解并熟练掌握Linux的常用命令是每个IT从业者的基本技能。下面将详细介绍Linux的一些核心概念和常见命令。 首先,Linux将所有设备和资源视为文件,包括硬件设备、系统资源等。文件主要分为两种类型:字符型和二...

    linux 查看日志命令操作

    以下是一些常用的Linux查看日志命令及其应用: 1. **`less` 和 `more` 命令** 这两个命令用于查看文件内容,特别是大型日志文件。`less` 提供了向前/向后翻页、搜索和导航功能,而 `more` 只能逐屏显示。 2. **`...

    Linux常用命令-API手册.zip

    本压缩包"Linux常用命令-API手册.zip"包含了两个重要的参考资料:"Linux基础命令教程豪华版.chm"和"Linux常用命令大全.chm",它们为用户提供详尽的Linux命令学习指南。 "Linux基础命令教程豪华版.chm"可能是对Linux...

    linuxOS6.5安装及常用命令.docx

    Linux OS 6.5 安装及常用命令 Linux OS 6.5 是一种流行的开源操作系统,它提供了强大且灵活的功能,可以应用于各种场景。本文档将指导用户安装 Linux OS 6.5 并介绍常用的命令,使用户能够快速上手使用 Linux OS ...

    linux常用的60个命令

    ### Linux常用的60个命令详解 #### 一、登录(Login) **命令功能:** - `login` 命令用于用户登录系统。 **命令格式:** - `login [name] [options]` - `[name]`: 用户名 - `[options]`: 可选参数 **选项...

Global site tag (gtag.js) - Google Analytics