统计系统---说明
这里的日志是使用log4j生成的,按指定的格式生成日志,既一条记录的各个字段使用一个tab建隔开,主要是为了解析的时候方便
这里的统计使用shell来下载解压缩日志和报警,使用awk来进行解析日志,使用存储过程来进行数据的处理
(下一个统计使用java来实现,使用的是access日志)
1.4亿的pv日志在据说是10分钟用awk就能解析完毕,还没有验证,因为相当于做了处理,因此入库也会很快。
统计分为三大部分:
1.下载,解压缩
2.解析日志入库
3.报警
这是基本的三大部分,具体可能还涉及到存储过程等。
配置文件:
1.下载配置文件---/config/down.config
里面是url地址,相当于指向日志的目录,不包括日志名
在下载的时候会根据url的域名或者是ip地址建立文件夹,保存该服务器的日志文件,然后直接解压缩该文件到该目录下
2.报警的配置文件-----/config/mail.config
里面是一些mail地址,一行一个,第一个是发送的地址,后面的都属于抄送。
接收报警邮件的邮箱需要注意不要把此邮件当成垃圾邮件,这和邮箱有关系,网易的不知道为什么就是收不到,google的邮箱就不用设置都能收到,而263的企业邮箱需要在网页中把root加为好友才能用foxmail收到邮件
3.一般的配置文件----/config/comm.config
log_suffix是为了看使用的是什么压缩的,因为测试的时候是在windows下生成的日志,压缩也在Windows下,因此为了支持zip的方式,就设置了此key,另外支持tar解压缩的压缩文件,这个是为了正式在linux下使用的
mysql_head 是连接数据库的一段东西
sql_procedure 是当日志入库之后需要执行的存储过程,把临时表中的数据转到正式表中去
log_name_pv 是下载日志名,日期用XXXX-XX-XX-XX,使用的小时的格式,但在脚本中几乎和此无关,不管是天,还是小时都可以下载日志,入库也没有问题,有问题的是存储过程。
down_config_file_pv是下载文件的配置文件,既前面提到的/config/down.config文件的所在地,因此down.config其实不管放在哪都行,文件名也可以随意的修改
log_save_path_pv 是日志保存的路径,可以随便填写,可以是任意的目录,主要是备份下载的文件,以及解压缩文件给解析的时候用,日志入库完毕后会删除解压缩的文件
log_name_ex_pv 是解压缩后的pv日志名,不同的机器名称需要统一
sql_table_pv 是sql的表名+字段,是用于脚本解析日志之后生成的临时文件然后入库使用的,数据库的字段需要和临时文件的列数相对应
log_name_click 同log_name_pv
log_name_ex_click 同log_name_ex_pv
down_config_file_click 同down_config_file_pv
log_save_path_click 同log_save_path_click
sql_table_click 同sql_table_pv
报警这个脚本里面没有写,传到博客上来的时候还没有加入报警的东东,呵呵,具体的报警其实应该设在下载失败的时候,以及数据解析入库失败的时候
第一个下载失败的时候好做,只需要在下载失败那里发送邮件即可
第二个涉及到数据库就不那么好做了,比较简单的方法是用其他的程序写一个监控的东东,然后用监控软件定时查看数据库中的数据是否已经入库。公司里是采用的java写了一个jsp页面,然后按条件查询数据库,若有则返回ok,若没有则返回error,用的是hostmonitor监控ok字段。
解析属于最重要的一部分,解析出错会导致整个统计系统的统计数据不准确。
这里使用了awk来进行解析,具体的awk教程可以上网看一下,很简单的,一旦稳定的话一般就不会出问题,初期可能会比较累一点。
分享到:
相关推荐
【ACCP学生管理系统--详细设计说明书】 学生管理系统是一种软件应用,旨在帮助教育机构或培训机构有效管理学生信息、班级设置、课程安排等核心业务流程。详细设计说明书是开发此类系统的关键文档,它为开发者提供了...
图书管理系统需求规格说明书详细阐述了该系统的设计目标和功能需求,旨在通过计算机技术优化图书馆的管理和服务流程。系统的核心目标是提升效率、准确度,并降低成本,同时提供友好的用户界面和强大的后台管理功能。...
基础教育技术装备统计系统-详细使用说明[汇编].pdf
毕业设计asp.net电气火灾统计分析系统-qlkrp源码工具包 asp.net,数据库sqlserver,开发工具用Microsoft Visual Studio 统计查询 数据查询 地域查询 原因查询 包含:源码、数据库脚本、环境工具包(在说明文档中)
【系统设计说明书】 本《浙江高速直播系统项目-系统设计说明书》由广州优路加信息科技有限公司于2019年8月编制,旨在详细阐述浙江高速直播系统的具体设计细节,确保该系统能够满足设计需求并能直接投入使用。文档...
4. **点名系统**:通过系统,教师可以快速进行电子点名,统计出勤情况,提高教学管理效率。 该系统开放源码,意味着用户可以自由查看、修改和分发代码,这为开发者提供了更多的定制可能性。开发者可以根据具体需求...
- **收发文统计查询**:监控文件流通情况。 **行政办公子系统** - **会议管理**:计划和记录会议。 - **督察督办**:追踪任务执行情况。 - **档案管理**:归档和检索文件。 - **值班管理**:安排和监督值班人员。 -...
《图书馆管理系统--详细设计说明书》是对图书馆自动化管理的详尽技术描述,旨在为系统的设计和实现提供指导。本文将深入探讨该系统的核心模块、结构以及程序设计。 1. **系统背景与目标** - 图书馆管理系统是针对...
#### 统计呈现子系统与远端信令及数据子系统接口说明 文档中提到的统计呈现子系统与远端信令及数据子系统之间的接口规范(简称TY接口),是为了实现数据的高效交换与共享而设计的。这两个子系统之间的交互对于整个...
统计分析系统V1.0-需求规格说明书.pdf
开发文档则详细阐述了系统的架构设计、接口定义、数据库模型以及使用说明,是理解和维护系统的重要参考。 总的来说,这个基于Java的进销存管理系统为企业提供了一个全面的仓库管理方案,通过精确的库存控制和数据...
本资源为一项基于jspm开发的新冠病例智能统计与相应预防措施分析系统的毕业设计项目,包含了完整的论文、源代码及说明文档。该系统旨在通过智能化的手段,对新冠病例数据进行高效统计与分析,并据此提出针对性的预防...
以下是对WMS仓库管理系统的详细说明: 1. **功能模块**: - 入库管理:记录商品的接收、检验和上架过程,确保库存准确。 - 出库管理:处理订单、拣选、包装和发货,支持多种出库策略如先进先出(FIFO)。 - 库存...
毕业设计javajsp线上消费行为统计与分析系统springmvc-qkrp源码含文档工具包 页面是jsp,数据库mysql,jdk1.8,开发工具用ecplise、myecplise、sts、idea都可以 本系统对线上消费行为统计与分析有现实应用价值,主要...
### 档案管理系统-需求分析说明书实例 #### 一、引言 随着信息技术的不断发展,企业对于档案管理的需求日益增长。档案管理系统作为中小企业信息化建设的重要组成部分,不仅可以提高工作效率,还能确保信息安全。本...
基于Python的Django-html在线中药店销售数据统计与分析系统 项目关键技术 开发工具:Pycharm 编程语言: python 数据库: MySQL5.7+ 后端技术:Django 前端技术:HTML 关键技术:HTML、MYSQL、Python 数据库工具:...
根据"DWP-2360说明书"及其描述与部分内文,我们可以提炼出以下关键知识点: ### 一、产品概述 - **型号**: D-Link DWP-2360 AirPremier® N PoE Access Point - **配件**: - 电源适配器 - CAT5以太网线 - 用户...
旅游管理系统需求分析报告说明书 1. 概述 1.1 目的 本报告的主要目的是为旅游管理系统的开发提供全面、清晰的需求分析,确保系统的设计和实施满足旅游业的实际业务需求,提高工作效率,提升用户体验。 1.2 背景 ...
企业环境统计季报系统操作步骤 本文档主要介绍了企业环境统计季报系统的操作步骤,旨在帮助用户正确地安装和使用系统。下面是该系统的操作步骤的详细说明: 系统要求 ---------------- 在开始使用该系统之前,...
- **系统管理员**:需熟悉网站部署流程,能根据系统使用说明完成日常管理操作,如统计和打印考生信息。 - **维护人员**:需精通如ASP.NET、Java等常用编程语言,能解决常见的网站部署问题,并具备一定的团队管理能力...