一、什么是web server log 和 page tagging
web server log:使用软件将原始数据解析为有用的数据。主要的工具有awstats、webtrends(收费)。
以下为具体的服务器日志:
222.79.245.84 - - [10/Apr/2010:01:29:59 -0700] "GET www.domain.com/index.php HTTP/1.1" 200 99314 "-" "Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US) AppleWebKit/532.5 (KHTML, like Gecko) Chrome/4.1.249.1045 Safari/532.5"
web server log主要可统计到的数据为:
page tagging:使用JS代码将页面统计数据发给服务器。典型的代表为Google Analytics,百度统计,51la, CNZZ,量子统计,Ominture…
以Google Analytics为例,以下为Google手机的代码:
http://www.google-analytics.com/__utm.gif?utmwv=4.8.9&utmn=444576131&utmhn=www.douban.com&utmcs=utf-8&utmsr=1280×768&utmsc=32-bit&utmul=zh-cn&utmje=1&utmfl=10.2%20r152&utmdt=%E8%B1%86%E7%93%A3&utmhid=974895699&utmr=-&utmp=%2F&utmac=UA-7019765-1&utmcc=__utma%3D30149280.845782037.1298725704.1298782111.1299505037.3%3B%2B__utmz%3D30149280.1298725704.1.1.utmcsr%3D(direct)%7Cutmccn%3D(direct)%7Cutmcmd%3D(none)%3B&utmu=qBM
Page Tagging=服务器日志(部分)+客户端信息+自定义信息
其强大之处是可以收集包括:浏览器数据+操作系统数据+用户数据(SessionID,UserID)+转化数据+自定义标签
二、web server log 和 page tagging 的比较
Web Server Logs优点:
- 不需要在页面中加代码,服务器会自动记录log files
- Log files包含搜索引擎爬虫的访问数据,有利于提供SEO数据
- 可以多域名的日志放在一起分析,可以跨域。
- 真实记录所有访问,而Page Tagging无法真实记录所有访问
Web Server Logs缺点:
- 使用比较麻烦,每次要分析日志,配置web服务器以输出合适的日志。
- 搜集的客户端信息不如Page Tagging丰富,例如flash版本,是否安装java之类从日志是看不出来的
- 日志的存储管理也是挺头痛的事,尤其是当每天都产生几十G日志的时候
- 使用CDN时,需要合并日志分析。
page tagging优点:
- 只要打开页面就会记录,即使从缓存中读取页面内容。
- 搜集到一些通过日志不能搜集到的客户端信息。
- 可以记录更多的用户活动和信息,比如鼠标点击、页面停留时间等。
- 通过Cookie识别访问者,比依靠IP识别要更准确。
page tagging缺点:
- 当客户端禁止JS或禁止Cookie时,都会影响统计结果。
- 存在一定误差,把代码加在页面代码尾部会导致没有执行到。
- 不能统计用户对图像,视频,音频等文件的访问,这些文件不能插入统计代码。
- 不能统计带宽信息。
- 需要在页面中加代码,如果切换统计服务提供商的话,需要大批量更新代码。
除此上面page tagging的缺点以外,page tagging 还需要注意的一些问题:
1、垃圾回收与Image对象
大部分的日志收集JS请求都是使用Image对象来请求的(google,baidu,Omniture等)。目前有两种方式来使用JS的Image对象,一个是document.write,这种方式将这个Image对象挂到DOM树上,这种情况下会影响整个页面的渲染,Window.Onload函数就是在所有的DOM树都渲染完成后才执行的。第二种方式是直接new一个JS的Image对象,这个JS变量就是一个独立的对象,在某些情况下会被JS的垃圾回收机制回收掉,这个概率很小,也可以采用方法来避免。
2、线程与JS执行顺序
在javascript中是没有线程机制的,JavaScript引擎是单线程运行的,(在IE的一个窗口内,Firefox的一个Tab内,Javascript是单线程运行的)浏览器无论在什么时候都只且只有一个线程在运行JavaScript程序。在JavaScript引擎运行脚本期间,浏览器渲染线程都是处于挂起状态的,也就是说被”冻结”了。JavaScript脚本的执行不影响html元素事件的触发。
正常情况下JS代码都是从上到下执行的,如果有引入的JS文件,会先执行JS文件,JS中如果有document.write指令,会将内容输出到当前执行的页面位置的下面(如果有JS代码会在下一个JS解析过程中继续执行)。具体在处理过程中各个浏览器略有差异,但是基本的原理不变。在这个过程中如果碰到JS代码错误,会跳过本段JS继续执行。在这种情况下,直接的Apache日志和JS日志就有一个时间差,在页面的URL请求后过一段时间才执行JS请求。这样数据就会有一部分差距。这部分的差距根据不同的地区、用户有差别。
相关推荐
传统的人流量统计方法主要基于人工观察和手动统计,这种方法不仅费时费力,且准确性也难以保证。近年来,伴随着计算机视觉和机器学习技术的发展,基于卷积神经网络的人流量统计方法逐渐兴起。 卷积神经网络...
标题中的“头顶人流量统计”指的是使用计算机视觉(Computer Vision,简称CV)技术来监测和计算特定区域内头顶视角下经过的人数。这种技术在安全监控、商业分析、人流管理等领域有着广泛的应用。以下是对这个主题的...
在进行网络课程设计时,构建一个流量统计器是至关重要的环节。这个工具可以帮助我们了解网络课程的运行状况,包括用户访问行为、数据传输量以及网络资源的使用效率。以下是关于网络流量计算及其在网络课程设计中应用...
我们可以研究Settings源码,找出与流量统计相关的API和方法,然后在自己的应用中复用或模仿这些功能。 在Android中,流量统计主要涉及到以下几个关键组件和接口: 1. **ConnectivityManager**: 这是Android系统...
基于Netfilter的网络流量统计系统在嵌入式设备上的实现,黄锐,张立民,本文介绍了一种通过在Iptables的Filter表中新建基于不同的源IP地址或目的IP地址的过滤规则来将网络流量分类,并利用Iptables自带的计数器�
这个“流量统计毕业设计”可能涉及了如何收集、分析和解释网络流量数据的一系列技术和方法。以下是对这个主题的详细探讨: 一、网络流量的基本概念 网络流量是指在特定时间范围内通过网络传输的数据量。它包括了...
车辆检测通常是通过特定的算法实现的,如Haar级联分类器、HOG(Histogram of Oriented Gradients)或者现代的深度学习方法如YOLO(You Only Look Once)或SSD(Single Shot MultiBox Detector)。MATLAB提供了预...
论文中提到的实验结果表明,基于特征匹配的人流量统计方法在检测率上表现优秀,同时能满足实时应用的需求,证明了其在实际场景中的可行性和有效性。 综上所述,基于特征匹配的人流量统计方法是一种高效、精准且具有...
【OpenCV车流量统计】 OpenCV(开源计算机视觉库)是一个强大的计算机视觉和机器学习库,广泛应用于图像处理、图像分析以及计算机视觉的各种任务。在这个名为"opencvc车流量统计"的项目中,我们可以推测这是一位...
### 基于机器视觉的客流量统计技术研究 #### 技术背景 随着计算机视觉技术的迅猛发展,智能视频监控领域迎来了前所未有的发展机遇。这一技术不仅极大地提升了视频监控系统的智能化水平,还为企业和研究机构提供了...
总结,BOOM流量统计v2.9的开源源码为学习者和开发者提供了丰富的学习材料,不仅能够掌握商业编程的基本技巧,还能深入理解网络数据分析和系统优化的方法。无论是初学者还是经验丰富的开发者,都能从中受益匪浅,提升...
对于车流量统计,我们可能需要使用物体分类或者目标检测算法。一种常见的方法是使用霍夫变换检测车道线,从而确定车辆可能的位置。霍夫变换可以检测出直线特征,这对于识别车道线非常有效。同时,结合形状和大小信息...
在车流量统计中,主要涉及车辆检测,包括车辆的边缘检测、色彩分割、形状分析等方法。MATLAB中的`imread`函数用于读取视频帧,`imshow`用于显示,而`improcess`等函数则可以对图像进行预处理。 3. **视频车辆统计**...
【基于深度学习的船舶流量统计系统设计与实现】 在当今的智能交通系统中,水上交通的智能化监管变得越来越重要。传统的船舶目标检测方法,如雷达和AIS系统,已无法满足日益复杂的监控需求。随着视频监控技术的进步...
同时,本文也研究了使用流的前向IV个报文的统计信息作为特征,分类P2P流量的方法。 在P2P流量分类的过程中,机器学习算法起着非常重要的作用。机器学习算法可以自动学习P2P流量的模式,从而对P2P流量进行分类。本文...
"检测统计BOOM流量统计 v2.9" 是一个专门用于监测和统计网络流量的工具,版本号为2.9。这个工具可能是由BOOM团队或个人开发者开发的,其目的是帮助用户分析网络中的数据传输情况,从而优化网络性能、监控网络活动...