我们平常在看网站分析相关文章的时候,时常会看到“点击流(Clickstream)”这个词,点击流数据是网站分析的主要来源。那么究竟什么是点
击流数据,它又来源于何处,为什么它是网站分析的基础数据?关于这些问题的系统解释,推荐阅读《点击流数据仓库》这本书,这里先对这几个问题做下简单的回
答。
首先,点击流来源于何处?可能从文章标题就可以看出来了,点击流数据来源于网站日志,其实就是用户日常浏览你的网站时产生的日志信息(关于WEB日志,可以参阅这篇文章——WEB日志格式)。那为什么不直接叫网站浏览日志,而叫点击流数据呢?可以先看一下下面这张图:
从图上可以看出点击流这个概念更注重用户浏览网站的整个流程,网站日志中记录的用户点击就像是图上的“点”,而点击流更像是将这些“点”串起来形成的“线”。
也可以把“点”认为是网站的Page,而“线”则是访问网站的Session。所以点击流数据是由网站日志中整理得到的,它可以比网站日志包含更多的信息,从而使基于点击流数据统计得到的结果更加丰富和高效。
那么点击流数据是如何从WEB日志中扩展出来的呢?其实很简单,只要有Sessionid和站内Referrers就可以将这些“点”串联起
来。其中Sessionid唯一地标识一条点击流,再通过Referrers确定这个Session中页面被依次访问的顺序,那么这条线就可以轻松地画出
来了。
通常我们会分两张表(数据库中)或两种格式的文件(文件系统中)来记录点击流数据,一张记录“点”的信息,另一张记录“线”的信息:
线(Session)的信息:Sessionid(唯一标识符)、访问来源(Referrers)、进入页面
(Entrance)、离开页面(Exit)、开始时间(Begin Time)、结束时间(End Time)、访问时长(Time on
Site)、访问页面数(Depth of Visit)、访问用户(Cookie)……
有没有发现,当你拥有这些信息时,很多网站分析度量的计算变简单了:来源(Sources)、进入页面(Entrances)、离开页面
(Exits)可以直接获得,平均访问时间和平均浏览页面数也可以通过简单计算得到,连Bounce
Rate的计算也变得简单了,只要选择那些访问页面数为1的“线”就行。
点(Page)的信息:URL、点击时间(Hit Time)、页面停留时间(Time on Page)、位于Session的第几步(Step),Sessionid(在关系数据库中可以用于跟Session表的外键关联)……
其实点的信息被简化了,当然你可以添加更多的信息,比如页面响应状态码,冗余访问用户的Cookie等。但是这里多了一个有意思的信息——
Step,这个是基于Session的,通过Step你可以发现其实你已经追踪到了用户的访问足迹,这个信息在梳理网站的流程、计算转化率
(Conversion Rate)的时候非常有用,也可以基于它做用户行为分析。
其实这就是点击流,并没有那么复杂,但是可以注意到,当WEB日志转化成点击流数据的时候,很多网站分析度量的计算变得简单了,这就是点击流的“魔力”所在。基于点击流数据我们可以统计出许多常见的网站分析度量——网站分析的基本度量。(来源:http://webdataanalysis.net/data-collection-and-preprocessing/weblog-to-clickstream/)
分享到:
相关推荐
标题中的“web分析工具-src.tar.zip”表明这是一个用于分析网站数据的工具的源代码压缩包。Web分析工具是用来收集、衡量、报告以及解释网站数据,帮助我们了解网站的访问量、用户行为、流量来源等信息,以便优化网站...
一个专注于隐私的Web分析软件解决方案。我们的方案不仅提供详细的Web流量报告, 例如实时、概述、获取、行为、地理、技术和事件等,而且还非常注重用户数据的保护和隐私。 并提供了更加友好和易于理解的用户界面。...
精通WEB ANALYTICS:来自专家的最佳WEB分析策略。另外一本精通WEB ANALYTICS2.0的很多,自行搜索下载
轻量流量报告统计Web分析Software源码
在IT行业中,服务器Web日志分析是一个至关重要的领域,它涉及到网站性能监控、故障排查、安全防护等多个方面。本文将详细探讨服务器Web日志分析软件的相关知识点,以及如何利用这样的工具进行有效的数据挖掘。 首先...
Web分析是一种重要的数字营销工具,它通过收集、度量和分析网站用户的行为数据来优化网站性能,提升用户体验,以及制定更有效的营销策略。在“web analytics 客户行为分析 js”这个主题中,我们将深入探讨如何利用...
Web 项目需求分析模板详解 正如标题所示,本资源提供了一个 Web 项目需求分析模板,旨在帮助初学 Web 工程的学员快速上手编写需求分析文档。下面,我们将详细解释该模板的结构和内容,并对标签 "java, web,IT" ...
**迪娃(Diva):轻松构建Web分析仪表板** 迪娃是一个基于Python的开源项目,主要用于帮助用户轻松创建和管理Web分析仪表板。虽然该项目目前已经不再维护,但其提供的功能和理念对于初学者和对Web分析感兴趣的...
用于 Web 分析的 SQL 食谱 此存储库包含用于 Web 分析的 SQL 代码。 数据提取 Google Analytics 点击流数据 BigQuery 导出 此 SQL 查询将 Google Analytics BigQuery 嵌套数据转换为带有时间戳的平面命中级别数据,...
hp web tours 分析
《深入分析Java Web》这本书是Java Web开发领域的一本经典之作,它涵盖了多个核心主题,旨在帮助读者深入了解这个领域的各种技术细节。以下是书中的主要知识点: 1. **Java Web基础知识**:这部分通常会介绍Web应用...
### Web可靠性分析 #### 摘要与背景 本文探讨了如何通过分析Web访问日志和错误日志来识别主要的错误来源,并评估网站的可靠性。研究结果表明,在不同的文件类型之间,错误分布和可靠性分布极为不均匀。这提示我们...
Web日志安全分析工具是一种专门针对Web服务器日志进行深度挖掘和安全检查的软件,它旨在帮助网络安全专家和管理员及时发现并应对潜在的恶意攻击。该工具的核心功能包括日志解析、异常检测、攻击源定位以及生成易于...
《Web日志安全分析工具 v2.0:深入解析与应用》 在信息化时代,网络安全已经成为企业、组织和个人关注的焦点。Web服务器日志作为网络安全的重要数据来源,记录了每一次HTTP请求的详细信息,包括访问者IP地址、访问...
本资源,"web网站日志分析--完美版(很实用)",提供了一套全面且详细的解决方案,适用于.gz和.log格式的日志文件。 首先,我们来理解什么是网站日志。网站日志是服务器记录的关于网站活动的所有信息,包括用户访问...