`
Ryee
  • 浏览: 284923 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

web分析

阅读更多

我们平常在看网站分析相关文章的时候,时常会看到“点击流(Clickstream)”这个词,点击流数据是网站分析的主要来源。那么究竟什么是点 击流数据,它又来源于何处,为什么它是网站分析的基础数据?关于这些问题的系统解释,推荐阅读《点击流数据仓库》这本书,这里先对这几个问题做下简单的回 答。

  首先,点击流来源于何处?可能从文章标题就可以看出来了,点击流数据来源于网站日志,其实就是用户日常浏览你的网站时产生的日志信息(关于WEB日志,可以参阅这篇文章——WEB日志格式)。那为什么不直接叫网站浏览日志,而叫点击流数据呢?可以先看一下下面这张图:

clickstream

  从图上可以看出点击流这个概念更注重用户浏览网站的整个流程,网站日志中记录的用户点击就像是图上的“点”,而点击流更像是将这些“点”串起来形成的“线”。 也可以把“点”认为是网站的Page,而“线”则是访问网站的Session。所以点击流数据是由网站日志中整理得到的,它可以比网站日志包含更多的信息,从而使基于点击流数据统计得到的结果更加丰富和高效。

  那么点击流数据是如何从WEB日志中扩展出来的呢?其实很简单,只要有Sessionid和站内Referrers就可以将这些“点”串联起 来。其中Sessionid唯一地标识一条点击流,再通过Referrers确定这个Session中页面被依次访问的顺序,那么这条线就可以轻松地画出 来了。

  通常我们会分两张表(数据库中)或两种格式的文件(文件系统中)来记录点击流数据,一张记录“点”的信息,另一张记录“线”的信息:

  线(Session)的信息:Sessionid(唯一标识符)、访问来源(Referrers)、进入页面 (Entrance)、离开页面(Exit)、开始时间(Begin Time)、结束时间(End Time)、访问时长(Time on Site)、访问页面数(Depth of Visit)、访问用户(Cookie)……

  有没有发现,当你拥有这些信息时,很多网站分析度量的计算变简单了:来源(Sources)、进入页面(Entrances)、离开页面 (Exits)可以直接获得,平均访问时间和平均浏览页面数也可以通过简单计算得到,连Bounce Rate的计算也变得简单了,只要选择那些访问页面数为1的“线”就行。

  点(Page)的信息:URL、点击时间(Hit Time)、页面停留时间(Time on Page)、位于Session的第几步(Step),Sessionid(在关系数据库中可以用于跟Session表的外键关联)……

track

  其实点的信息被简化了,当然你可以添加更多的信息,比如页面响应状态码,冗余访问用户的Cookie等。但是这里多了一个有意思的信息—— Step,这个是基于Session的,通过Step你可以发现其实你已经追踪到了用户的访问足迹,这个信息在梳理网站的流程、计算转化率 (Conversion Rate)的时候非常有用,也可以基于它做用户行为分析。

  其实这就是点击流,并没有那么复杂,但是可以注意到,当WEB日志转化成点击流数据的时候,很多网站分析度量的计算变得简单了,这就是点击流的“魔力”所在。基于点击流数据我们可以统计出许多常见的网站分析度量——网站分析的基本度量。(来源:http://webdataanalysis.net/data-collection-and-preprocessing/weblog-to-clickstream/)

分享到:
评论

相关推荐

    web分析工具-src.tar.zip

    标题中的“web分析工具-src.tar.zip”表明这是一个用于分析网站数据的工具的源代码压缩包。Web分析工具是用来收集、衡量、报告以及解释网站数据,帮助我们了解网站的访问量、用户行为、流量来源等信息,以便优化网站...

    轻量流量报告统计 Web分析 Software源码

    一个专注于隐私的Web分析软件解决方案。我们的方案不仅提供详细的Web流量报告, 例如实时、概述、获取、行为、地理、技术和事件等,而且还非常注重用户数据的保护和隐私。 并提供了更加友好和易于理解的用户界面。...

    精通WEB ANALYTICS:来自专家的最佳WEB分析策略

    精通WEB ANALYTICS:来自专家的最佳WEB分析策略。另外一本精通WEB ANALYTICS2.0的很多,自行搜索下载

    轻量流量报告统计Web分析Software源码.txt

    轻量流量报告统计Web分析Software源码

    服务器web日志分析软件

    在IT行业中,服务器Web日志分析是一个至关重要的领域,它涉及到网站性能监控、故障排查、安全防护等多个方面。本文将详细探讨服务器Web日志分析软件的相关知识点,以及如何利用这样的工具进行有效的数据挖掘。 首先...

    web analytics 客户行为分析 js

    Web分析是一种重要的数字营销工具,它通过收集、度量和分析网站用户的行为数据来优化网站性能,提升用户体验,以及制定更有效的营销策略。在“web analytics 客户行为分析 js”这个主题中,我们将深入探讨如何利用...

    web项目需求分析模板

    Web 项目需求分析模板详解 正如标题所示,本资源提供了一个 Web 项目需求分析模板,旨在帮助初学 Web 工程的学员快速上手编写需求分析文档。下面,我们将详细解释该模板的结构和内容,并对标签 "java, web,IT" ...

    diva:轻松设置Web分析仪表板

    **迪娃(Diva):轻松构建Web分析仪表板** 迪娃是一个基于Python的开源项目,主要用于帮助用户轻松创建和管理Web分析仪表板。虽然该项目目前已经不再维护,但其提供的功能和理念对于初学者和对Web分析感兴趣的...

    Web日志安全分析工具

    通过对Web服务器的访问记录进行深入分析,该工具能够迅速识别出异常行为,为安全人员提供及时的警报和详细的安全分析报告。 日志解析是整个安全分析过程的起点。Web服务器默认记录下所有用户对其的访问请求,包括...

    nullitics:极简的开源Web分析

    NULLITICS 零努力Web分析。 这是Nullitics的自托管开源版本。 请访问获取云中世界上最便宜的Web分析。特征注重隐私(无Cookie,完全匿名)。 易于设置(无数据库,无外部依赖项)。 有意义,时尚的。 易于理解的指标...

    sql-recipes:用于 Web 分析的 SQL 食谱

    用于 Web 分析的 SQL 食谱 此存储库包含用于 Web 分析的 SQL 代码。 数据提取 Google Analytics 点击流数据 BigQuery 导出 此 SQL 查询将 Google Analytics BigQuery 嵌套数据转换为带有时间戳的平面命中级别数据,...

    hp web tours 分析

    hp web tours 分析

    深入分析java web

    《深入分析Java Web》这本书是Java Web开发领域的一本经典之作,它涵盖了多个核心主题,旨在帮助读者深入了解这个领域的各种技术细节。以下是书中的主要知识点: 1. **Java Web基础知识**:这部分通常会介绍Web应用...

    CrazyStat:免费PHP Web分析脚本-开源

    CrazyStat是一个用PHP编写的Web分析脚本。 它不需要访问服务器日志文件或MySQL数据库即可生成网站访问者的统计信息。 该脚本具有很好的可用性,并且仍然具有许多功能。 统计信息只需要一个屏幕长度即可显示所有信息...

    web可靠性分析

    ### Web可靠性分析 #### 摘要与背景 本文探讨了如何通过分析Web访问日志和错误日志来识别主要的错误来源,并评估网站的可靠性。研究结果表明,在不同的文件类型之间,错误分布和可靠性分布极为不均匀。这提示我们...

Global site tag (gtag.js) - Google Analytics