原文官网地址如下:
http://www.webanalyticsassociation.org/resource/resmgr/PDF_standards/WebAnalyticsDefinitionsBig3.pdf
关于翻译中需要注意的地方:
metrics:业界常见的中文翻译是”度量“,读者也可以将其理解成”指标“的意思。本文中对该词翻译是参照业界常见的中文翻译进行翻译的。
网站分析 “三大” 度量
唯一访问者数(Unique
Visitors)
(关于该度量单位,读者还可以参阅我写的另一篇文章: http://yhz61010.iteye.com/blog/706003)
访问数/会话数(Visits/Sessions)
页面浏览数(Page
Views)
(关于该度量单位,读者还可以参阅我写的另一篇文章: http://yhz61010.iteye.com/blog/705921)
引言:
从2006年下半年开始,网站分析协会标准委员会(以下简称:委员会)就致力于定义出公认的三个最重要的度量 - 唯一访问者数(Unique
Visitors),访问数/会话数(Visits/Sessions),页面浏览数(Page Views)。
标准委员会认为,以上三个度量是构成大多数网站分析概念的基础。此外,由于要理解网站分析的其它度量的前提,是要理解以上这三个度量,所以我们首先要先将关注点,放到这三个度量上。
委员会向整个 WAA 的成员发送了调查请求,最后经过多轮调查,对反馈的信息和评论进行审阅,最终评选出这些度量。
对于收集反馈信息而言是非常重要的,因此我们非常欢迎您提出宝贵的意见和想法。如果您想反馈您的信息,请发送邮件至
standards@webanalyticsassociation.org,与 Jason Burby 或 Angie Brown 联系。
基础概念体系概述
网站分析度量有三种类型 - count, ratio, 和 KPI:
·Count - 是最基本的统计单位。一般是一个数值,而不是一个比率。通常它是一个整数(例如,Visits =
12,398),但也可以是含有小数位(例如,Total Sales = $52,126.37)。
·Ratio -
典型的是由一个 count 除以另一个 count 得到的,但其分子或分母既可以是 count 也可以是 ratio。(使用 ratio
作为分子或分母的例子是”Stickiness“。)通常,此种类型的度量的值不是一个整数。由于它是一个比率,所以在这种类型的度量中,通常有“每”字出现。例如(每次访问的页面浏览数)。比率的概念定义了
ratio 本身,同时也定义了以此为基础的度量。(原文如下:A ratio’s definition defines the ratio itself, as
well as any
underlying metrics.)
·KPI(Key Performance
Indicator)(主要绩效指标) - 虽然 KPI 既可以是 count 也可以是 ratio,但它通常是 ratio。尽管基本的
count 和 ratio 可以用于所有类型的网站,但 KPI 中的 “Key” 却被注入到了商业战略中。因此,一套适宜的 KPI
就是网站和过程典型的不同之处。
(原文如下:)
While basic counts and ratios can be used by
all Web site types, a KPI is infused with business strategy — hence the term,
“Key” — and therefore the set of appropriate KPIs typically differs between site
and process types.
度量可以应用于以下三种范围中:
·Aggregate -
指定期间内,网站的总浏览量。
·Segmented -
指定期间内,网站流量的一个子集。通过按某种方式过滤出的网站流量,可以获得更有分析价值的数据。例如,按 campaign 进行过滤(例如,邮件(e-mail),
广告(banner), 按点击付费的广告(PPC), affiliate 等),或者是按访问者类型进行过滤(例如,新访问者与再访问者,再次购买者,high
value 等),或者是按推荐网站(referrer)进行过滤。
·Individual -
在指定期间内,一个单一网站访问者的活动。
术语:唯一访问者数(Unique Visitors)
(关于该度量单位,读者还可以参阅我写的另一篇文章: http://yhz61010.iteye.com/blog/706003)
类型:Count
范围:Aggregate, Segmented
定义/计算:
在指定期间内,推断出的独立用户数(过滤掉搜索引擎等爬虫(spider 或
robot)的访问)。独立用户在网站上的活动是由一次或多次访问组成的。在指定期间内,每个独立用户将被作为唯一访问者,在统计时,只被统计一次。
说明:
身份认证,无论是积极的还是消极的,都是跟踪唯一访问者最准确的方法。然而,由于大多数网站并不要求用户必须登陆才能访问,因此,识别唯一访问者最常用的方法就是在
cookie 中保存一个唯一的 id。由于可能使用不同的方法来跟踪唯一访问者,所以,您应该询问您的工具提供商,了解它们是如何计算此度量的。
统计唯一访问者数,通过是和一个期间相关的(最常见的期间是天,周,或月)。这是一个“不可相加”的度量。这意味着,不能将不同期间,访问不同页面或不同内容组上的唯一访问者数进行相加,因为,在一个期间内,一个访问者可能访问多个页面或产生多个访问(visits),所以访问者数和页面浏览数之前没有什么必然的联系,除非,一个访问者只访问一个页面。
(关于对 cookie 的一些认识和误解,读者还可以参阅我写的另一篇文章: http://yhz61010.iteye.com/blog/708377)
若 cookie
被删除,无论是删除了第一方 cookie 还是第三方 cookie,都会导致统计出的唯一访问者数比实际的要多。若用户禁用了
cookie,那么当用户访问网站时,就无法对该用户进行唯一访问者统计。由于处理该度量的方法不同,所以还要依赖于所使用的分析工具。询问您的工作提供商,了解当用户禁用了
cookie 时,您的工具是如何进行统计的。需要您特别留意这一点,因为这会影响那些和访问者相关的其它度量。
术语:访问数/会话数(Visits/Sessions)
类型:Count
范围:Aggregate, Segmented
定义/计算:
访问是指与用户与网站之间的交互。而一个网站又是由一次或多次(例如:“页面浏览”(“page
view”))请求组成的。这些请求就是分析师定义的内容单位。如果用户在指定的期间(即超时时间,该超时时间是指分析工具设置的超时时间,和网站的超时时间没有关系)内没有执行任何动作(典型的动作就是访问其它的页面),那么该会话就会被切断。
说明:
不同的工具提供商会使用不同的策略来跟踪会话。询问您的工具提供商来了解该度量是如何被计算的。通常将访问超时时间设为 30
分钟,不过该值在大多数网站应用应用里是可配置的。
一次典型的访问是由一次或多次页面浏览(请参照“页面浏览”的定义)组成的。但是,如果和网站之间的交互仅仅是文件下载,流媒体,Flash,或是其它非
HTML
内容的话,那么对这种请求而言,某些网站分析工具可能不将这种请求当成“页面”,但是这种请求依然会被当成是一次访问中的有效请求。理解该度量的关键就是用户与网站所展示出的内容进行的交互。
不同时间内的访问数是可以进行累加的,但是不同页面浏览和不同内容组上的访问是不能进行累加的,因为一次访问可以包含多个页面浏览。
术语:页面浏览数(Page Views)
(关于该度量单位,读者还可以参阅我写的另一篇文章: http://yhz61010.iteye.com/blog/705921)
类型:Count
范围:Aggregate, Segmented
定义/计算:
一个页面(分析师定义的内容单位)被浏览的次数。
说明:
大多数网站分析工具允许客户指定哪些类型的文件或请求可以被当作是一个“页面”。特定的一些技术包括(并不局限于这些)Flash,AJAX,媒体文件,下载,文档和
PDF,虽然不是典型的“页面”,但是在某些工具中,也可以将它们当成“页面”。
像 XML Feed (RSS 或
Atom)和邮件这种既可以通过浏览器发送,又可以通过非浏览器发送的内容,通常不计为“页面浏览数”,因为请求的内容或收到的内容与最终显示的内容并不一致。因此有一种解决方案是,在上述内容中插入一个基于图片的
Page Tag,从而来跟踪这些内容的浏览情况。
Web 服务器返回的结果中包含状态码,代表请求的内容是否存在(状态码 400 -
499),或者是否出现了服务器错误(状态码 500 - 599)。遇到上述情况的请求,一般不应该被计为“页面浏览”,除非 Web
服务器为上述特定的出错状态指定了一个真实的页面。当遇到访问的内容不存在或出错的情况下,广泛的作法是在 Web 服务器(Apache 和
IIS)应用中进行设置,可以返回一个网站地图,搜索页面,或是帮助支持页面,从而替代默认的出错提示。
若 Web 服务器返回的状态码(300
- 399)表示重定向到其它的页面时,通常也不将其计为“页面浏览数”,但是可以用于跟踪事件(例如,点击事件)用在特定设计的使用重定义作为一种统计机制的系统上。
若 Web 服务器返回的状态码(200 - 299)表示成功返回响应结果时,其中一少部分状态码所表示的结果可能不会被计为“页面浏览”:状态码
202(Accepted)表示请求已经被服务器接受,并且服务器有可能或者也可能不会在之后返回请求结果。由于无法根据这种状态码来判断是否返回了请求结果,因此,页面浏览数中通常不包含这种情况。状态码
204(No Response)表示没有内容被返回,但也没有出错,所以浏览器会停留在请求之前的页面。它本质上是一个非事件。状态码 206(Partial
Download)通常出现在大文件下载中(例如,下载 PDF)。该状态码表示只传输了一部分内容,因此,也不应该被计为页面浏览。
通过过滤状态码排除一部分请求的方法,一般用在处理原始 Web 服务器 Log 文件的情况下,对于基于 Page Tag
实现的统计方法,并不需要这种过滤操作。工具提供商会根据不同的情况来决定哪些请求应该被统计。请咨询您的工具提供商来了解更多关于统计算法实现的信息。
================== 转载者自己的话 =====================
举个例子来说,可以更容易的理解这些概念:
总共三个指标: PV,Visits,Unique Visitors(此处简称UV)
假设有里两个用户:甲,乙
时间间隔使用30分钟。
情况一:
甲在30分钟内访问页面的顺序: A,B,A
那么此时。系统的 页面A的 PV=2
页面B的 PV=1
系统的Visits = 1 (看似访问了三个页面,与网站有三次交互,但是由于在一个30分钟的时间段内,所以Visit只计1)
系统的UV= 1
情况二:
甲在60分钟内访问页面的顺序:前30分钟: A,B,A
后30分钟: A,A
那么此时。系统的 页面A的 PV=4
页面B的 PV=1
系统的Visits = 2
系统的UV= 1
情况三:
甲在60分钟内访问页面的顺序:前30分钟: A,B,A
后30分钟: A,A
乙在30分钟内访问页面的顺序:B,B
那么此时。系统的 页面A的 PV=4
页面B的 PV=3
系统的Visits = 3 (有三次访问。甲有两个30分钟时间段的访问,乙有一次)
系统的UV= 2 (唯一性,这是我们知道的准确情况,但是有可能网站统计出来的不一定准确。具体情况看UV的那篇文章)
分享到:
相关推荐
作者提出了一个名为DSCCA的网络转载传播模型,该模型包括三个主要参与者:官方发布者、网络推手和普通网友。这些发布者通过搜索引擎、门户网站、虚拟社区和主流论坛等渠道,在大众、分众、小众和自我四个层面上进行...
司财务柔性数据大合集,包括参考来自权威文献构建的三大权威测度指标!累计涵盖5.3 w+观测值数量,5200+样本企业!一个数据集将上市公司财务柔性数据所需数据一网 打尽! 附件内所有文件均包括excel、dta格式面板...
气候风险 持续更新,后续关注我后免费获取更新版本 不管什么时候毕业或者发期刊用到 ,都能用到最新的数据 ...该指标值越大,表明企业面临的气候风险越大。并根据风险类型分为三种:严重风险、慢性 风险和交易风险。
括参考权威文献构建的衡量企业组织韧性的三大测度指标与详细原始数据!本数据集参考来 自《Strategic Management Journal》《系统管理学报》等 权威文献做法构建测量企业组织韧性的指标,累计涵盖5.6w+观测值数量,...
在工业设计中,三维模型是一种重要的工具,它允许工程师和设计师在计算机上创建、修改和分析物体的几何形状,以便在制造前检查其结构、功能和外观。在这个案例中,"A46 大型转载机变位焊接机"可能是一个复杂的机械...
RFM方法是一种广泛采用的客户价值分析框架,它通过三个关键指标来衡量客户的行为:最近一次消费的时间(Recency)、消费的频次(Frequency)和每次消费的金额(Monetary)。通过对这三个指标的组合分析,企业可以...
它根据特定的网站评价方法和指标,以一定的商务网站为分析评价对象,为顾客、被评价网站及其投资方提供相关的分析与评价结果。 电子商务网站评价的类型包括消费者评价、专家评价、网站自身评价等多种类型。根据不同...
动态能力数据大合集,包括参考来自《管理世界》权威文献构建的4大权威指标及详细原始 数据!累计涵盖4.4w+观测值数量,4900+样本企业!一个数据集将上市公司动态 能力研究领域所需数据一网打尽! 附件内所有文件均...
【原创整理,严禁任何团队和个人转载获利,转载必究!】 上市公司金融 化是近年来研究的热点方向之一,将上市公司金融化与企业创新、投资决策、企业转型等领 域问题的实证研究更是如日中天。附件内为1998-2022上市...
【原创整理,严禁任何团队和个人转载获利,转载必究!】 关于上市公司分 析师关注的研究是近年来研究的热点方向之一,将上市公司分析师关注与企业创新、投资效 率等其他领域问题的实证研究更是如日中天。 附件内为...
本文同时着重分析保险数据分析行业竞争格局,包括全球市场主要企业中国本土市场主 要企业竞争格局,重点分析全球主要企业近三年保险数据分析的收入和市场份额。 此外针对保险数据分析行业产品分类、应用、行业政策...
5. 数据采集与处理流程:报告中介绍了新闻数据采集的流程,包括通过网络爬虫获取新闻、筛选时效性强的个股新闻存入数据库、根据新闻关注程度估算个股关注度指标,以及对新闻转载数量、排名、阅读数量等指标的分析。...
竞争文化)文本分析数据大合集!累计涵盖4.6w+观测值数量,5300+样本企业! 包括参考来自权威C刊构建的20+上市公司竞争文化文本分析的原始词频的详细数据以及 企业竞争文化的最终测度指标! 本数据集由权威方法...
内容包括网站分析、爬取数据、解密数据、清洗数据并写入CSV 文件、构建网页进行大屏可视化, 使用flask对爬取的数据进行进行交互式大屏可视化 (详见 三 2.2) 通过 flask 框架构建一个网页,使用HTML、CSS 将网页分为7...
三、数据指标 行政区划代码、地区、长江经济带、经度、纬度、年份、普通高等学校数(所)、普通高等学校招生数(万人)、普通高等学校本科招生数(万人)、普通高等学校专科招生数(万人)、普通高等学校在校学生数(万人)、...
生意参谋是卖家每天必看的,但大多数都只停留在看的层面上,对于数据分析及哪些指标该引起重视,又如何优化,这些就很少有人清楚了。下面我就和大家讲讲生意参谋数据分析的那点事。 一、入店关键词排行及单品访问...
通过模型计算VPIN指标首先要确定将样本 期的交易量分为多少个交易量桶,参照Easley et al. (2012)的理论 和陈国进等(2019)结合中国股票市场的分析,采用n=8作为日交易量桶数进行测算 ,最小时间间隔为1分钟。使用...
数据量比较大, 放在百度网盘 经管之家:momingiqmiao7 欢迎关注,分享更多实用的数 据,独家发布,严禁转载获利,转载必究,有任何问题在可以帖子下方回复,及时回复 注 意:支持经管之家和微信购买(账号同名),...
本报告关注的是全球家电行业的媒体监测情况,主要涉及技术方面的信息,通过对品牌曝光频次、新闻属性、转载率、传播比等关键指标的分析,来评估不同家电企业的媒体表现。 1. **曝光频次**:这是衡量品牌在媒体报道...