本文转自蓝鲸的网站分析笔记
页面地址http://bluewhale.cc/2012-07-04/why-is-my-google-analytics-report-unique-visitor-greater-than-pageview.html
为什么在我的报告中,网站的UV数据会大于PV数据?这是我前一段时间经常被问到的一个问题。相信很多使用Google Analytics的朋友都会遇到这样的问题。说实话,这个问题很难解释,因为无论是按照我们的常识,还是已知的Google Analytics追踪数据原理。访问者都是不可能大于页面浏览量数据的。访问者,访问次数和页面浏览都是被存储在Cookie中的,并且同时被读取并发送给Google生成数据报告。但现实情况就是如此,UV数据真的大于PV数据了。
对于这个问题最常见的几种答案是这样的:
- Google Analytics的报告中使用了采样数据,所以造成了PV大于UV数据的情况。
- Google Analytics的PV数据丢失,或被伟大的防火墙拦截了,所以PV数据会少一些。
- Google Analytics对跨天的数据进行了切割,导致了某一个天的UV数据大于PV数据。
- 这是Google Analytics的一个bug。
以上的四种解释听着貌似还有点道理,我之前也一直找不到更好的答案来解释这个问题,直到今天碰到一个新的问题:在参与报告中的浏览页面部分出现了浏览页数小于1的访问分类。也就是说,有一部分访问并没有产生页面浏览。页面浏览量小于访问次数,再一次与我之前对访问模型的理解不一致,这与之前页面浏览量数据小于访问者数据属于同一类问题。这让我再也没有办法用以上任何一种答案来解释这个问题了。拖延症到此结束,是彻底解决这个问题的时候了!

对于这个浏览页数小于1的访问分类,Google Analytics官方帮助给出的解释这类访问属于单页浏览的访问。但这个解释似乎不正确,因为当我对报告应用“非跳出访问”高级细分后,浏览页数小于1的这部分数据并没有消失。并且,这部分访问次数与网站中的跳出访问数据也并不一致。现在,得到的所有答案都不能回答这个问题了,我们必须自己分析一下这部分流量,找出零页面浏览背后真正的原因。

在开始分析问题之前先来看下网站分析中的访问模型。访问模型说明了最常见的访问者访问网站的方式。一个访问者会多次访问一个网站,而在每次访问中又会浏览多个页面。这也是我们理解访问者,访问次数和页面浏览量指标以及他们之间相互逻辑关系的基础。在这个模型中,页面浏览量通常会大于访问次数,而访问次数又通常会大于访问者数量。即使最极端的情况下,这三个指标也应该是相等的关系,即一个访问者只来过一次,并且只浏览了一个页面。而绝不可能出现访问者来到网站后一个页面都没有浏览的情况。
按照访问模型,我们是无法解释访问者和访问次数大于页面浏览量这种情况的。但是,访问模型只限于最常见的访问者内容浏览场景。除了浏览页面之外访问者还会在网站中有更多的行为和交互,而这些数据我们也会进行追踪,也会同时掺杂在我们的数据报告中。还记得我们之前的文章中介绍过Google Analytics可以追踪的五种数据类型吗?
二,Google Analytics追踪的五类数据
下面的表格中是Google Analytics追踪的五种数据类型,其中页面类型用来记录网站页面被浏览的情况。初此之外还有事件类型交易类型和自定义类型数据。为了保证Google Analytics中归因模型的准确和完整,除了页面类型数据外,其他各种类型的数据也同样会读取cookie中的信息,并记录访问者,访问次数,和来源信息等等。如果访问者打开页面时在GATC执行之前点击了带有事件追踪的按钮,并关闭了浏览器结束访问会发生什么呢?一组记录访问者,访问次数和事件数据的日志被发送回Google,而没有页面浏览数据。
请求类型 |
描述 |
分类 |
页面类型 |
页面被浏览器请求 |
交互类 |
事件类型 |
事件追踪被触发 |
交互类 |
交易类型 |
交易成功 |
交互类 |
交易条目类型 |
交易成功 |
交互类 |
自定义类型 |
自定义的设置被触发 |
非交互类 |
以上只是我们的一个假设,下面来分析下报告中的真实数据,看看真实情况是什么样的。
三,分析PV小于1的用户群体
我们使用的分析方法很简单,甚至有点笨。就是创建一个只包含PV小于1的高级细分,然后逐一对每个报告进行检查,寻找异常,看看能不能有什么进一步的发现。

通过对每个报告进行检查我们发现,这部分数据除了在内容报告和与页面数据相关的报告中没有数据之外,在其他报告中数据都是正常的。包括访问者语言,地理位置,浏览器,来源等等。
四,内容报告与事件报告对比
最后,我们再来看一下最关键的一个报告,事件报告。前面我们检查过这部分流量没有产生页面浏览,因此内容报告中也是空的。而在事件报告中我们不仅发现了事件数据,还有触发事件的页面URL,而这些页面在内容报告中是没有页面浏览数据的。这是一个非常奇怪的现象。事件依托于页面的追踪代码,当访问者触发了事件时却没有触发页面浏览数据。
内容报告

事件报告

为了进一步确定这部分数据的类型,以及与页面浏览数据的逻辑关系。我们单独创建了一个自定义报告,将页面浏览数据,访问数据,访问者数据和事件数据进行了对比。寻找规律。

通过分析发现,所有页面浏览量为0的页面都是设置了事件追踪的页面,并且都有事件数据,访问者数据和访问数据。
六,可能产生问题的几个原因
最后,我们来猜测下Google Analytics追踪不到页面浏览数据,只单独记录事件数据的原因。我分析有两种情况。
1 页面加载缓慢

第一种情况是页面加载慢,访问者在GATC执行前触发了事件,并因页面加载过慢而结束访问。造成了只有事件数据被记录,而页面数据没有被记录的情况。
2 追踪代码运行失败
第二种情况是页面内JS代码冲突或GATC执行失败,没有记录到该页面的浏览数据。而只记录到了事件数据。
最后说明下,造成页面浏览数据小于访问数据的情况可能还会有其他的原因,以上的分析和结果基于我报告中的数据。如果你也有这个问题,那么最好也按照这个方法检查一下自己报告中的数据。如果你有新的发现,或者不一样的结论,也欢迎对我指教,与我共享。
—【所有文章及图片版权归 蓝鲸(王彦平)所有。欢迎转载,但请注明转自“蓝鲸网站分析博客”。】—
Read more: http://bluewhale.cc/2012-07-04/why-is-my-google-analytics-report-unique-visitor-greater-than-pageview.html#ixzz26QANIzI4
分享到:
相关推荐
数据分析报告主要涵盖了网站分析的基本度量,如visit、UV、PV、Cookies以及相关概念的理解和应用。以下是这些知识点的详细解释: 1. **Visit(访问)**:一次visit通常指的是用户在网站上的一次完整浏览行为,即从...
3. **Visits与UV的关系**:UV的数量总是大于等于Visits,因为一个访客在一次Visit中可能会访问多个页面。如果一个网站在一小时内被访问10次(Visits=10),UV的数量取决于这10次访问是由多少不同的访客产生的。 4. ...
Rocky Linux 8.10内核包
内容概要:本文档详细介绍了如何在Simulink中设计一个满足特定规格的音频带ADC(模数转换器)。首先选择了三阶单环多位量化Σ-Δ调制器作为设计方案,因为这种结构能在音频带宽内提供高噪声整形效果,并且多位量化可以降低量化噪声。接着,文档展示了具体的Simulink建模步骤,包括创建模型、添加各个组件如积分器、量化器、DAC反馈以及连接它们。此外,还进行了参数设计与计算,特别是过采样率和信噪比的估算,并引入了动态元件匹配技术来减少DAC的非线性误差。性能验证部分则通过理想和非理想的仿真实验评估了系统的稳定性和各项指标,最终证明所设计的ADC能够达到预期的技术标准。 适用人群:电子工程专业学生、从事数据转换器研究或开发的技术人员。 使用场景及目标:适用于希望深入了解Σ-Δ调制器的工作原理及其在音频带ADC应用中的具体实现方法的人群。目标是掌握如何利用MATLAB/Simulink工具进行复杂电路的设计与仿真。 其他说明:文中提供了详细的Matlab代码片段用于指导读者完成整个设计流程,同时附带了一些辅助函数帮助分析仿真结果。
内容概要:该题库专为研究生入学考试计算机组成原理科目设计,涵盖名校考研真题、经典教材课后习题、章节题库和模拟试题四大核心模块。名校考研真题精选多所知名高校的计算机组成原理科目及计算机联考真题,并提供详尽解析,帮助考生把握考研命题趋势与难度。经典教材课后习题包括白中英《计算机组成原理》(第5版)和唐朔飞《计算机组成原理》(第2版)的全部课后习题解答,这两部教材被众多名校列为考研指定参考书目。章节题库精选代表性考题,注重基础知识与重难点内容,帮助考生全面掌握考试大纲要求的知识点。模拟试题依据历年考研真题命题规律和热门考点,精心编制两套全真模拟试题,并附标准答案,帮助考生检验学习成果,评估应试能力。 适用人群:计划参加研究生入学考试并报考计算机组成原理科目的考生,尤其是需要系统复习和强化训练的学生。 使用场景及目标:①通过研读名校考研真题,考生可以准确把握考研命题趋势与难度,有效评估复习成效;②通过经典教材课后习题的练习,考生可以巩固基础知识,掌握解题技巧;③通过章节题库的系统练习,考生可以全面掌握考试大纲要求的各个知识点,为备考打下坚实基础;④通过模拟试题的测试,考生可以检验学习成果,评估应试能力,为正式考试做好充分准备。 其他说明:该题库不仅提供详细的题目解析,还涵盖了计算机组成原理的各个方面,包括计算机系统概述、数据表示与运算、存储器分层、指令系统、中央处理器、总线系统和输入输出系统等。考生在使用过程中应结合理论学习与实践操作,注重理解与应用,以提高应试能力和专业知识水平。
__UNI__DB9970A__20250328141034.apk.1
rust for minio
国网台区终端最新规范
资源内项目源码是来自个人的毕业设计,代码都测试ok,包含源码、数据集、可视化页面和部署说明,可产生核心指标曲线图、混淆矩阵、F1分数曲线、精确率-召回率曲线、验证集预测结果、标签分布图。都是运行成功后才上传资源,毕设答辩评审绝对信服的保底85分以上,放心下载使用,拿来就能用。包含源码、数据集、可视化页面和部署说明一站式服务,拿来就能用的绝对好资源!!! 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、大作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.txt文件,仅供学习参考, 切勿用于商业用途。
一个简单的机器学习代码示例,使用的是经典的鸢尾花(Iris)数据集,通过 Scikit-learn 库实现了一个简单的分类模型。这个代码可以帮助你入门机器学习中的分类任务。
pyqt离线包,pyqt-tools离线包
资源内项目源码是来自个人的毕业设计,代码都测试ok,包含源码、数据集、可视化页面和部署说明,可产生核心指标曲线图、混淆矩阵、F1分数曲线、精确率-召回率曲线、验证集预测结果、标签分布图。都是运行成功后才上传资源,毕设答辩评审绝对信服的保底85分以上,放心下载使用,拿来就能用。包含源码、数据集、可视化页面和部署说明一站式服务,拿来就能用的绝对好资源!!! 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、大作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.txt文件,仅供学习参考, 切勿用于商业用途。
SQL常用日期和时间函数整理及在sqlserver测试示例 主要包括 1.查询当前日期GETDATE 2.日期时间加减函数DATEADD 3 返回两个日期中指定的日期部分之间的差值DATEDIFF 4.日期格式转换CONVERT(VARCHAR(10),GETDATE(),120) 5.返回指定日期的年份数值 6.返回指定日期的月份数值 7.返回指定日期的天数数值
GSDML-V2.3-Turck-BL20_E_GW_EN-20160524-010300.xml
T_CPCIF 0225-2022 多聚甲醛.docx
《基于YOLOv8的智能仓储货物堆码倾斜预警系统》(包含源码、可视化界面、完整数据集、部署教程)简单部署即可运行。功能完善、操作简单,适合毕设或课程设计
蚕豆脱壳机设计.zip
台区终端电科院送检文档
Y6一39一No23.6D离心通风机 CAD().zip
django自建博客app