`
Ryee
  • 浏览: 283362 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

细说Google Analytics中的流量来源

阅读更多
这些天和BI同事梳理了网站的数据分析指标,构建了按照产品线和流量来源渠道拆分的评估指标。

这个机会也让我从新认识了数据的强大,通常业务数据统计的PV、UV这些指标都是不严格意义上的数据,细分下来会找到很多有意思的东西。如果真的切分某一产品线并追踪他的转化率情况,那么BI在建模的时候就要运用多种手段来达成目标。

其中基于页面的统计和基于会话的统计和后续的分析就非常重要了,并且数据的准确与否完全要参照业务线的需求才能给出合理的指标参照。

昨天拿到了一周奋战的阶段性成果,很是兴奋啊,用户整体评估指标和“用户们”在网站上都在干什么做者怎样的操作,只要你的能有合适的方法说清楚,BI一概都能完成出来。

虽然公司不用第三方统计工具但对于很多网站而言,GA也是他们必备的统计分析工具,但大家不能迷恋他,每个统计工具都有自己的局限性,并且通用的东西肯定不适用各个场合,所以要谨慎解读各数据指标,这里转载一篇关于GA的文章大家共参考

最近在查看一个网站的数据时发现,该网站流量来源中直接流量部分占了40%。这说明有近一半的访次属于直接访问!对照Google Analytics对直接流量的定义,确认该网站近期没有进行过大规模的线下推广活动后,我们马上就可以得出这样一条结论。访客对网站有很高的忠诚度。因为他们可以记住14个字母的英文二级域名,并且每次直接输入域名或从收藏夹中直接访问网站。但事实真的是这样吗?我有些怀疑。

Google Analytics对直接流量的定义。

通过点击书签或直接在浏览器中输入网址进入网站的访问者。直接流量可包括通过离线广告系列(如印刷材料和电视)引入的访问者。
诡异的直接流量来源

我怀疑的原因主要有3个:

流量来源目录1,网站的内容和服务都是针对国内用户的,并且很大众化。14个字母的英文二级域名访客真的记得住吗?(还记得那个故事吗?很多人每次上网都登录baidu.com,然后在里面输入网站名称,再在结果里点击访问。即使访问google也是如此。)

2,按照经验,40%的直接流量在行业中算是一个比较高的水平了。一般有两个产生原因。

A: 较新网站,搜索收录和外部链接都不多的情况下,大部分的来源都集中在直接访问。

B: 知名网站,比如sohu.com, qq.com等等。这些高知名度的网站,访客不仅会记下域名还会加入收藏。

3,直接流量并没有那么单纯,里面可能包含很多未知的访问来源。

上面的三个原因只是我的猜测,猜测不能写在报告中,更不能证明这40%的直接流量存在问题。我们还需要回到报告中,用数据来说话。按照直接流量的定义,访客收藏网站地址说明网站内容对访客有吸引力,访客愿意继续访问网站。而主动输入域名或从收藏夹中访问网站,都说明访客有主动访问网站的意愿。 所以我们从跳出率,访客类型和访问时长几个指标上对这40%的直接流量进行对比和分析。

跳出率报告对比

跳出率可以用来衡量网站内容与访客的匹配程度,当访客在网站上没有找到需要的内容时,就不会继续访问,并且直接离开网站。

直接流量与其他流量跳出率对比图


上面的截图中,高高的,飘在最上面的,绿色的曲线就是直接流量。直接流量的跳出率要高于搜索流量和推介流量,甚至高于整站的跳出率水平。

访客类型报告对比

直接流量与其他流量新访比例对比图

在访问者类型报告中,直接流量中有37%属于新访访,比非付费搜索的比例还要高。真不知道这些新访客是如何获得,记住,并准确输入这14个字母的网站二级域名的。

访问停留时间对比

直接流量与其他流量停留时间对比图

在访问停留时间上,直接流量中也有大部分访次的停留时间只有0-10秒。明显低于非付费搜索流量的水平。

通过上面三个报告的对比发现,40%的直接流量有较高跳出率,新访率和较短的访问停留时间。这些都不太符合直接流量的访客行为特征。并且说明Google Analytics对直接流量的定义也不够准确。

那么Google Analytics的直接流量里除了直接访问和收藏夹外还包含哪些来源的流量呢?先来看下Google Analytics是如何获得网站的流量来源,又是如何对不同的来源进行分类的。(这部分有点偏技术,并且有点复杂。看我能不能解释清楚)
Google Analytics中的三种流量来源

通常,在我们输入域名访问一个网站的时候,浏览器会向服务器发送一个HTTP请求,在这个请求的头部信息中会包含一个Referer字段,记录了本次请求的来源URL地址。

推介网站流量:

如果你通过点击http://webdataanalysis.net/上的友情链接访问我的博客,在HTTP请求的Referer字段中就会记录下这个URL地址。同时在页面加载后Google Analytics的追踪代码会向Google返回一条数据,参数中utmr也会记录到这个URL地址。

PS:webdataanalysis.net是一个很棒的网站数据分析博客。

HTTP头部Referer信息

搜索引擎流量:

如果是通过搜索引擎呢?当我们在搜索引擎中查询关键词的时候,搜索结果页的URL里会带有我们当前搜索的关键词内容。比如,我在google搜索我的网站域名。搜索结果页的URL是这样的。

http://www.google.com/search?hl=en&q=bluewhale.cc&aq=f&aqi=g-s1g2&aql=&oq=&gs_rfai=

q是google 的查询参数,后面是我本次搜索的关键词。点击结果访问网站时,HTTP会把这个URL记录到Referer字段里。

HTTP头部搜索引擎的Referer信息

在ga,js文件中,会对每次Referer字段的URL进行比较,如果是搜索引擎就保存关键字信息。并一起发送回google的服务器。

直接访问流量:

如果是直接输入域名,或者是从收藏夹中访问,在HTTP的请求中就不会有Referer字段,同时Google Analytics的返回数据中utmr的值也会为空。

三种流量来源的记录方式都说完了,看起来还算清楚,HTTP头信息记录访问的Referer信息,Google Analytics按照Referer信息对来源进行判断,有Referer信息的算作推介来源,Referer信息与JS文件中的搜索名称匹配的保留关键字信息,并算作搜索来源。没有Referer信息的算作直接流量。看起来不会有什么问题的。但实际上并不是这么准确的。

PS:此外,在Google Analytics的流量来源饼图中有时还会有黄色的部分。这部分表示单独标记过的URL所产生的流量。
对流量来源造成影响的因素:

影响搜索引擎流量的因素:

Google Analytics依靠JS文件中的搜索引擎名称和查询参数列表来判断本次访问的来源,但JS文件中并没有覆盖所有的搜索引擎。所以当Google Analytics在找不到对应的搜索引擎名称,或者查询参数的时候,就会把这次访问归为推介网站来源。

影响推介网站流量的因素:

Google Analytics依靠Referer字段来获得访问的来源URL,并根据是否有Referer信息来对流量进行分类。但有时却无法获得这部分信息。比如:

1 点击Flash广告中的链接

2 点击包含在JS中的链接

3 使用鼠标拖拽链接打开页面

4 … …

Kevin Yang的博客中列举了各种可能丢失Referer的原因,并针对每个原因在不同的浏览器中进行了测试。

影响直接访问流量的因素:

所有丢失Referer信息的来源都会被Google Analytics算作直接流量。所以,直接访问流量的组成比较复杂。里面可能包含了部分推介来源的流量,这会使报告中的直接流量膨胀。同时当访问者首先通过搜索引擎或标记链接访问网站后,再次直接访问时,这部分直接流量又会被记录为之前的来源。 这些都会影响我们对直接流量属性的判断。

所以在开头的那个例子中,仅凭数据的解释和定义对数据进行分析是不够的。好像纸上谈兵。这时我们更多需要的是对行业的了解(这个指标在行业中表现如何?),对用户的了解(用户真的会这么做吗?),和怀疑的精神(数据究竟是如何产生的?)。

另外有几个分享的地址:
http://webdataanalysis.net/
http://www.fqyy8.com/
http://www.webkaka.com/webCheck.aspx?url=

分享到:
评论

相关推荐

    《细说PHP》

    此外,《细说PHP》还可能包含对PHP中常用的设计模式的介绍,设计模式是解决软件设计中常见问题的解决方案。它们可以帮助开发者构建出结构合理、易于扩展和维护的系统。书中可能会讲解一些基础的设计模式,比如单例...

    细说PHP中的CMS

    新的《细说PHP中的CMS》——高洛峰 可以用来进行学习,对于初学PHP的很有好处

    高洛峰php细说php4

    由于上传文档大小受到限制只能分卷压缩。 《细说PHP》开发Web应用程序PHP是最理想的工具,易于使用、功能强大、成本低廉、高安全性、开发速度快且执行灵活。...系统地介绍了PHP的相关技术及其在实际Web开发中的应用。

    细说php源码

    3. **文件与目录操作**:在《细说PHP》的源码中,我们可能会看到如何读取、写入、创建、删除文件,以及如何操作目录(mkdir, rmdir, chdir等)的示例,这些都是PHP在Web开发中的常见应用。 4. **数据库交互**:PHP...

    兄弟连细说Linux PDF 文档

    兄弟连 细说Linux PDF文档。共12个按章节总结

    细说linux pdf

    细说linux pdf 兄弟连(lampbrother)李明linux课程pdf

    PHP课件 细说PHP345

    PHP课件 细说PHP

    《细说PHP》光盘源码

    学习《细说PHP》配套源码时,建议按照书中的章节顺序逐步进行,每读完一个知识点就尝试理解和运行相应的代码,遇到问题时可参考书中的解释或在线搜索解决方案。同时,不要忘记在实践中思考如何将这些代码应用于自己...

    细说PHP(精要版)part3

    《细说PHP(第2版)》自出版以来,销售一路在同类书籍中领先,已成为PHP学习者首选的工具书。为了可以让读者携带方便及更精准地掌握PHP的重点、要点,同时能使之作为大学计算机系PHP教材普及,特别推出《细说PHP精要...

    细说php

    细说php

    图表细说电子工程师识图速成手册.pdf

    本书《图表细说电子工程师识图速成手册》旨在帮助初涉电子设计领域的开发人员快速建立电子电路图的阅读与分析能力。手册内容全面,涵盖了电子电路图的基本读图方法,详细解读了诸如三极管、反馈电路、电源电路、振荡...

    《细说PHP》配套源码.rar

    《细说PHP》配套源码,很罕见的案例哟 /*==================================================================*/ /* 文件名:comm_pro.php */ /* 概要: 文章评论的处理页面. ...

    细说php精要版

    书中详细介绍了这些基本元素,并通过实例来演示它们的实际应用。 PHP与HTML的结合是其在Web开发中的重要特性。通过PHP的echo和print语句,我们可以动态生成HTML内容,实现交互式网页。此外,PHP还可以处理表单数据...

    细说PHP勘误表

    "细说PHP勘误表"是一个专门针对PHP编程中常见错误和修正方法的文档,它对于正在学习或从事PHP开发的人员来说是一个宝贵的资源。这份勘误表可能包含了自PHP新版本发布以来,用户和社区发现并整理的错误报告,旨在帮助...

    《细说php》光盘源码

    《细说PHP》是一本深度解析PHP编程语言的书籍,其光盘源码包含了书中所有实例和示例的完整代码,对于学习和深入理解PHP有着极高的价值。这份源码的特点在于注释详尽,可以帮助读者更好地理解每段代码的功能和实现...

    《细说php 精要版》.(高洛峰) (高清 完整版)

    《细说php(第2版)》自出版以来,销售一路在同类书籍中领先,已成为php学习者首选的工具书。为了可以让读者携带方便及更精准地掌握php的重点、要点,同时能使之作为大学计算机系php教材普及,特别推出《细说php精要版...

    细说PHP配套源码

    源码的学习是提升编程技能的关键步骤,通过分析和研究《细说PHP》中的源码,读者可以更好地掌握PHP的核心概念、函数库以及最佳实践。 首先,源码学习可以帮助我们理解PHP的语法结构。PHP支持多种数据类型,包括字符...

    细说PHP(第二版)

    细说PHP php 2012.10 第二版, 细说PHP php 2012.10 第二版,001

Global site tag (gtag.js) - Google Analytics