`

辨别虚假流量的十二种方法

 
阅读更多

 

辨别虚假流量的十二种方法

1、使用高级群组分割流量

在检查前先要将这部分广告流量与网站的其他流量进行分割,高级群组是最好的选择。因为我们之前对流量进行过来源标记,所以只需要创建一个来源等于bluewhale的高级群组就可以分割出这部分流量了。如图1所示。

图1过滤来自bluewhale.cc的流量

创建完成后,在报告中选择使用这个高级群组。这部分流量将会贯穿整个报告。这也是在检查流量前的准备工作。避免其他来源流量的干扰。

2、流量产生的时间

使用的Google Analytics报告:访问者—访问者趋势—访问次数。如图2所示。

图2访问量变化趋势图

这里的时间要精确到每小时的访问数据。通常,网站正常的访问流量会分布在一天中的各个时段,即使有访问高峰,在曲线图中也会是较为平滑的曲线(广告刚上线时除外)。而虚假流量是人为控制产生的流量。为节省成本不会在意流量的时间分布,所以会在时间曲线上发现流量突增的情况。所以,如果流量过于集中在某个时段,或者在某个时段有了不正常的增长。这部分流量就可疑了。

当然也不排除有的程序会计算好日期和时间端,并按时间曲线模拟点击。如果碰到这种“智能流量”的情况,就要继续使用第三种方法。

3、流量的地理来源

使用的Google Analytics报告:访问者—地图覆盖图,如图3所示。

图3访问量地理位置覆盖图

 

通常访问网站的访客会来自各个不同的地理位置(GoogleAnalytics通过访问者的IP来判断流量来源的地理位置信息)。所以在地图覆盖图报告中可以看到很多不同地区的流量来源。而虚假流量通常很难使用多个地区的不同IP来产生流量。所以通过地区覆盖图来看,如果流量来源都集中在一个地区,这部分流量就很可疑了。

这里可能你的广告只针对某个地区的访客,所以访客的地理位置范围对你不适用。或者是你又遇到了“更加智能”的流量,比如,人肉流量!可以通过代理或者是分布在不同地区的兼职人员模拟出来自多个地理位置的访问。那么请接着往下看。

4、流量的网络属性

使用的Google Analytics报告:访问者—服务提供商,如下图所示。

图4访问者网络接入报告

服务提供商报告显示的是网站访客所使用的网络接入方式,正常情况下网站访问者的接入方式应该是千差万别。而虚假流量的接入方式会很单一。所以如果这个报告里只显示了1-2种服务提供商名称,就说明你的流量很可疑了。但其实这里还是没有回答上面的问题,就是那部分超级智能的人肉流量。因为人肉流量的接入方式也会有很多种,在服务提供商报告里是无法识别出来的。那该如何辨别人肉流量呢?别急,这个问题很快就会有答案了。

5、流量的跳出率

使用的Google Analytics报告:访问者—访问者趋势—跳出率。

图5跳出率24小时趋势报告

跳出率是衡量页面质量的指标,反过来看,也是辨别虚假流量的好工具。如果发现在某个时段网站的跳出率突然增高,找到那个时段的流量与前面的访次时间段,地理位置信息和接入方式综合对比。如果符合前面的任何一个条件,这部分时段的流量都非常可疑。

6、流量的网站停留时间

使用的Google Analytics报告:访问者—访问者趋势—网站停留时间。

图6网址停留时间24小时趋势报告

网站停留时间其实并不是一个非常准确的指标,会受到cookie30分钟生存期的影响。但可以配合着前面的几个报告共同对可疑流量进行进一步验证。

7、进入路径&点击分布图

使用的Google Analytics报告:内容—热门内容—进入路径。

图7访问者导航摘要报告

通常我们都会为广告活动制定一个登录页面 landingpage,所以广告的入口页面只有一个。但访问者来到网站后会有不同的行为,他们会点击不同的链接,访问不同的页面,并且在不同的页面结束对网站的访问。这些都是人为操控很难完成的。虽然现在的某些“智能流量”也能完成2~3次的点击行为。但都是通过预先设定的。所以它们的访问路径和结束页面基本相同。

8、与目标报告相匹配

使用的Google Analytics报告:流量来源—目标。

 

图8流量目标转化率报告

这也是你在每次的广告活动前最应该做的。就是为流量设定目标。Google Analytics现在升级了目标功能。你可以为流量设定多个目标。通过多个维度来检查流量。目标的完成度是辨别虚假流量的最好方法。很多智能流量可以绕过跳出率,停留时间和访问时间分布等等指标,但很少有能够完成目标的。当然这也要依你设定目标的复杂程度来定。如果设定的CPA是完成购物,那么这对虚假流量来说就是一个杀手级的目标。如果目标只是注册用户或者是填写信息,人肉流量都是可以完成的。

9、单页面刷新分析

单页面刷新是指为了降低跳出率,流量在进入网站的Landingpage页面上刷新的行为。这类流量单从跳出率指标上来看表现很好,但却没有完成转化和购买。此时我们还很难判断这部分流量是否是流量。需要通过访问路径或点击热区图进行深度分析。然而在面对多个Landingpage的情况时即使是路径或热区图分析也都变成了一个非常大的工程。因为我们可能要逐一查看流量在上百个Landingpage中的访问情况。 对于这个问题现在我们有个很好的方法来解决,就是使用自定义指标Pageviews/Unique Pageviews。

图9使用综合浏览量和唯一身份浏览量对单页刷新进行检查

Pageviews表示页面浏览量,而UniquePageviews则表示每个页面获得的唯一页面浏览量,相当于每个页面获得的访问次数。在一次访问中,用户多次浏览一个页面只会造成Pageviews的增加,而UniquePageviews是不会增加的。因此,我们将不同的页面作为维度,使用Pageviews和UniquePageviews两个指标相除就可以看到一次访问中访问者浏览同一个页面的次数。通常来讲,访问者在一次访问中是不会多次浏览一个相同的页面的。所以,如果如果Pageviews/Unique Pageviews的值很高,那么这部分流量就值得注意了。当然,这并不是一个绝对的标准。为了确保万无一失,最好的方法是将这部分流量的Pageviews/Unique Pageviews值与这些页面在整站中的值进行对比。

 

10、访客忠诚度分析

访客忠诚度是对一段时间内访客回访频率进行的分析。通常来讲,当一定数量的访问者来到你的网站后,总会有一部分访问者会再次访问的。即使这部分访问者非常少。哪怕只有一两个。这就好像在一个页面中,即使有些链接放在非常隐蔽的位置,也总还是会有人点击的,即使比例非常的少。记得一个真实的教训,我们为客户分析一个wap网站时,发现页面中的一个链接点击量是0。当时想当然的认为这个链接因为提供在线电影,流量和费用都很高,所以没人点击也是正常的。但实际情况却和我们想象的完全不一样。

因此,在分析一个渠道的流量时,适当的拉大时间维度来分析访客回访也是辨别虚假流量的一种方法。真实的访客中会有再次回访的行为产生,而虚假流量在合作结束后是不会进行这些收尾工作的。所以那些在合作期结束后齐刷刷没有回访的流量多半是异常的。

11、访客重合度分析

访客重合度是指一段时间里排重后的访问者与排重前访问者的比率。举个例子来说明一下,假设我每天找10个人点击你的广告,连续点击10天。这时,Google Analytics中每天都会记录到有10个绝对唯一身份访问者。十天加在一起就是100个。但当我们把时间维度拉大到10天再来看时,就只有10个绝对唯一身份访问者。这是因为GoogleAnalytics对访客进行了排重处理,所以10天的数据中每个访问者都是唯一的。按照这个逻辑我们可以计算出不同渠道中访问者的重合度。具体计算公式是:1-排重访客/未排重访客*100%。对于上面例子中的情况,访客重合度等于1-10/100*100%=90%

图10唯一身份访问者报告

对于不同的流量渠道,我们也可以使用访客重合度指标来辨别虚假流量。当某个渠道的流量在短时间内有较高的访客重合度时,我们就需要进一步检查这个渠道的流量质量了。

12、页面访问长尾分析

页面访问长尾分析是指访问者的页面浏览广泛程度。按照真实流量的特征,每个访问者的特点,兴趣和习惯都是唯一的。他们会按照各自的目标通过各种方法浏览网站内容。访问者的这些自然和多样的特点可以通过网站中的热门内容和退出页面看出来。如下图所示,这些都是虚假流量无法模拟的。

图11访问者页面访问分布报告

热门内容是在整个访问过程中最受欢迎的页面。上图是网站中热门内容的浏览量趋势图。因为每个访问者的目的都不相同,所以除了最受欢迎的页面之外,还会有很多页面也会被浏览,并且大部分页面获得的浏览量都很少,只有1-2次。这些就是页面访问的长尾,他们充分的表现了真实访客浏览网站的自然性和多样性。同样,对于退出页面也必然会存在这样的长尾,因为访问者会在不同的页面结束访问。

辨别虚假流量的几种方法介绍完了,好像还是没有能完全辨别出虚假流量的方法。是的,虚假流量在不断的模仿真实的流量。并且人肉流量又是那么廉价。让我们防不胜防。单靠Google Analytics报告可以辨别出一部分虚假流量,更多的虚假流量要通过时间的检验才能够现形。比如在广告活动期过后,这部分流量的回访率,滞留率,等等。

 

 

作者简介

王彦平(蓝鲸),网站分析爱好者,蓝鲸的网站分析笔记博客作者,从事网站分析工作多年,擅长使用GoogleAnalytics。希望探寻网站分析的真谛,以数据驱动决策。

 

吴盛峰(Joegh),网站数据分析博客作者,从事互联网的数据分析工作,曾经涉足过WEB网站的数据分析和移动互联网应用的数据分析,对数据仓库和BI(商业智能)方面也有一定的了解。擅长网站数据的定量分析,主要包括网站的内容质量、网站的用户行为、网站的用户体验优化等,希望将网站数据分析的结论应用于实践,并通过数据分析为网站创造价值。

 

 

 

 

 

 

 

 

本文节选自《网站分析实战——如何以数据驱动决策,提升网站价值》

王彦平 吴盛峰 编著

 

电子工业出版社出版

 

 

分享到:
评论

相关推荐

    谈外部报表使用者对现金流量表的数据挖掘.doc

    报表使用者必须辨别这些虚假数据,例如期末贷款集中、虚构交易、数据填列错误等,以确保分析的准确性。 三、修正现金流量表 为了消除报表粉饰的影响,外部报表使用者可以采取以下步骤修正现金流量表: 1. 检查...

    浅谈新媒体环境下虚假新闻的衍生和传播.docx

    此外,传统媒体和相关机构也需要承担起责任,加强对虚假新闻的研究,提升受众的辨别能力,完善新闻采编人员的培训,共同维护新媒体环境的清朗。只有这样,才能使新媒体发挥其应有的积极作用,而不是成为虚假信息的...

    虚假会计报表识别授课提纲.pptx

    为了辨别虚假,可以采取多种策略,如获取更多会计资料、行业数据、中介服务机构信息,并进行实地考察。 在分析资产负债表时,关注比率分析,如流动比率、速动比率、负债率和股东权益比率,以及非正常项目的变化,如...

    电商主播虚假宣传应承担的责任与治理之道.pdf

    通过各种渠道加强对消费者的宣传教育,提升消费者对虚假宣传的辨别能力,引导理性消费。 5. 增强行业自律。电商平台和主播协会应积极推动行业自律,建立行业标准,倡导诚信经营。 电商直播作为互联网经济的新生力量...

    左手流量 右手电商:“快手们”迎来直播新赛点.zip

    标题“左手流量 右手电商:“快手们”迎来直播新赛点”暗示了本文将探讨社交媒体平台,特别是以快手为代表的短视频应用,如何在流量经济与电商领域之间找到新的增长点。这种现象反映了互联网行业的一个重要趋势:...

    行业分类-物理装置-一种识别无效广告用户的方法及系统.zip

    在描述中,“一种识别无效广告用户的方法及系统”进一步明确了主题,这意味着存在一种技术手段用于辨别那些对广告无实际响应或者恶意刷量的用户,以避免广告费用的浪费。这种方法可能包括数据分析、行为模式识别和...

    判断真实在线人数

    判断真实在线人数与流量的方法解析 在线人数与网站流量是衡量一个网站活跃度与受欢迎程度的重要指标。然而,网络世界中不乏虚假数据的存在,这使得判断一个网站的真实在线人数与流量变得复杂。本文将深入探讨如何...

    DDoS防护思路演进

    此外,URPF策略(Unicast Reverse Path Forwarding)也被广泛应用于防御中,通过限制虚假源IP地址的访问,减少攻击流量的产生。 随着攻击手段的不断变化,如脉冲式攻击等新型攻击模式的出现,人工防御手段越来越...

    企业财务报表分析与经营决策.pptx

    此外,课程中提到了财务报表分析的技巧,如辨别虚假财务报表的整体思路,以及如何利用报表分析经济景气、股市行情。同时,课程还通过案例教学,如最高现金流与最低信贷率的故事,说明现金与非现金资产的结合对企业...

    企業財務報表分析.pptx

    比率分析是一种常用的企业财务状况诊断工具,包括流动比率、速动比率、负债率、利润率、现金流量比率等,这些比率可以帮助分析人员了解企业的偿债能力、盈利能力、运营效率和成长潜力。 在企业重组、资本重组、债务...

    电商直播带货对消费行为的影响

    现代人生活节奏加快,工作压力增大,很多人通过网络分享个人经验、生活妙招来吸引粉丝,形成流量基础。具备一定粉丝量的主播,便可通过直播带货的方式,实现商品的快速销售。随着网络直播平台的兴起和电商行业的迅速...

    网络机器人探测技术在开放获取机构知识库用户使用数据统计中的应用.pdf

    因此,结合网络机器人探测技术和人工排查手段,可以有效地过滤掉机器人产生的虚假流量,提高统计的准确性。特别地,学术搜索引擎如Google Scholar、Bing Academic等是网络机器人探测的重点监控对象,因为它们频繁...

    河北省枣强中学2020学年高一语文下学期第一次月考试题.doc

    对于这一现象,互联网公司应积极采取措施打击数据造假,如成立广告反欺诈大数据实验室,共享后台数据以提高透明度,建立统一的数据衡量和采集标准,提高公众辨别虚假数据的能力。同时,政府也需要加强监管,制定相应...

    个体农村电商发展策略.pdf

    通过故事化的营销,如“小羊的一天”、“真假土鸡蛋辨别方法”等主题,农户可以突出产品的特点,吸引目标消费者的关注。 除此之外,利用网络平台的浏览器推广,比如在贴吧、问答等处进行免费宣传,也是个体农户在...

    宁夏银川市银川唐徕回民等三校2018届高三语文下学期第三次模拟考试试题含解析.doc

    4. 数据反欺诈措施:为应对数据造假,一些互联网公司联合成立广告反欺诈大数据实验室,通过技术手段发现和甄别虚假流量,以维护数据的真实性。 5. 数据共享与监管:企业应积极共享后台数据,政府、公众和第三方监测...

    运营商大数据需求分析报告.pdf

    4. 渠道管理:数据分析有助于运营商识别渠道商的欺诈行为,通过分析用户行为模式,辨别虚假用户,确保渠道管理的公平与安全。 报告列举了一些成熟的应用案例,如流量经营分析系统、手机阅读BI系统、无线音乐BI系统...

    福建省泉州第十六中学2020学年高一语文下学期期中试题.doc

    其中,"标题党"就成为了一种能够快速提高网站流量和关注度的手段。在一些情况下,媒体为了追求点击率,不惜夸大或歪曲新闻事实,制作出与新闻内容不相符的标题,诱导读者点击。由于标题是网络信息的第一印象,具有...

    会计实务:真亏假亏?纳税评估辨虚实.pdf

    1. 纳税评估的常用方法:包括财务比率分析、趋势分析、现金流量分析等。通过对这些关键数据的分析,税务人员可以对企业的经营状况有个基本的了解,并且能够发现一些异常现象,比如与同行业平均水平相比异常高或异常...

    公众生产信息时代的新闻真实性分析.pdf

    真正的新闻媒体应当坚守真实性的原则,不因经济利益或流量牺牲新闻的可信度。提高公众和媒体从业人员的辨别能力,利用新媒体工具挖掘真相,至关重要。 总结来说,公众参与新闻生产虽赋予新闻业活力,但也对新闻真实...

    ChatGPT技术在新闻媒体中的应用案例.docx

    面对网络上层出不穷的虚假信息,ChatGPT可以通过分析和比对,帮助新闻媒体快速辨别信息真伪,提高新闻报道的准确性和可信度,维护新闻环境的公正性。 再者,ChatGPT技术还能够实现个性化新闻推荐。通过对用户兴趣的...

Global site tag (gtag.js) - Google Analytics