原文链接:http://www.alibuybuy.com/posts/24387.html
随着互联网的不断发展,信息更注重实时性,微博的风靡,搜索引擎相继推出实时搜索的功能,但是对于网站分析而言实时的数据是否更有意义呢?
其实看数据看报表的人往往希望数据越实时越好,他们希望掌握网站每个小时甚至每十分钟的变化情况,能够对网站的当前状况了如指掌,能够发现问题并快
速响应。但其实如果你问下他们在知道了网站数据的实时变化情况后,或者在某个时间段网站访问量突然剧增或者剧增,我们又能做些什么?我估计大多数人答不上
来。刚好前段时间在做网站的实时数据统计相关的工作,所以有些想法在这里分享一下。
实时统计的优缺点
先不说实时统计到底有用还是没用,先看看如果需要获得实时的统计数据需要做些什么,以及实时的数据能够给我们带来什么,也就是实时统计的Pros and Cons。
首先从技术的角度来看一下,很明显实时的数据统计需要更多的资源占用,因为网站分析的数据大部分是需要从点击流数据中计算得到的,并没有现成的结果
数据可以直线获取显示。从点击流中获得的数据需要进行计算和汇总,无疑这些操作需要更多的成本,特别对于大型网站的大数据量处理而言,同时实时数据增加了
实现的复杂度,并可能会在某种程度上增加数据的不准确性。
但是实时的数据统计可以展现在技术层面上处理数据的能力,同时可以提供更丰富的报表展示,甚至在报表上使用动态的趋势图表进行实时刷新,在显示效果上自然不用说,所以有时候很多技术人员也很乐意做这些工作。
再从数据应用和分析的角度来看一下,目前很多实时数据统计的结果用于展示网站实时流量的变化情况,哪个时间段的访问量最高,或者网站的整体活跃度最
高,同时可以分析每天各小时的流量或用户数分布,但这些分析的对于网站到底有多大的意义?即使知道网站在晚上8、9点的时候有最多的在线用户,我们又能做
些什么?网站的压力测试显然不需要通过这种方式来完成。
所以个人认为实时统计更多的是对网站实时状态的监控,对于分析而言,没有多大的实际意义,至于能对网站的优化和决策支持起到多少作用,至少我还没有想到。
记到Avinash Kaushik在书中提到过一句话:“Real-Time Data: It’s Not Really Relevant,
and It’s Expensive to Boot.”
其实我对这句话非常赞同。很多人都会觉得获取实时数据将更有利于做出实时的响应,细粒度的数据也为数据的分析提供了更加细节的基础数据,我们可以基于此做
更多的分析工作,但我们需要认清实时数据给我们带来的成本及其真正的价值到底能够体现多少。Avinash
Kaushik同时还列举了5中典型的获取实时数据所造成的消极影响,大致可以概括为以下几点:
-
不要一味追求数据的量,更应该注重数据的质,并通过有效的分析来体现数据的价值;
-
不符合10/90的原则,实时数据在获取上的成本显然无法和分析价值达成1:9的比例;
-
过多地关注实时数据会在分析工具的选择上造成拘束,无法使用真正优秀的网站分析工具;
-
技术上的系统资源占用、任务调度以及复杂的流程;
-
在某种程度上可能增加数据的不准确性。
当然实时数据也不是一点价值都没有,只是出于其成本的考虑,没有必要对每个分析指标进行实时统计,或者花费大量的精力去关注实时数据。
分享到:
相关推荐
Flash数据统计图形是早期常用的技术之一,它通过图形化的方式来展示数据,包括柱状图、饼状图和折线图等,使得数据分析更加易于理解和交流。 首先,柱状图是一种最常见的数据表示方式,它通过不同长度的柱子来展示...
实时数据仓库是指在实时处理大数据的同时,实时地将数据存储到仓库中,以满足实时报表、实时分析和实时决策的需求。实时数据仓库解决方案是指基于实时数据仓库的解决方案,旨在满足企业的实时数据处理需求。 实时...
数据大屏可视化是一种将复杂数据以直观、动态的方式呈现出来的方法,常用于物联网(IoT)平台的数据统计和分析。这种技术能够帮助决策者快速理解大量数据,发现潜在的模式和趋势,从而做出明智的业务决策。在"数据大屏...
Flash数据统计插件是一种基于Adobe Flash技术的可视化工具,它能够将XML文件中的数据转换为易于理解的图形展示。在互联网应用中,这种插件广泛用于数据报告、业务分析和用户交互界面,以帮助用户直观地理解复杂的...
《复杂数据统计方法-基于R的应用》是统计学专家吴喜之教授对中国人民大学统计学院学生及广大统计学爱好者的倾心之作。该书深入探讨了如何利用R语言这一强大的统计工具来处理复杂的数据问题,涵盖了数据分析和数据...
本项目名为“GitLab 用户周期性数据统计分析工具”,它利用 GitLab 提供的 API 来进行周期性的用户使用数据收集和分析,帮助管理员或开发团队更好地理解用户的活动模式,优化项目管理和开发流程。 GitLab API 是 ...
在数据分析和可视化领域,3D立体数据统计图是一种强大的工具,它能以更直观的方式展示复杂的数据关系。本文将深入探讨3D立体数据统计的概念、应用及其相关技术。 3D立体数据统计图与传统的2D图表相比,增加了第三个...
本文将详细讲解如何统计MySQL数据库的数据量大小,并涉及CONCAT函数的解读,以及对information_schema和performance_schema库的查询方法。 首先,我们需要理解数据量统计的基本概念。数据量通常指的是数据库中所有...
在这本书中,复杂数据统计方法指的可能是处理和分析大型数据集、非结构化数据、高维数据等复杂数据环境下的统计分析技术。随着大数据时代的来临,统计学家和数据分析师常常需要处理比传统数据更复杂的数据集,这...
4. 数据分析:运用统计和挖掘技术,如描述性统计(集中趋势、离中趋势、相关性分析)、回归分析、关联分析、因子分析和方差分析等,来探索数据内部关系和规律。 5. 数据展现:通过图表(如饼图、折线图、散点图等)...
本资源“C#数据统计图”聚焦于利用DevExpress控件库来创建各种数据可视化图表,包括折线图、柱状图、饼图和漏斗图。这些图表在数据分析和报告展示中极其常见,能够帮助用户直观地理解复杂的数据信息。 首先,让我们...
在本项目"基于Python实现对水文站点实时数据的爬虫与数据简单可视化.zip"中,我们探讨了如何使用Python编程语言来抓取水文站点的实时数据,并对其进行可视化展示。这一过程通常包括两个主要部分:数据爬取(web ...
《张文彤SPSS统计分析高级教程数据》是一份针对SPSS高级使用者的配套学习资料,旨在帮助读者深入理解和应用统计分析技术。该教程由知名专家张文彤编写,其内容丰富,涵盖了从基础到高级的各类统计分析方法,特别适合...
本文介绍了一种由网站运营商自身进行数据统计和分析的解决方案。 由网站运营公司技术部门以网站运营日志为最初数据源,基于公司高层业务需求,将数据经过层层数据清洗、转换和抽取,建立数据仓库,基于数据仓库进行数据...
数据挖掘的过程中,会涉及到多种技术的应用,其中概率论与数理统计的原理与方法是其中不可缺少的一环。概率论与数理统计在数据挖掘中的应用主要体现在以下几个方面: 1. 统计学与数据挖掘的关系:统计学是研究数据...
使用纯html绘制统计图,地图统计图,excel数据读取,前端页面, 朋友有个需求想要把excel数据转换成地图分布图,而且想要动态修改数据生成不同时间段的数据,于是我就想办法给他做了个工具
这个“ios-图表,数据统计.zip”压缩包显然包含了用于创建图表和统计数据的相关资源,主要关注的是折线图和条形图的实现。在iOS应用中,这些图表通常用于展示趋势、比较或分布数据,帮助用户更直观地理解信息。 1. ...