`

大数据下的BI新特点

阅读更多

大数据BI的新需求包含多量化(多个大数据集并行解析)、多样化(布局化、半布局化、非布局化)、快速化(Velocity)和价值(易用性)。而策画分层(流策画、块策画、全局策画)、快速解析(冗余维度、数据常驻在内存中解析)和接近价值(营业人员易用的号令、灵活的编程框架)是解决新需求的BI规划。

以下为文字实录(2011大数据技巧大会)

今天,首要介绍的是Twitter方才开源的一个策画框架,连络在一路实现一个快速灵活的架构。先介绍一下我们Admaster的BI营业,我们对BI的定义是什么呢?统计,发明,猜测。Admaster数据首要来自于门户、客户端、硬广。门户比如搜狐,新浪,客户端,比如QQ迅雷。我们数据量很是大,根蒂根基上几个TB,还有采集,我们有本身的汇集在线问卷,同时还有微博论坛,所以我们数据其实是有布局化,有非布局化的。

    Admaster体系不实用于我们,左边这两个图可以看到,这些机柜很是昂贵,我们处于本钱推敲不会应用这些器材。右上角HPCC Systems,是一个更好的体系,为什么不应用?因为生态体系很是封闭,没有办法把接口和我们本身的法度连络起来。其次,他开源出来的社区版比企业版机能差很多。所以,我们不会应用如许的机械。

    我们看一下传统分子办法,很多互联网公司都是如许分子数据。原始日记采集Scribe到Hadoop,然后到Hive布局理念,在做OLAP解析,比如多维数据查询。Hadoop是比来几年才出来的,然则整套BI解析流程,其实还是《数据仓库》这本书里面的关系模型,没有超出这个框架的。

    互联网数据最常见的一个解析例子是用户行动解析,我们采集用户接见信息,用户看到什么告白,点击了什么告白,购买了什么,去了哪里。还有一些非布局化的信息,半布局化的信息,比如他揭晓的什么评论,微博上写的什么器材,还有图象,音频,视频,一些非布局化的数据。可见我们数据特点是有以下几个大到必须分布式存储,因为我们根蒂根基上都跨越TB天天,并且有一个趋势络续在增长。本年可能是TB天天,来岁可能就是2TB,4TB,事实上我们本年数据比客岁翻了5倍,我们须要一个很是腻滑的分布式架构,只须要加机械就可以,不须要改我的解析算法。

    还有海量数据集很是多,有很多海量级数据集进行解析。因为我们采集全部都是日式数据,所以数据量很是少。还有我们要把布局化,半布局化的数据归并起来进行解析。因为我们数据集拥有这些特点,所以特点决意了存储和解析的体式格式。起首只有append,没有更新和删除,这种体式格式和刚才OceanBase是类似的,从字面上懂得,起首要成果一个读的操纵,然后再去进行一个写的办法,起首更新和删除开销必然比读和写要大。

    其次,若是我们不做更新和删除,本质上是规避了一致性。我们只有更新数据相当于带着时候和全新的数据,其实就不成能产生一致性的题目,什么终极一致性,因果一致性等等完全就规避掉了。其实今天上午大师讲的这些,大师也可以看出来一致性是很是头疼的题目。然则我们BI解析应用,完全规避了一致性题目。

    其次我们要尽可能的反观新模式,反关系模式里面有一个雪花模型和星型模型,希罕大的数据量景象下,我们要尽可能把纬度表冗余到事实表里面,尽量不做交易,希罕一些小交易要放到事实表里面。还有一个特点,我们对策画框架灵活性的请求越来越好,并且很多算法更好懂得,表达力更强。然则,就像今天上午巨师长教师讲的一样,MapReduce发挥解析力还是受限,希罕我们要一些发财算法的景象下有很大的题目。比如我在MapReduce应用一个共享数据群,起首编程很是错杂,其次大小是受限的,我不克不及灵活应用一个共享数据集。我们如今其实垂垂转到DRPC,本质就是一个分布式的长途调用,凡是在单机上能实现的分机算法必然可以哄骗DRPC实现,我们可以哄骗其实现各类百般的灵活解析算法。

    这是BI对我们提出的新需求,起首多个很是大的数据集放在一路解析,然后我们要把布局化,半布局化,非布局化的数据放在一路解析,这就决意了不成能用基于关系型,布局化型的数据集,把布局化,半布局化,非布局化混淆在一路进行解析,还有要快,Hadoop本质是一个离线解析,起首启动很是慢,从硬盘读取数据,我们须要一个很是快,甚至达到秒级,让用户无缝表现的一个平台,其次我们还须要营业人员尽可能简单的应用它。

    为懂得决刚才的这些需求,如今有以下一些BI规划。起首是策画分层,我们把数据解析的算法遵守策画体式格式,分成三层,流策画层,块策画,全局策画,一会我会一个层一个层介绍。快速解析有两种规划,一种是冗余纬度,其实应当叫做冗余纬度的索引,一会会具体介绍,还有一个规划把数据进行解析常驻在,应用内存解析体系。还有应用很是灵活的框架,很是灵活的数据发掘算法。

    这是我们应用的一个完全数据架构,从采集数据进入流策画层,从流策画层进入快数据和全策画层,每个齿轮其实代表着数百台办事器,全部架构是一个分布式的。流数据,会把触发的事务写入关系型数据库中,会把连气儿策画的成果写到里面,快数据层会把大的数据进行解析成果写到里面,同时全局数据,一般是把离线成果也写进里面,对于成果和关系数据库做一个对比,经由过程缓存层供给给用户。流数据框架,块数据框架,全局数据框架我们应用一种解析说话,本质上相当于编程一次可以在三个处所同时应用,如许的话无论是对开辟人员,还是对营业人员来说都很是简单。

    起首讲一下策画分层,比如我们可以简单的把数据分成实验层和P处理惩罚层,实验层把数据常驻在内存傍边可以达到很是快的秒级解析,每次查询,我们同时去实验层和P处理惩罚层查询,然后把两个成果归并起来,如许才干获得我们终极成果。因为分层本质其实一般来说,都是按时候来分的,比如数据量很是大,天天有一个TB进来,我们只能把今天TB数据放在里面,把今天之前的数据全部进行离线解析。今天数据我可以做到一个及时解析,我在调用,比如昨天三更跑出来的成果,把那个成果加起来,就可以获得一个很是快,相当于进一步实验解析的成果。

    我们看一下Twitter的例子,是可以做到及时解析的。怎么做?Hadoop批量解析成果可能三更做,写到他本身开辟的一个KV体系里面,批量导入的数据很是快,侧重于快速的写,把这个成果加起来反馈给客户。

    我们介绍一下Twitter开源的流策画框架,用处有以下几种。起首他可以做一个最快的ETL对象,ETL搞BI的都斗劲清楚,一个是抽取,转换,转入,大师可以简单懂得数据格局转换,就把数据格局变成我们所须要的。然后他还可以哄骗冗余纬度数据,把小的纬度数据尽可能冗余到事实表里面,Storm是很是合适做这个工作。还有事务驱动报警,什么是事务驱动报警呢?举个例子,比如我们监测门户上方告白网站,我们监测一条一个告白产生了一个点击,然则他之前10分钟我们并没有发明有暴光,  这是不合常理的,一个告白怎么可能被点击了却没有被人看到了,这可能是一个****事务,我们就须要记录到数据库里面。

    还有一个例子,我们在5分钟之内发明同一个IP下面发明1千次点击,很明显这是一个机械把握的****法度,也记录到数据库里面,申明只是一个****事务。还有Storm可以实现一种策画,叫做连气儿策画,请重视连气儿策画是一种受限算法,可以或许连气儿策画的策画是“易并行”的,什么意思呢?比如典范的“易并行”题目,就是求coint,我可以分到10台办事器上,每一台办事器专门求一个行数,反馈给我加起来,这个成果必然正确。同时,我上5分钟得出乞降成果,和下5分钟乞降成果加起来依然是正确的。

    不实用的题目是什么呢?比如数据去重统计,count,distinct,只能对全局数据去重。流策画,可以或许策画的题目都是一些很是简单的“易并行题目,其实在很多场合也斗劲有效,比如记数。Storm,吞吐机能很是好,因为底层应用了ZeroMQ,ZeroMQ机能很是好,比传统要好的很多,达到了每秒将近2多万消息吞吐量,还是在一台PC上方,要跨越百万很清楚,本质上就是内存拷贝,没有任何的持久化。显而易见他是有安然性的题目,若是办事器掉链,正在处理惩罚的消息就完全消散了,那怎么办呢?

    我们用Storm可以确保每行消息都被正确处理惩罚,失败消息打归去从头处理惩罚。我们可以看右边这个图,比如一条消息是一句话,做什么工作,对每个单词进行记录,比如他把这句话六个单词分还进行处理惩罚,最后一个失败怎么了办?每个任务都邑发送一个ACK给Storm,Storm收到5个ACK,他就认为这个消息处理惩罚全部失败,所以全部打回从头处理惩罚。经由过程如许的体式格式来确保全部Stosm不会失效,失足。

    同时还有最后一道防地,用P处理惩罚层来校订,全部Storm垮台了,Twitter也产生类似工作,Storm失效之后,当然他是有人工错误引起的,并不是Storm本身的题目,就可以从,比如过了12小时之后,可以把从这傍边把数据导出到Storm里面。Storm处理惩罚数据格局是基于元组tuple,类似MapReduce数据处理惩罚序列,本质是DRPC编程框架,最灵活的进行编程。然则,我们须要本身把握内存,Storm不是所有工作都做到了。

    一句话性肉元组在很多机械内存中进行M和R络续变更着本身的布局,最后变成我们想要的元组情势。可以看一个例子,最左边正方题里面是所有交易数据,A代表A商品,客户可能卖了三个型号,又一个客户买了B35商品,我们遵守客户购买列出来,把哪种商品最热卖的型号列出来,其实可以看最右边的成果,我们欲望生成如许的成果,客户购买一次商品是B和C,是B的35和A的23,客户购买商品是A,终极卖的是5,我们中心怎么做呢?我们只须要履行三个任务,比如第一个任务调剂数据格局,其实相当于把原数据发送到三台办事器上,把后面省略号去掉。然后我们在把数据相当于遵守商品A,B,C做一个覆盖,发送两台办事器上,大师可以看到最上方相当于遵守A分类汇总,得出A成果,同时我们统计一下A的次序,生成A括号5,逗号2。同时再按频次来做,最后获得我们想要的成果,全部流程很是简单。

    大师还可以重视到一点,任务1,任务2,任务3,并不是分的很清楚,他只是把本身叫做精简的任务处理惩罚,他只是在这些任务之间到底要不做grrouping,任务1和任务2,任务2和任务3之间是遵守某个字段进行一个对比。我们可以看出Storm流策画就是一个Bolt接龙,数据相当于有一个喷射器,从最左边一行行发射出来,之后经由过程全部相当于任务A进行分布式处理惩罚,每个圆圈代表一个办事器,最后得出我们想要的成果。同时,他在任务处理惩罚的过程中还可以随便马虎进行交互,我们BoltA,B,C,D,E,构成一个相当于类似Hadoop概念,会一向常驻在内存傍边,不管什么时辰产生数据,我一向常驻在内存中,来如许数据就进行如许的处理惩罚逻辑。所以,他是一个连气儿性的流策画框架。

    来几许数据我处理惩罚几许,我可以变成来一条处理惩罚一条,我也可以来5千条处理惩罚5千条得出一个成果。所以,他是一个不绝在运行的流式策画框架。我们可以看一下代码的例子,很是简单。我们可以先建一Storm,然后我们在Storm加一个数据喷射口,络续喷出单词,我们做第一个任务,随机接管数据喷射口传出来数据,我们可以做一个格局转化,我还可以指定命据用几台办事器来处理惩罚,比如逗号3是第一个,我们用3台办事器处理惩罚。最后一行,可能是用fieldsGruping,相当于做一个操纵,很是简单。

    然则,这个例子其实会错误运行的,数据源源络续发射,最后会源源络续会导致超出办事器内存,办事器内存会爆掉。实际上我们须要每割一段时候就去清理Bolt里面的内存,把里面内存开释掉,须要我本身手工把握内存,这是一个难点。我们讲一下快策画,为什么须要快策画,显然是实验之后更有价值。比如下面这个图可以发明,在早上6点钟的时辰,新西兰某个汽车品牌发明销量上涨,我们就立即捕获这个趋势,就做出一些决定计划。实际上洞察的决定计划,动态决定计划很是有价值,希罕是如今,举个例子我们互联网告白行业,在美国不克不及说所有告白,相当一项目组告白份额已经将近三分之一了,是从及时告白计价平台上购买的,包含雅虎,微软也有,相当于一条在线告白及时公布出去,我们各个采购商去竞价,若是我这个采购商,或者说告白****代理商可以或许在秒级发明一个数据,可以或许在秒级发明价格有如许的上涨,或者某个地区,某个告白可以实现很是好的CTS,我可以立即抢拍下这个告白收入增长,这时这在国外是很是活火的动态决定计划,尽可能快的进行发掘发明趋势。

    我们若是实现快速的块策画,在块上做呢?淘宝有一个很好的prom规划,甚至可以做到毫秒级响应,当然有一些毛病,只能固定解析几个纬度,同时导入数据花时候,相当于把所有冗余索引就义内存孔,如今淘宝在很多产品里面应用prom规划,他可以把前一天所有付出宝交易数据,遵守不合的纬度导入不合Server里面。大师可以看里面这个图,Data Server相当于上午型和小我用处,笔记本电脑索引,有商务型索引写在Server里面,小我用电脑写在另一个Server里面。

    然后Data Server2都写在里面,Data Server品牌写在里面,基于D品牌笔记本成交总量,我们把13寸所有都拿过来,获得5和6两条索引,我们再去某台实际Data Server上获得的交易金额,加起来返回给客户,经由过程如许一种索引达到很是快速的查询。所以,哪怕是几切切数据,上亿数据,我们依然可以做到在秒级之内返回。大师可以看到这一页,每个索引都要增长一台办事器,若是纬度固定还好,若是有上千台纬度是不是须要筹办上千个办事器,必然就没有办法用这个规划了。我们如今在用一个Storm+内存文件体系,在内存文件体系上调用Storm有一个模块,相当于LinearDRPCT opologyBuilder,包含消息处理惩罚,失败处理惩罚都分装好了。

    长处是什么算法很是灵活,我可以实现各类百般的数据解析算法,并且足够的快。一般来说,只要数据,比如只有几个G根蒂根基上都是秒级可以算出来,比如我几百台办事器,每台64G内存,我可以实现几个TB数据存储,全局全部内存之中。当然毛病也很是明显,大师也都可以看的出来,数据很是轻易失掉,若是掉链了全部数据都没有,我须要从硬盘上再倒出来,很是花时候。同时,我可以或许解析热数据大小,其实完全受限,我不克不及只分派给内存体系,其实不绝在办事器终端大幅度移动,和Hadoop有本质不合,Hadoop设计思惟是转移策画到数据这边,绝对不是让数据在不合办事器之间移动,那是绝对不可的,因为Hadoop这么快,设计思惟就是把策画移到数据这边。

    我在内存之间移动数据这个开销还是可以接管的,因为硬盘拷贝还是足够快的。其实我们如今最院士K-means聚类的算法是如许的,比如这么一个闪点图,我要找到斗劲密集的几个图,比如随机指导三个点,对每一个点进行一个聚类策画,我认为我是这个中间点里面的人,如许每个点都可以归纳到一个里面,从头求一个中间点,如许从头策画中间点,实际越来越近,补贴的迭代,这个地位会越来越向中间点移动。

    若是我用K-means从头策画,都邑把这些数据搭到硬盘上方来移动很是慢,若是我们有Storm的话,很简单,数据永远在这之中,这个算法会比K-means上快几百倍,很是正常。我们回顾一下贱策画,块策画,全局策画。Storm同时承担了ETL,流策画,块策画工作,流策画就是一些易并行简单算法,还可以报警,产闹事务组合报警,还有反观模式,同时还可以对内存文件体系上的数据进行一个快速策画快速迭代。Hadoop很明显做的和Storm不太一样,是便宜全局大数据策画。我刚才讲的很多算法必须在全局数据上策画,比如一个最简单的驱动数据,若是可以或许忍耐误差可以这么算,有必然错误质量算法,若是你要获得一个很是正确的认同,必须在Hadoop长进交运转。所以,这两者之间完全不成能调换,Hadoop绝对做不到Storm那么快。Storm项目组算法也实现不了,只能在Hadoop中做一个全局题目,须要其进行补充,所以两者之间很是好。

    如今我们全部斗劲框架,就是Storm和Hadoop,两者互相共同,互相补充,可以或许及时策画尽量放到Storm上去做,Hadoop是必须的一个便宜全局大策画增长。因为我们全部BI架构是拼在一路的,相当于如今有两套体系,我们开辟了DSL,这是针对营业定制说话。起首Hadoop Cascalog太错杂,起首要有一些可以简单的逻辑代码,看一看右下角这是Hadoop只有五行代码就实现了,很是简单。所以说,作为DSL可以在Admaster上看一下,甚至MapReduce都发明有四种DSL,我们本身还开辟针对营业DSL,对营业人员不须要知道营业是在Hadoop上方还是storm上方,也无需知道数据是布局化还是半布局化。

    左下角是我们开辟的SUM,类似于微软MDS,实现一个解析功能,我列出13寸,14寸,15村,日期在2011-11-20之前,写出A品牌,我把这个交易额数据进行一个分类汇总得出成果。实际实现逻辑是很是简单的,有一个号令解析器获得纬度和怀抱及,数据解析,信息传递到Hadoop的map的reduce和storm的bolt中,筛选数据拼接维度。工作流拼接,按照功能拼接,Hadoop job和storm topology,归并查询,组合storm和Hadoop的查询成果。最后这些成果写入到里面,类似于刚才Twitter的一种做法,同时去查询storm和Hadoop解析成果,获得终极一个汇总。

    我们再回顾一下完全的BI解析架构,这个图和刚才略有差别。这是采集数据进来之掉队到storm,数据报警写在Hadoop里面,把采集到数据storm变形,一项目组写入Hadoop之中,一项目组写入内存分件体系,我们本身开辟一套BSL,同时在HadoopDSL上跑获得解析成果。当然一般来说,offline跑昨天的数据,及时解析成果显示在Mongodb里面,有一些连气儿策画也写进Mongodb而里面,一个查询须要三个处所加起来,获得一个正确切时的成果。我可以获得,比如一秒前的统计成果,比如一个告白上线之后,就可以知道这个告白在1秒之前被暴光几许次,我从Hadoop,我从内存文件体系,我从Storm等成果加起来就可以知道一秒之前产生的任何工作。

    最后成果将被写到MongoDB,然后用户可以进行查询获得成果。用MongoDB的原因,我们须要对三个层次最后的解析成果,我们须要在做一些解析,MongoDB的解析还是很强的,有时辰我们须要在对统计之后的成果进行再统计,这是MongoDB的想象。同时,我们也有很是好的MongoDB专家,所以我们可以包管可以或许吃透MongoDB。



Admaster数据发掘总监谢超

分享到:
评论

相关推荐

    Yonghong业界大数据BI发展分享

    Yonghong Technology Co., Ltd.(永洪科技)在2014年提供了关于大数据BI发展分享的内容,其中涉及到的关键知识点可以详细解读如下: 1. 大数据背景 大数据概念强调的四个关键特性通常被概括为4V:数据量大(Volume...

    大数据BI平台建设方案.ppt

    大数据BI平台建设方案的核心特点包括: 1. 端到端的大数据分析平台:ETHINK V8.0提供了一个端到端的大数据分析平台,涵盖数据集成、数据清洗、数据预处理、数据分析、数据挖掘、数据可视化、数据报告等功能。 2. ...

    2022年大数据BI平台建设方案完整版.pptx

    大数据BI平台建设方案具有以下特点: 1. 端到端的一站式大数据分析基础平台,支持数据集成、数据清洗、数据预处理、数据分析、数据挖掘、数据可视化等功能。 2. 支持多种数据源的集成,包括结构化数据和非结构化...

    智能分析时代大数据BI助力中国智造.pptx

    大数据BI通过高效处理和分析海量数据,为企业提供了前所未有的洞察力,从而驱动技术创新和未来的变革。以下是对这一主题的详细阐述: 首先,大数据时代的特点在于万物互联,从互联网的低带宽连接到高速的光纤网络,...

    什么是BI大数据

    大数据通常用四个V来描述其核心特点:Volume(大量)、Velocity(高速)、Variety(多样)和Value(价值)。 Volume(大量)强调的是大数据的规模。随着互联网、社交媒体、物联网等技术的发展,每天生成的数据量呈...

    Axure交互设计大数据BI可视化大屏原型模板动态组控件数据统计图

    原型模板+动态控件+统计图表 大数据驾驶舱模板、大尺寸...产品特点:钢笔绘制,简单易改,复制就用 1.大数据高清科技感背景感图库 2.大数据透明背景图片组件 3.省级行政区地图库 4.大数据后台框架 5.大数据图片组件

    BI与大数据区别.docx

    BI(Business Intelligence)和大数据(Big Data)是两个在信息技术领域中经常被提及的概念,它们在数据处理和分析方面有着显著的区别。 首先,BI是一种综合性的解决方案,专注于整合和解析组织内部的现有数据,...

    基于“大数据+云平台”的高校全面预算管理信息系统构建.pdf

    在“大数据+云平台”的模式下,高校全面预算管理系统的主要特点包括: 1. 优化全面预算管理流程:通过强化数据采集与分析能力,提高了预算编制、执行、控制和绩效评价的效率和质量。预算编制周期大幅缩短,信息传输...

    bi大数据大屏设计图PSD/JPG-01

    在IT行业中,大数据大屏设计图是用于呈现复杂数据集的一种可视化工具,尤其在商业智能(BI)领域中,它们发挥着至关重要的作用。"bi大数据大屏设计图PSD/JPG-01"可能是一个设计资源包,包含了用于创建BI大屏的Photo...

    大数据下软件工程技术的应用.zip

    1. **大数据定义与特点**:大数据是指海量、高增长速度、多样化的信息资源,具有“4V”特性——Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。在这样的背景下,传统的软件工程方法论和工具...

    首届大数据应用论坛-云计算与大数据

    - 大数据BI架构能够实现更快速的数据处理和分析,支持实时决策。 #### 十、云计算与大数据的关系 - 云计算为大数据提供了必要的计算资源和技术支持。 - 大数据则通过挖掘和分析海量数据,帮助云计算更好地服务于...

    国内优秀BI厂商

    YonghongZ-Suite BI套件在处理大数据方面表现出色,是其在国内市场中的一个显著优势,尤其在当前大数据时代的背景下,该技术优势可能会促进永洪科技成为国内BI领域的领军者。 YonghongZ-Suite BI套件的特点可以总结...

    大数据培训视频百度网盘下载地址

    1. **大数据定义与特点**:了解大数据的四V特性——Volume(大量)、Velocity(快速)、Variety(多样)和Value(价值),以及如何在这些特性下处理和分析数据。 2. **大数据架构**:包括Hadoop生态系统,如HDFS...

    100套BI大屏大数据可视化看板原型设计方案

    8. **动态更新**:实时数据更新是BI大屏的一大特点,系统能够自动抓取最新数据并实时刷新,确保决策者看到的是最新的业务状态。 9. **响应式设计**:考虑到不同的显示设备和屏幕尺寸,BI大屏设计应具备响应式特性,...

    大数据-时代的产物(MD).pptx

    大数据的核心特点包括四个“V”:体积(Volume)、多样性(Variety)、价值密度(Value)和速度(Velocity)。 首先,大数据的“体积”指的是数据的海量性。数据的规模已经超过了传统的数据处理能力,以PB...

    大数据平台具体的特点是包含不限于几个层面的设计方案,包含中间件,消息,文件处理工具 最有效的应该还有一些人工智能的应用,实现算法

    8. **商务智能(BI)分析**:通过与Tableau、Power BI等BI工具的集成,大数据平台可以将复杂的数据转化为易于理解的可视化报告,辅助企业决策。 9. **横向扩展能力**:平台需要具备横向扩展能力,随着数据量的增长...

    基于电商平台大数据的铝材产品价格指数研究——评《Power BI电商数据分析实战》.pdf

    基于电商平台大数据的铝材产品价格指数研究,实际上涉及到了大数据时代下利用先进工具对特定行业价格波动进行分析的方法论。这一研究不仅需要对电商平台上铝材产品的供需关系有深入的了解,同时还需要掌握如何运用大...

    谈学习大数据感想.docx

    3. 大数据技术的发展:大数据技术还处于战国时期,将来几年,随着企业间的兼并和新产品的不断推出,BI厂商们将能推出完善的,让CEO感到中意的“大数据套件”。 4. 大数据与传统BI的区别:大数据分析与传统BI之間...

Global site tag (gtag.js) - Google Analytics