本篇文章 结合 BI 分析 了 大数据 的使用价值 以及 云计算 ,大数据 ,nosql 的 他们在实际 业务场景的 价值和功能。
大数据与云计算的关系是什么,Hadoop又如何参与其中,Nosql在什么位置,与BI又有什么关系?以下这篇文字讲他们的关系讲的非常清楚。
在谈大数据的时候,首先谈到的就是大数据的4V特性,即类型复杂,海量,快速和价值。IBM原来谈大数据的时候谈3V,没有价值这个V。而实际我们来看4V更加恰当,价值才是大数据问题解决的最终目标,其它3V都是为价值目标服务。在有了4V的概念后,就很容易简化的来理解大数据的核心,即大数据的总体架构包括三层,数据存储,数据处理和数据分析。类型复杂和海量由数据存储层解决,快速和时效性要求由数据处理层解决,价值由数据分析层解决。
数据先要通过存储层存储下来,然后根据数据需求和目标来建立相应的数据模型和数据分析指标体系对数据进行分析产生价值。而中间的时效性又通过中间数据处理层提供的强大的并行计算和分布式计算能力来完成。三层相互配合,让大数据最终产生价值。
数据存储层
数据有很多分法,有结构化,半结构化,非结构化;也有元数据,主数据,业务数据;还可以分为GIS,视频,文件,语音,业务交易类各种数据。传统的结构化数据库已经无法满足数据多样性的存储要求,因此在RDBMS基础上增加了两种类型,一种是hdfs可以直接应用于非结构化文件存储,一种是nosql类数据库,可以应用于结构化和半结构化数据存储。
从存储层的搭建来说,关系型数据库,NoSQL数据库和hdfs分布式文件系统三种存储方式都需要。业务应用根据实际的情况选择不同的存储模式,但是为了业务的存储和读取方便性,我们可以对存储层进一步的封装,形成一个统一的共享存储服务层,简化这种操作。从用户来讲并不关心底层存储细节,只关心数据的存储和读取的方便性,通过共享数据存储层可以实现在存储上的应用和存储基础设置的彻底解耦。
数据处理层
数据处理层核心解决问题在于数据存储出现分布式后带来的数据处理上的复杂度,海量存储后带来了数据处理上的时效性要求,这些都是数据处理层要解决的问题。
在传统的云相关技术架构上,可以将hive,pig和hadoop-mapreduce框架相关的技术内容全部划入到数据处理层的能力。原来我思考的是将hive划入到数据分析层能力不合适,因为hive重点还是在真正处理下的复杂查询的拆分,查询结果的重新聚合,而mapreduce本身又实现真正的分布式处理能力。
mapreduce只是实现了一个分布式计算的框架和逻辑,而真正的分析需求的拆分,分析结果的汇总和合并还是需要hive层的能力整合。最终的目的很简单,即支持分布式架构下的时效性要求。
数据分析层
最后回到分析层,分析层重点是真正挖掘大数据的价值所在,而价值的挖掘核心又在于数据分析和挖掘。那么数据分析层核心仍然在于传统的BI分析的内容。包括数据的维度分析,数据的切片,数据的上钻和下钻,cube等。
数据分析我只关注两个内容,一个就是传统数据仓库下的数据建模,在该数据模型下需要支持上面各种分析方法和分析策略;其次是根据业务目标和业务需求建立的KPI指标体系,对应指标体系的分析模型和分析方法。解决这两个问题基本解决数据分析的问题。
传统的BI分析通过大量的ETL数据抽取和集中化,形成一个完整的数据仓库,而基于大数据的BI分析,可能并没有一个集中化的数据仓库,或者将数据仓库本身也是分布式的了,BI分析的基本方法和思路并没有变化,但是落地到执行的数据存储和数据处理方法却发生了大变化。
谈了这么多,核心还是想说明大数据两大核心为云技术和BI,离开云技术大数据没有根基和落地可能,离开BI和价值,大数据又变化为舍本逐末,丢弃关键目标。简单总结就是大数据目标驱动是BI,大数据实施落地式云技术。
相关推荐
随着云计算、物联网、社交媒体等新兴技术的发展,人类社会产生的数据量呈现出爆炸性的增长,这使得大数据管理成为应对数据洪流的关键手段。 大数据管理的概念主要涵盖以下几个方面: 1. 数据多样性(Variety):...
大数据与云计算:云计算 3 种服务模式:IaaS(基础设施即服务)、PaaS(平台即服务)、SaaS(软件即服务)。 大数据核心:利用数据的价值,机器学习是利用数据价值的关键技术,对于大数据而言,机器学习是不可或缺...
这份名为"大数据云计算技术 云计算与数据挖掘 云计算与数据分析(共114页).rar"的压缩包文件,包含了关于这两个核心领域的深入探讨,旨在帮助读者理解它们的基本概念、工作原理以及实际应用。 首先,大数据是指在...
大数据的应用:包括商业智能、科学研究、医疗保健、金融服务等。 大数据采集与预处理 大数据采集:包括数据的获取、数据的存储、数据的处理等。 数据预处理概述:包括数据清洗、数据集成、数据变换、数据规约...
【云计算在数据分析与商业智能分析中的应用研究】 随着信息技术的发展,云计算已经成为推动企业创新和提升运营效率的关键技术。尤其在数据分析和商业智能分析领域,云计算提供了强大的计算能力、灵活的资源扩展性和...
云计算和大数据的区别 云计算和大数据是两个相关但不同的概念。云计算是指硬件资源的虚拟化,以便更好地分配和使用计算资源,而大数据是指海量数据的高效处理和分析。以下是对云计算和大数据的详细解释: 云计算:...
云计算和大数据作为信息技术的两大支柱,它们之间存在着密切的关系。云计算提供了处理和存储大数据所需的基础设施和技术支持,而大数据则为云计算提供了丰富的应用场景和价值体现。两者相辅相成,共同推动了信息技术...
《大数据导论》的复习资料涵盖了大数据领域的多个核心知识点,包括大数据的基本概念、特征、数据类型、技术、应用,以及大数据的采集、预处理、存储、计算平台、分析与挖掘、可视化、特定领域的应用,如社交大数据、...
大数据和云计算是现代信息技术领域的两个重要概念,它们虽然有密切关联但各自有着独特的特性与作用。简单来说,云计算可以理解为硬件资源的虚拟化,它提供了弹性的计算能力和服务,让用户能够按需获取和释放计算资源...
7. 未来发展趋势,如边缘计算、人工智能与大数据的融合,以及5G对云计算和大数据的影响。 通过这个PPT,观众可以了解云计算和大数据的基本概念,理解它们如何相互作用,并且看到这些技术在现实世界中的应用。此外,...
大数据云计算平台解决方案是现代信息技术领域中的重要组成部分,它结合了大数据处理技术和云计算的优势,为企业提供了高效、灵活且可扩展的数据管理与分析能力。这个技术方案旨在解决海量数据的存储、处理、分析以及...
13. **云计算与大数据**:AWS、Azure、Google Cloud等云平台提供了托管大数据服务,简化了大数据部署和管理。 通过深入学习这些知识点,初学者可以建立起对大数据的全面理解,并逐步掌握实际操作技能,从而在大数据...
标题中的“大数据云计算互联网材料编写ppt模板 (1).zip”表明这是一个关于大数据、云计算和互联网主题的PPT演示文稿模板集合。这个压缩包可能是为了帮助人们制作与这些技术相关的专业报告或演讲而设计的。 在描述中...
3. **大数据技术栈**:包括数据采集(如Web日志、社交媒体等)、数据存储(如Hadoop HDFS、NoSQL数据库)、数据处理(如MapReduce、Spark)、数据分析(如Hive、Pig)和数据可视化(如Tableau、Power BI)等环节。...
二、大数据与云计算的关系 大数据和云计算是相互补充的。云计算为大数据提供了基础设施即服务(IaaS)、平台即服务(PaaS)和软件即服务(SaaS),使得数据的存储、处理和分析更加便捷和经济。而大数据则推动了...
3. **数据存储与管理**:学习如何在分布式环境中存储和管理数据,如HDFS的工作原理,以及关系型数据库与非关系型数据库的区别和应用场景。 4. **大数据处理工具**:掌握Pig、Hive和Impala等数据处理工具,用于数据...
5. 持续学习:关注最新技术动态,如云计算、人工智能等与大数据的结合。 大数据是一个不断发展和演进的领域,入门者应保持对新技术的热情,持续学习和实践,以便更好地应对未来的挑战和机遇。通过上述的知识点介绍...
大数据在信息管理系统中的应用研究,这是一个深度探讨现代信息技术与企业管理结合的重要主题。随着信息技术的快速发展,尤其是大数据技术的兴起,企业对于数据的处理、分析和利用能力已经成为了竞争优势的关键因素。...
大数据深度挖掘技术与大数据应用是现代信息技术领域的重要研究方向,其涵盖了海量数据的收集、存储、处理、分析以及价值提取等多个层面。随着互联网、物联网、社交媒体等技术的飞速发展,我们每天都在产生和积累着...