- 浏览: 5878 次
- 性别:
- 来自: 北京
最新评论
<div class="iteye-blog-content-contain" style="font-size: 14px"><p>作者:谭虎、陈晓勇 [ 更多内容详见数据中台官网 https://dp.alibaba.com ]<br />一直想写一篇关于数据中台正面文章,现在有闲时做些总结,想充分诠释一下DT内部人如何看待数据中台。<br />数据中台的概念是最早由阿里巴巴首次提出,是为了应对内部众多业务部门千变万化的数据需求和高速时效性的要求而成长起来的,它既要满足业务部门日常性的多个业务前台的数据需求,又要满足像双十一,六一八这样的业务高峰、应对大规模数据的线性可扩展问题、应对复杂活动场景业务系统的解耦问题,而在技术、组织架构等方面采取的一些变革。<br />数据中台的定义<br />阿里巴巴数据中台是阿里云上实现数据智能的最佳实践,它是由数据中台方法论+组织+工具所组成,数据中台方法论采用实现企业数据的全局规划设计,通过前期的设计形成统一的数据标准、计算口径,统一保障数据质量,面向数据分析场景构建数据模型,让通用计算和数据能沉淀并能复用,提升计算效能;数据中台的建设实施必须有能与之配合的组织,不仅仅相应岗位的人员要配备齐全,而且组织架构建设也需要对应,有一个数据技术部门统筹企业的数字化转型,数据赋能业务中形成业务模式,在推进数字化转型中实现价值;数据中台由一系列的工具和产品组成,阿里云数据中台以智能数据构建与管理Dataphin产品、商业智能QuickBI工具和企业参谋产品为主体等一系列工具组成。<br /><br /><br />阿里云在过去几年中经过数十个实际项目沉淀形成实施标准化流程和方法论。阿里云OneData数据中台解决方案基于大数据存储和计算平台为载体,以OneModel统一数据构建及管理方法论为主干,OneID核心商业要素资产化为核心,实现全域链接、标签萃取、立体画像,以数据资产管理为皮,数据应用服务为枝叶的松耦性整体解决方案。其数据服务理念根植于心,强调业务模式,在推进数字化转型中实现价值。<br />数据中台的概念来自于阿里巴巴“大中台,小前台”业务战略下的数据化实践,它是关于“数据价值化和数据资产化”的一整套解决方案,内容包括数据中台方法论,组织,数据产品三个方面。<br />数据中台建设成果主要体现在两方面:一个是数据的技术能力,另一个是数据的资产。今天阿里的各个业务都在共享同一套数据技术和资产。阿里内部为这个统一化的数据体系命名为“OneData”。Onedata体系包括OneModel,OneID,OneService3个方面,在OneData体系之下,不断扩大的业务版图内的各种业务数据,都将按统一的方式接入中台系统,之后通过统一化的数据服务反哺业务。<br />如下图所示:<br /><br /><br />数据中台顶层设计<br />数据中台定位于计算后台和业务前台之间,其关键职能与核心价值是大数据以业务视角而非纯技术视角出发,智能化构建数据、管理数据资产与提供数据调用、数据监控、数据分析与数据展现等多种服务。承技术启业务,是建设智能数据和催生数据智能的引擎;而以数据中台内核价值为中段的数据中台业务模式不是纯数据、不是纯技术、也不是纯业务,它同时关注着与大数据能力相关的上下游,以大数据为中轴线,基于技术而又深入业务,它以数据产品+数据技术+方法论+场景实现的综合性输出,同时为智能化数据、技术极致提升和数据智能化业务负责。<br />一方面专注于从业务视角,建设标准统一、融会贯通、资产化、服务化、闭环自优化的数据中台智能数据体系,同时极致化追求技术上的降本提效。另一方面,致力于智能数据与业务场景深度融合的业务数据化与数据业务化中的各类智能化价值创新。<br />数据中台与传统数据仓库差异<br />数据仓库已经经历了40多年的发展,广泛应用于大型商业企业,帮助业务人员和高层人员做分析和决策,它起源于决策支持系统(decision support system),其展现形式更多以报表方式实现。因此数据仓库是一个面向主题的、集成的、非易失性的,随时间变化的用来支持管理人员决策的数据集合。<br />传统的企业级数仓还是以TD,Oracle,IBM/DB2等传统数据库为主, 由于受限于数据的处理能力,很少有EDW的数据容量超过1TB,因此不能对基础数据进行跨域的处理(原因是RMDBS对大数据量的关联join处理耗时非常长),因此要对新的指标分析的时候需要从基础数据重新生成汇总表,耗时耗力,使用方法上无法实现跨数据集或数据域的处理。新一代的数据仓库采用分布式架构,一般基于MPP数据库或大数据平台实现数据分析,因此传统的数据仓库具有以下几个特点:<br /><br /><br /><br /><br /><br /><br /></p>
<ol>
<ol>
<ol>
<ol>
<ol>
<p> </p></div>
<ol>
- 业务主题性:传统的数仓要求解决服务问题,比如对一个生产型企业来说公司的主题域是产品、订单、销售商、材料等,要解决应用问题可能是库存、销售、销售商等。其有业务是面向主题的。</ol>
<p><br />
<ol>
- 系统集成性:在传统数据仓库中,集成是最重要的,由于计算和存储的成本原因,其数据需要从不同的数据源抽取过来并集中,其数据的冗余度需要尽可能的降低,因此数据进入数据仓库中需要进行转化、格式化、重新排列和汇总等操作,其所有数据具有单一物理特性,都是结构化方式存在。在系统架构方面,也是以集中式存储和计算方式存在,新一代的数仓采用分布式计算,但软件产品采用集中部署方式存在。</ol>
<p><br />
<ol>
- 非易失性:数仓系统会记录所有记录,与业务系统相比,它不会对记录进行变化操作(update和delete),它会保留所有记录的变化,但受限于成本和计算能力考虑,数仓不会记录全量明细数据,特别是日志数据,因此大部分数仓平台的数据容量在TB级别。</ol>
<p><br />
<ol>
- 时间变化性:数据仓库中每个数据单元只是在某一时间是准确的,因此数据单元的准确性与时间相关,数据仓库中的数据时间范围5-10年。</ol>
<p><br />
<ol>
- 系统一体化: 传统数仓以系统整体设计为特性,软件平台围绕着数据库或计算平台以整套服务为主,结合度缜密,对外服务也较单一。</ol>
<p><br />
<p> </p></div>
发表评论
-
据说这是双11前互联网人的一天~
2019-11-08 17:23 352双11前,据说互联网人 ... -
终极清单!阿里云双11爆款来了
2019-11-06 17:55 5阿里云双11领亿元补贴,拼手气抽iPhone 11 Pro、 ... -
2019阿里云双11域名分会场攻略
2019-11-06 16:09 2阿里云双11领亿元补贴,拼手气抽iPhone 11 Pro、 ... -
2019阿里云双11基础云产品分会场攻略
2019-11-06 15:35 3阿里云双11领亿元补贴,拼手气抽iPhone 11 Pro ... -
数据中台构建产品Dataphin到底能支持哪些数据源?
2019-10-29 10:29 380作者:王腾 [ 更多内容 ... -
息息相关的两大体系:数据中台与业务系统
2019-10-28 16:57 1作者:品鉴 [ 更多内容详见数据中台官网 https://d ... -
《DNS稳定保障系列1--服务双保障“辅助DNS”产品介绍》
2019-10-28 15:24 376背景 2016 年 10 月 21 日 ... -
2019阿里云双11拼团全攻略
2019-10-25 10:47 22019阿里云双11拼团活动于10月24日正式上线啦!这次的 ... -
开放应用模型(OAM):全球首个云原生应用标准定义与架构模型
2019-10-23 14:24 310Kubernetes 项目作为容器编排领域的事实标准, 成功 ... -
云栖干货回顾 | 更强大的实时数仓构建能力!分析型数据库PostgreSQL 6.0新特性解读
2019-10-23 10:54 344阿里云 AnalyticDB for PostgreSQL ... -
云栖深度干货 | 打造“云边一体化”,时序时空数据库TSDB技术原理深度解密
2019-10-21 18:30 430本文选自云栖大会下 ... -
高危预警|RDP漏洞或引发大规模蠕虫爆发,用户可用阿里云免费检测服务自检,建议尽快修复
2019-10-18 15:19 3292019年9月6日,阿里云应急响应中心监测到Metasplo ... -
高危预警| SQL数据库成主要攻击对象,或引发新一轮大规模勒索
2019-10-18 12:02 335近日,阿里云安全团队发现,目前互联网上的服务器,SQL数据库 ... -
从零开始入门 K8s | 应用存储和持久化数据卷:存储快照与拓扑调度
2019-10-16 14:38 370作者 | 至天 阿里巴巴 ... -
从零开始入门 K8s | 应用存储和持久化数据卷:核心知识
2019-10-16 10:14 347作者 | 至天 阿里巴巴高级研发工程师 一、Volumes ... -
超大规模商用 K8s 场景下,阿里巴巴如何动态解决容器资源的按需分配问题?
2019-10-15 16:37 335作者 | 张晓宇(衷源) 阿里云容器平台技术专家 关注『 ... -
Flink on YARN(下):常见问题与排查思路
2019-10-14 15:14 371作者:杨弢(搏远) Flink 支持 Standalone ... -
阿里云在云栖大会发布SaaS加速器3.0版最新成果,让天下没有难做的SaaS
2019-10-12 14:37 4192019年杭州·云栖大会顺利落幕,超过6万人次观展,200 ... -
阿里云重磅发布全域集成解决方案,帮助提升5倍全域集成效率
2019-10-11 18:02 4279月26日,在云栖大会SaaS加速器专场上,阿里云重 ... -
阿里云应用上边缘云解决方案助力互联网All in Cloud
2019-10-11 10:08 257九月末的杭州因为一场云栖大会变得格外火热。 9 ...
相关推荐
### 大数据中台架构详解 #### 一、引言 随着大数据技术的快速发展与广泛应用,数据中台的概念越来越受到关注。数据中台不仅能够帮助企业更好地管理与利用数据资源,还能提升数据分析的能力与效率,从而为企业决策...
全面详解数据仓库、数据湖、数据中台。全面详解数据仓库、数据湖、数据中台。全面详解数据仓库、数据湖、数据中台。全面详解数据仓库、数据湖、数据中台。全面详解数据仓库、数据湖、数据中台。全面详解数据仓库、...
阿里巴巴云上数据中台顶层设计与实施指导 企业级 SaaS 业务中台化探索与实践 数据中台-阿里云新零售解决方案 数据中台的十问十答 数据中台详解 数据中台行业解决方案及案例 数据中台助力银行数字化转型 四问数据中台...
总的来说,《实战大数据 MATLAB数据挖掘详解与实践》是一本全面介绍如何使用MATLAB进行大数据分析的实用指南,适合数据分析师、工程师和科研人员阅读,通过学习,读者可以掌握利用MATLAB进行高效、深入的数据挖掘和...
推荐,数据中台学习和实践方案资料合集,共28份。 2021 AI中台白皮书 2021中国通信中台行业实践白皮书 ...数据中台详解 - 文章分享 搜索推荐Serverless架构和业务中台技术实践 蘑菇街中台转变之路
阿里云RDS数据库恢复到本地自建数据库中步骤详解 阿里云RDS数据库恢复到本地自建数据库是许多开发者和数据库管理员经常遇到的问题。由于阿里云RDS数据库的特殊性,恢复到本地自建数据库中变得非常复杂。因此,本...
掘金大数据:电信数据金矿详解、挖掘及应用.docx
阿里云中台规划解决方案
综上所述,构建一个全面而高效的大数据平台,不仅需要考虑数据中台、数据中枢、数据湖等关键组件的设计与实现,还需要确保数据的安全性、合规性以及数据价值的最大化利用。通过上述方案的实施,可以有效应对当前企业...
大数据架构详解 从数据获取到深度...《大数据架构详解:从数据获取到深度学习》这本书对大数据和深度学习做了全面深入的讲解,帮助读者获得关于大数据和深度学习的整体认知,并能够理解两大领域在实际场景中的应用。
大数据(Bigdata)是21世纪信息技术领域的一个关键术语,它涵盖了从数据收集、存储、分析到价值提取的全过程。大数据的特点通常被概括为“5V”:Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值...
标题《阿里云PaaS平台详解(65页)》揭示了文档的核心内容,即对阿里云PaaS(平台即服务)平台的全面解析。在互联网和云计算产业领域,PaaS是一种将软件开发平台作为一种服务提供的模式,它允许客户直接在云上开发、...
### 大数据基础知识与十大核心原理详解 #### 一、数据核心原理 在大数据时代,传统的计算模式发生了根本性的变革,从以往的“流程”核心转变为以“数据”为核心。这种转变体现在诸多方面,比如Hadoop这样的分布式...
阿里架构总监的中台架构详解 根据阿里架构总监的分享,我们可以总结出以下几个重要的知识点: 1. 业务中台架构: 业务中台架构是阿里集团业务战略的重要组成部分,它提供了业务能力标准、运行机制、业务分析方法论...
### 大数据与云数据管理知识点详解 #### 一、大数据概述 - **起源与定义** - 大数据的概念最早出现于2008年9月,由《科学》杂志上的一篇文章“Big Data: Science in the Petabyte Era”提出。 - 大数据没有统一...
阿里云Java API是针对开发者提供的一系列接口,用于与阿里云的各项服务进行交互。通过这些API,开发者可以轻松地在Java应用程序中集成阿里云的功能,例如对象存储、云计算、数据库服务等。本篇将深入探讨阿里云Java ...
《Python金融大数据挖掘与分析全流程详解案例源码》是一份深度探索金融领域数据挖掘与分析的资源包,其中包含了从数据获取、清洗、预处理、分析到可视化的完整流程。这个压缩包旨在帮助学习者通过Python语言掌握金融...
总的来说,数据智能知识地图提供了从数据收集、处理到智能应用的全面视角,是构建高效、智能的数据中台架构的蓝图。随着技术的不断进步,这些知识将不断演进,为企业提供更强大的决策支持和风险管理能力。