最新文章列表

数据仓库建模指南视频教程|数据仓库视频教程

数据仓库建模指南视频教程|数据仓库视频教程 网盘地址:https://pan.baidu.com/s/1JD3cjPek4oHCVHPhhVOvXw 提取码:qqxy 备用地址(腾讯微云):https://share.weiyun.com/5xZjFzb 密码:5vbb37 课程上学到什么,能给我带来什么?在这里,你可以: 1、学习建立高质量的数据库模型和技巧,以及丰富的例子 2、学习从企业视 ...
天台没有爱情 评论(0) 有804人浏览 2018-12-04 09:55

阿里云MaxCompute被Forrester评为全球云端数据仓库领导者

摘要: 参考消息网3月19日报道 日前,全球权威调研机构佛瑞斯特研究公司(Forrester)发布《2018年一季度云端数据仓库》报告。报告对大数据服务商的主要功能、区域表现、细分市场和典型客户等进行了全面评估,最终AWS、阿里云、谷歌、微软四大巨头杀入全球一线阵营。   参考消息网3月19日报道 日前,全球权威调研机构佛瑞斯特研究公司(Forrester)发布《2018年一季度云端数据仓 ...
猫耳呀 评论(0) 有557人浏览 2018-04-10 11:41

数据仓库建设:维度处理

1.代理关键字 代理关键字一般是指维度表中使用顺序(序列)分配的整数值作为主键,也称为“代理建” 代理关键字用于维度表和事实表的连接。在 ...
student_lp 评论(0) 有1551人浏览 2017-06-15 19:17

hive文件类型与压缩

1.概述     数据仓库在建设使用的过程中,主要消耗的资源包含:CPU、MEMORY、DISK三部分。 数据仓库在计算过程中主要消耗CPU和Memory资源,当然也会 ...
student_lp 评论(0) 有2705人浏览 2017-05-23 23:16

hive小文件合并

    hive仓库表数据最终是存储在HDFS上,由于Hadoop的特性,对大文件的处理非常高效。而且大文件可以减少文件元数据信息,减轻NameNode的存储压力。但是在数据仓库中,越是上层的表汇总程度就越高,数据量也就越小,而且这些表通常会有日期分区,随着时间的推移,HDFS的文件数目就会逐步增加。 一、小文件带来的问题 HDFS的文件包好数据块和元信息,其中元信息包括位置、大小、分块等 ...
student_lp 评论(0) 有2968人浏览 2017-05-21 22:15

企业大数据平台下数仓建设思路

介然(李金波),阿里云高级技术专家,现任阿里云大数据数仓解决方案总架构师。8年以上互联网数据仓库经历,对系统架构、数据架构拥有丰富的实 ...
iyulang 评论(0) 有13人浏览 2017-04-24 10:53

变而不变:我看分布式系统发展和阿里实践

大数据计算服务(MaxCompute)是一种快速、完全托管的PB/EB级数据仓库解决方案。具备万台服务器扩展能力和跨地域容灾能力,是阿里巴巴内部核心大数据平台,支撑每日百万级作业规模。 MaxCompute向用户提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决用户海量数据计算问题,有效降低企业成本,并保障数据安全。 相对而言,Reshuffle数据需要落盘,因为Resuff ...
iyulang 评论(0) 有9人浏览 2017-04-05 23:06

数据仓库设计基本思想

数据仓库设计基本思想  一 联机事务处理系统        联机事务处理系统(On-line Transaction Processing) OLTP系统:也称为生产系统,它是事件驱动、面向需 ...
aishu 评论(0) 有902人浏览 2017-03-13 22:54

大数据时代 | 企业搭建BI(商业智能)系统遇到的难题及解决方法总结

企业遇到的问题 第一、数据的处理 数据的处理,是商业智能最为重要的组成部分之一,基础数据的有效性对于商业智能所能够进行分析的结果,有着 ...
勿忘初心321 评论(0) 有1人浏览 2016-05-18 14:10

数据仓库建设--OLAP和数据立方体概念

一、OALP概述    数据立方体,他是一种用于OLAP以及OLAP操作(如上卷、下钻、切片和切块)的多维数据模型。数据立方体存储多为聚集信息。每个单元存 ...
student_lp 评论(0) 有12986人浏览 2016-03-14 16:06

星型模型和雪花型模型比较

一.概述         在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型。在设计逻辑型数据的模型的时候,就应考虑数据是按照星型模型还是雪花型模型进行组织。         当所有维表都直接连接到“ 事实表”上时,整个图解就像星星一样,故将该模型称为星型模型,如图1。         星型架构是一种非正规化的结构,多维数据集的每一个维度都直 ...
bijian1013 评论(0) 有1165人浏览 2015-12-20 21:32

大数据数据仓库-场景

大数据仓库-场景  2015-10-24 朱洁 hadoop技术学习 传统OLTP/OLAP之分 数据仓库里面有OLTP/OLAP之分,OLTP是传统关系型数据库的主要应用,其主要面向基本的、日常的事务处理,例如银行交易。OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。  
jiezhu2007 评论(0) 有2719人浏览 2015-10-24 20:08

大数据数据仓库-概念

大数据数据仓库—概念  2015-10-18 朱洁 hadoop技术学习       大数据经过反复炒作之后,慢慢的降温下来。大家不再大谈几个v了,落
jiezhu2007 评论(0) 有2074人浏览 2015-10-18 14:44

数据仓库建设—维度建模

      维度建模是DW/BI系统的核心,他是ETL系统的目标、数据库的结构、支持用户查询和制作报表的模型。建模要实现3个主要设计目标,分别是:能尽可能简洁的向用户展示需要的信息;能尽快返回查询结果给用户;能提供相关信息,以便精确的跟踪潜在的业务过程。       维度建模能使任何事情尽可能简单,但绝不是简化。在数据仓库和商业智能中,维度模型是给用户显示信息的首选结构,其比典型的原系统规范化 ...
student_lp 评论(0) 有6872人浏览 2015-07-29 17:36

也谈数据仓库的存储

数据仓库一般侧重于OLAP型操作,区别于OLTP的"于乱军中取敌上将首级"的低延迟要求,OLAP更要求大数据的处理速度.因为OLTP侧重于对单个数据的处理,比如快速找到某条订单,而OLAP侧重于整体数据的把握,比如订单销量的地区分布. Infobright是mysql的数据仓库解决方案,而hive是基于Hadoop的数据仓库平台,要探索数据仓库的时候,发现两者在存储上有很多共同 ...
kabike 评论(0) 有675人浏览 2014-10-22 19:10

【转载】数据仓库科普文章

数据仓库技术中的MPP 数据仓库世界里面的massively parallel processing 大概定义: MPP 是将任务并行的分散到多个服务器和节点上,在每个节点上计算完成后 ...
james_lover 评论(0) 有608人浏览 2014-07-22 13:56

使用java连接hive,并执行hive语句详解

安装hadoop 和 hive我就不多说了,网上太多文章 自己看去 首先,在机器上打开hiveservice   不多说,直接上代码 package asia.wildfire.hive.service; import java.sql.*; import java.sql.Date; import java.text.SimpleDateFormat; import jav ...
501311837 评论(0) 有1647人浏览 2014-07-20 22:24

数据仓库 四

    数据仓库粒度 数据量和存储空间允许,则用细粒度;当不允许,则可以选择双粒度,访问频繁的做细粒度 访问不频繁的作二次加工,用粗粒度       数据仓库和技术   1.1管理大量数据 1.2管理多介质:主存,扩展内存,DASD,光盘,胶片 1.3索引,监视数据:建立二级索引,稀疏索引,动态索引,临时索引 1.4多接口(支持联机,脱机,随即取,顺序取) 1.5可控制 ...
blackproof 评论(0) 有842人浏览 2014-06-12 22:32

最近博客热门TAG

Java(141747) C(73651) C++(68608) SQL(64571) C#(59609) XML(59133) HTML(59043) JavaScript(54918) .net(54785) Web(54513) 工作(54116) Linux(50906) Oracle(49876) 应用服务器(43288) Spring(40812) 编程(39454) Windows(39381) JSP(37542) MySQL(37268) 数据结构(36423)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics