本月博客排行
-
第1名
龙儿筝 -
第2名
johnsmith9th -
第3名
wy_19921005 - zysnba
- sgqt
- lemonhandsome
年度博客排行
-
第1名
宏天软件 -
第2名
青否云后端云 -
第3名
龙儿筝 - gashero
- wallimn
- vipbooks
- benladeng5225
- wy_19921005
- fantaxy025025
- qepwqnp
- e_e
- 解宜然
- zysnba
- ssydxa219
- sam123456gz
- javashop
- arpenker
- tanling8334
- kaizi1992
- xpenxpen
- gaojingsong
- wiseboyloves
- xiangjie88
- ranbuijj
- ganxueyun
- sichunli_030
- xyuma
- wangchen.ily
- jh108020
- lemonhandsome
- zxq_2017
- jbosscn
- Xeden
- luxurioust
- lzyfn123
- zhanjia
- johnsmith9th
- forestqqqq
- ajinn
- nychen2000
- wjianwei666
- hanbaohong
- daizj
- 喧嚣求静
- silverend
- mwhgJava
- kingwell.leng
- lchb139128
- lich0079
- kristy_yy
最新文章列表
数据仓库 三
数据仓库数据导入:
格式化
获取传统数据库更新数据 1.时间戳 2.增量文件 3.日志文件 4.嵌入代码 5.前后映像
时基变化 数据必须附有时间元素
----------------------------------
数据模型 information system architecture
有三个层次:1.高层建模(ERD实体关系层)
...
数据仓库 二
数据仓库是一个面向主题的、集成的、非易失的且随时间变化的数据集合,用来支持管理人员的决策
------------------------------------------------
数据仓库与传统数据库区别
数据生命为5-10年,反之60-90天
数据为每天的复制快照,不能更新,反之包含当前值,可更新
数据总是包含某时间元素,反之可包含也可不包含 ...
数据仓库 一
操作型 - 原子/数据仓库 - 数据集市 - 个体
操作型数据 集成到 原子数据仓库中
数据集市 是业务上的统计
个体 体现
----------------------------------------------
CLDS 是DDS系统,数据驱动开发,由数据开始做集成,再进行数据检验和分析
SDLC 是传统的需求驱动开发
------------- ...
cognos,powercenter,DW数据仓库在线课程视频教程电子书
获取地址:
http://item.taobao.com/item.htm?spm=a1z10.1.w4004-5782321598.8.IW9nc0&id=21542495884
数据仓库不是数据库哦,它是面向主题的、集成的、历史的、有变化趋势的。数据仓库最重要的是建模技术与性能,学习本教程,你会知道更多更专业的内容,有兴趣就联系店主吧。目前大数据流行了,大数据需要有数据仓库 ...
天道酬勤,上善若水—八字真言让您立于“不败之地”
大家好,非常感谢大家能够点击链接进入到本文章,写下这篇文章的目的,一是希望能够给一些新手提供一些职业发展的思路;二是希望得到前辈们的指点;三是希望通过这篇文章来和大家进行交流。 文中说的不实或不对的地方请拍砖,一定虚心接受!想结交朋友的,欢迎联系本人! 首先自我介绍一下,真名:梁勇,80后,混迹上海五年,从事商业智能方面的技术工作,并且擅长MS SQL SERVER 的性能 ...
数据仓库之拉链算法(转)
数据仓库之拉链算法(转)链:古代软兵器的中介之物,故名思意.有着连接、衔接的意思.拉链算法是目前数据仓库领域比较XX的算法之一..通用非常广.记录数据量很大且为全量实体记录历史的操作。
例如,某某移动通信公司客户资料,以河北为例,河北有客户2800W,客户资料每个一条就是2800W条记录算上历史客户,全量大概有5000W条左右。作为数据仓库来存储这些信息几千万条记录不算什么。可是要是记录历史全 ...
数据仓库的源数据类型
数据仓库中集成了企业几乎所有的可以获取到的数据以用于数据分析和决策支持。这些进入到数据仓库中的数据无外乎三种类型:结构化数据、半结构化数据和非结构化数据,它们经过转化后以某种形式统一地储存在数据仓库中,即通常说的ETL(Extract, Transform, Load,抽取、转换、装载)的过程。下面主要说一下这三种数据类型的区别,它们分别包括哪些源数据以及这些数据在网站数据分析中的作用。
...
(原创)mysql数据仓库infobright的使用说明
infobright的查询速度是相当快的,有些稍复杂的查询在mysql里需要2分钟的,它只需要2秒。
基于windows版本(infobright-4.0.7-0-win_64-ice)
1、安装后,在cmd或运行中执行services.msc,可以找到infobright这个服务
2、infobright的端口默认是5029,启动服务后像使用mysql一样的用。(即可以通过cmd工 ...
Infobright优化实践
Infobright优化实践
统计系统后台用到了Infobright ICE社区版,记录10亿规模,出于灵活和省力的目的。日志入库过程并未作复杂处理,而是一条记录对应一条日志,所有的统计分析都是实时查询。最近日益感觉查询速度不足,于是做了一些研究和优化,成功将速度提升10倍以上,现将优化实践做个记录。
老少皆知的方法
1. comment 'lookup':对于选 ...
[转]Bloom Filter概念和原理
Bloom Filter概念和原理
Bloom Filter是一种空间效率很高的随机数据结构,它利用位数组很简洁地表示一个集合,并能判断一个元素是否属于这个集合。Bloom Filter的这种高效是有一定代价的:在判断一个元素是否属于某个集合时,有可能会把不属于这个集合的元素误认为属于这个集合(false positive)。因此,Bloom Filter不适合那些“零错误”的应用场合。而 ...
数据仓库建设中的数据建模方法
最近也在构建数据仓库,觉得以下文章不错,转一下!
所谓水无定势,兵无常法。不同的行业,有不同行业的特点,因此,从业务角度看,其相应的数据模型是千差万别的。目前业界较为主流的是数据仓库厂商主要是 IBM 和 NCR,这两家公司的除了能够提供较为强大的数据仓库平台之外,也有各自的针对某个行业的数据模型。
例如,在银行业,IBM 有自己的 BDWM(Banking ...
Greenplum与DB2 DPF对比
1、总体架构说明:
(1)Greenplum:
MPP架构(Massively Parallel Processing):大规模并行处理系统。
整个系统是一组独立的数据库阵列。每个数据库相互独立,有独立的数据存储,日志,索引等等。
集群中HOST分为两种,一个是MASTER HOST,一个是SEGMENT HOST。MASTER HOST
不存放数据,只存放全局系统目录 ...